mgm nvj maart

— woensdag 29 november 2017, 15:30 | 0 reacties, praat mee

Van spraak naar tekst: vijf transcriptie-apps getest

Van spraak naar tekst: vijf transcriptie-apps getest
Pexels

UPDATE Interviews opnemen betekent in de regel bandjes uitwerken. En dat kan al snel aardig wat tijd in beslag nemen. En waar er inmiddels aardig wat apps zijn die Engelse tekst kunnen omzetten in het geschreven woord, is het Nederlands op dat vlak minder goed bedeeld. Maar zulke apps zijn er wel. Villamedia legt er vijf langs de lat. Laatste wijziging: 4 juli 2019, 08:52

1. Trint (browser)
Het van origine Engelstalige Trint werd in 2014 opgericht door voormalig ABC-journalist Jeffrey Kofman. Anders dan diensten van Microsoft en Google – die zich vooral op korte teksten focussen – gebruikt Trint kunstmatige intelligentie om lange audiobestanden om te zetten van gesproken naar geschreven woord. En dat doet hij redelijk aardig, blijkt uit drie tests die Villamedia met de dienst uitvoerde.

Het omzetten van audio naar tekst gaat vrij makkelijk. Als gebruiker upload je een audiobestand vanaf je computer of een online bron als Dropbox, Google Drive, Evernote en andere clouddiensten. Vervolgens kies je de gewenste taal. Naast Engels en Nederlands (her)kent Trint ook Duits, Fins, Frans, Hongaars, Italiaans, Pools, Portugees, Roemeens, Russische en Zweeds. Het transcriberen duurt vervolgens een paar minuten. Klik je op de naam van je audiobestand, dan verschijnt een tekstveld met het resultaat.

Zoals hierboven gezegd: dat resultaat valt op het eerste gezicht niet tegen. Vooral de test waarbij we een audioclip van De Wereld Draait Door door Trint halen levert een aardige transcriptie op, wat bijzonder is aangezien de Nederlandse versie van de dienst zich nog in zijn testfase bevindt. Trint pakt natuurlijk niet alles mee, maar levert een leesbaar geheel op dat je kunt bijschaven terwijl je de audio terugluistert. Ook handig: Trint laat je delen van de tekst markeren en laat je de tekst transporteren als doc- of html-bestand. Daarnaast doet de dienst een poging aan te geven wanneer er een andere spreker aan het woord is, al werkt dat niet zo goed.

Opvallend genoeg heeft de Nederlandse variant van Trint het wat moeilijker met Engelse termen. De kwaliteit van de transcriptie is echter (logischerwijs) heel erg afhankelijk van de kwaliteit van de audio. Bij een interview met drie sprekers én veel achtergrondruis leest de transcriptie als een uit het Chinees naar het Nederlandse vertaalde tekst.

Kosten: Vanaf 13 euro per uur. Gratis proefversie (max. 30 minuten) beschikbaar.

Oordeel: Bij audiobestanden die zijn opgenomen in een stille ruimte met duidelijke sprekers levert Trint een redelijk goede transcriptie. Hoe rumoeriger de omgeving, hoe slechter het resultaat. En dat resultaat holt redelijk snel achteruit. ***
Meer informatie: Trint.com.

2. AmberScript (browser)
Het Nederlandse AmberScript lijkt als twee druppels op Trint (zie hierboven), al is de interface mooier. De Amsterdamse start-up zet machine-learning – software die zichzelf leert verbeteren – in om zijn systeem steeds beter te maken in het transcriberen. Om dat te realiseren zet AmberScript datascience-specialisten in, die de transcriptiedienst continu moeten verbeteren.

Ook hier geldt dat het omzetten van audio naar tekst een eitje is. Via de lichtelijk verstopte Upload-knop selecteer je een audiobestand op je harde schijf. Dat kan een mp3-bestand zijn, maar ook een wav, mp4, m4a (het bestandsformaat waarin de dictafoon van je iPhone standaard opneemt), aac of wma. Na de selectie kies je de taal (Nederlands, Engels of Duits) en gaat AmberScript aan de slag. Wat het aantal talen en bestandslocaties betreft zijn er dus wat minder opties dan bij Trint, maar waar het om gaat is natuurlijk het resultaat.

En dat resultaat, dat is om blij van te worden. AmberScript weet over het algemeen een stuk beter dan Trint wat hij met het Nederlands aanmoet. Zelfs bij de test met meerdere zachtjes pratende sprekers zet AmberScript nog relatief veel spraak goed om in tekst. Natuurlijk is het niet perfect. Hoewel AmberScript de rap pratende Matthijs van Nieuwkerk prima bijhoudt, gaat er bij sommige namen en wat interpunctie betreft nog wel wat mis. En de functie die aangeeft wanneer er een andere spreker aan het woord is (inzichtelijk gemaakt met pijltjes) moet nog veel bijleren.

Net als Trint biedt AmberScript gebruikers de mogelijkheid tekst te corrigeren terwijl de audio op de achtergrond speelt. Exporteren kan naar XML en Word, en met de vervangfunctie zijn stelselmatig verkeerd getranscribeerde woorden in één keer te vervangen door de juiste woorden. Tekst markeren is ook een optie, net als het versnellen of vertragen van de audio, wat het corrigeren makkelijker maakt.

Kosten: Vanaf 13 euro per uur. Gratis proefversie (max. 30 minuten) beschikbaar.

Oordeel: Al met al is AmberScript een fijne dienst, die razendsnel lange interviews in basis voor je kan uitwerken. Hoewel de transcriptie niet perfect is (ook hier geldt: hoe slechter de audio, hoe slechter het resultaat), levert AmberScript in de meeste gevallen een flinke tijdsbesparing op. ****
Meer informatie: AmberScript.nl.

3. Actieve Stem (iOS)
De transcriptie-app Actieve Stem belooft live te luisteren naar wat er gezegd wordt en de gesproken tekst vervolgens in een mum van tijd om te zetten naar het geschreven woord. Dat doet hij in een keur aan talen, waar Nederlands er een van is. De app is aan de voorkant niet meer dan een grote knop die je indrukt om je audio op te nemen. Vervolgens worden je zinnen in de cloud omgezet naar gesproken woorden.

Dat omzetten doet Actieve Stem razendsnel (sneller dan Trint en AmberScript). Nadat je op de stopknop hebt gedrukt krijg je binnen een paar seconden het resultaat te zien. Dat resultaat is op het eerste gezicht niet mis, mits je duidelijk spreekt en niet te snel. Actieve Stem kan uitgeschreven tekst vervolgens hardop teruglezen, vertalen en versturen via WhatsApp, E-mail, sms en Twitter.

Hoewel een eerste test waarbij recht in de microfoon gesproken werd hoopvol leek, valt Actieve Stem redelijk snel door de mand. Met een interview met zacht pratende personen kan hij niet uit de voeten en ook het kletstempo van Matthijs van Nieuwkerk ligt te hoog voor ‘m. Actieve Stem maakt geen onderscheid tussen verschillende stemmen en vergeet vaak wat interpunctie is.

Kosten: Eenmalig 3,49 euro voor aanschaf in de Apple App Store.

Oordeel: Actieve Stem doet wat hij moet doen, mits je de telefoon aan je mond houdt tijdens het spreken. Dat kan nuttig zijn – bijvoorbeeld als vervanger voor je bandrecorder – maar je gokt er niet op. Hij lijkt daarnaast soms eerdere stukken van een gesprek te vergeten. Vooral geschikt als dictafoon dus. *
Meer informatie: tinyurl.com/actievestem

4. Happy Scribe (browser)
Met tientallen talen om uit te kiezen (waaronder Nederlands) en een prijs van slechts 9 euro per uur audio klinkt Happy Scribe bijna te mooi om waar te zijn. De dienst is in ieder geval een van de goedkoopste in dit overzicht. Het feit dat onder andere USA Today, Forbes en de Wall Street Journal er gebruik van maken zorgt voor hoge verwachtingen.

En die maakt Happy Scribe deels waar. Net als de twee eerste diensten in deze lijst koppelt Happy Scribe je audio aan de uitgewerkte tekst, zodat je je gesprek kunt terugluisteren en direct eventuele fouten kunt herstellen. De dienst is uitgerust met enkele sneltoetsen, waarmee je de audio stil zet of vooruit- of terugspoelt, wat het bewerken aanzienlijk sneller kan maken. Happy Scribe accepteert daarnaast ook videobestanden, waar de dienst de audio uit destilleert.

Het resultaat van onze tests is wat kwaliteit betreft vergelijkbaar met Trint en dus net iets minder goed dan AmberScript. Happy Scribe heeft wat moeite met Engelse termen en gaat bij veel ruis op de achtergrond vaker de mist in dan Trint. Daarnaast geeft de dienst ook geen individuele sprekers aan (wat bij de andere diensten toch misgaat) en doet ook niet echt aan interpunctie. Het transcriberen duurt ongeveer net zo lang als de duur van je audio. Dat is vergeleken met de eerste twee diensten in dit overzicht lang, maar nog altijd een stuk sneller dan handwerk. Net als veel andere diensten biedt Happy Scribe je ook een gratis testversie.

Kosten: Vanaf 9 euro per uur als je in één keer tien uur per maand afneemt. Een los uur kost 12 uur. Gratis proefversie beschikbaar.

Oordeel: Wat prijs betreft is Happy Scribe top. Maar op kwaliteit laat Happy Scribe net wat meer steken vallen dan sommige concurrenten. Als je daarmee kunt leven – en dus accepteert dat het bewerken van de transcriptie je wat meer tijd kost – is dit de dienst voor jou. Behalve als je je interview hebt afgenomen in een rumoerig café. ***
Meer informatie: HappyScribe.co

5. Spext (browser)
Lekker basic. Zo laat de interface van Spext zich het best beschrijven. De webdienst doet niet aan poespas en liflafjes. Bestand uploaden, wachten en je transcriptie ontvangen. Dat uploaden kan alleen vanaf je harde schijf en vanaf Dropbox. Een link invoeren naar een geluidsbestand op het web is ook mogelijk. Bestanden verschijnen vervolgens in een wachtlijst, waarna ze automatisch getranscribeerd worden.

Vergeleken met de andere diensten in deze lijst duurt dat transcriberen ook wel even. Spext is van de vijf hier besproken diensten veruit de traagste. Wat wel fijn is, is dat je de dienst eerst kunt testen voordat je een abonnement afsluit. In de testversie mag je vier bestanden van elk maximaal vier minuten laten transcriberen. Bij bestanden die meer minuten in beslag nemen worden in de testversie alleen de eerste vier minuten getranscribeerd.

Het resultaat van die transcriptie is exact hetzelfde als bij Happy Scribe, blijkt uit onze tests. Dat doet vermoeden dat beide diensten dezelfde achterliggende software gebruiken. Waar Spext een beetje de mist ingaat is de interfase. Tekst en audio worden ook hier aan elkaar gekoppeld, maar het afspelen van de audio gaat niet altijd even soepel. Om die laatste reden waarderen we Spext net wat lager dan anderen.

Kosten: 0,25 dollar per minuut of 13,99 dollar per maand, op basis van 120 minuten (of 23,99 dollar voor 240 minuten). Ongebruikte minuten verhuizen vanzelf mee naar de volgende maand.

Oordeel: Wil je zien wat het goedkopere Happy Scribe voor je kan betekenen maar heb je geen zin om de knip te trekken voor een test, dan biedt Spext uitkomst. De dienst zelf werkt redelijk (al heb je er bij interviews die in drukke ruimtes zijn afgenomen niet veel aan), maar de interfase laat steken liggen. **
Meer informatie: Spext.co.

UPDATE: Op 29 augustus 2018 testte Villamedia nóg een transcriptie-dienst: Temi. De bespreking van die dienst is hier te vinden.

Bekijk meer van

Tips & Trucs

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Uitgever

Dolf Rogmans

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Factuurgegevens

Villamedia Uitgeverij BV
Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Chris Helt, hoofdredacteur

Marjolein Slats, adjunct-hoofdredacteur

Linda Nab, redacteur

Lars Pasveer, redacteur

Trudy Brandenburg-Van de Ven, redacteur

Rutger de Quay, redacteur

Nick Kivits, redacteur

Sales

Sofia van Wijk

Emiel Smit

Teddy van der Laan

Webbeheer

Marc Willemsen

Vacatures & advertenties

vacatures@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.