— donderdag 22 februari 2018, 14:00 | 2 reacties, praat mee

Recensie: Je computer aansturen met spraak en transcriberen met Dragon NaturallySpeaking

Beeld: Pixabay

Nuance Communications is al jaren heer en meester op het gebied van spraaktechnologie. Met Dragon NaturallySpeaking Premium 13 belooft het Amerikaanse bedrijf gesproken tekst om te zetten in het geschreven woord - ook in het Nederlands. Maar heb je daar als journalist wat aan? Villamedia deed de test.

“Dit is mijn eerste test met Dragon.” Terwijl ik de woorden oplepel verschijnen ze met een kleine vertraging op mijn scherm, alsof een digitale secretaresse mijn hersenspinsels voor me uitschrijft. Alleen het woord ‘Dragon’ gaat ironisch gezien mis. “Misschien gaat het beter als ik duidelijker articuleer”, zeg ik (overdreven articulerend). “Nee, niet ‘particulier’, maar ‘articuleer’.” Zucht. “Verwijder laatste zes woorden.”

Nuance Communications is een van de grootste spelers ter wereld wat spraaktechnologie betreft. Tot een paar jaar geleden was zelfs Apple’s spraakassistent Siri op de techniek van het Amerikaanse bedrijf gebaseerd. Met Dragon NaturallySpeaking Premium 13 – de software die ik voor deze bespreking langs de lat leg – belooft Nuance een totaaloplossing die gesproken tekst omzet in geschreven woorden én die je je computer laat aansturen met je stem. In theorie handig voor journalisten, die de hele dag met woorden werken.

Wee-wee-wee-punt-google-punt-en-el
Je computer aansturen met je stem terwíjl je een artikel aan het dicteren bent, lijkt een welkom kunstje. Wie net lekker tekst aan het oplezen is, wil niet hoeven stoppen om naar zijn muis, toetsenbord of touchpad te grijpen. Maar in een wereld waarin we steeds meer apparaten kunnen commanderen met onze stem – televisies, speakers en zelfs sommige koelkasten zijn tegenwoordig uitgerust met spraakassistenten – valt vooral op hoe basaal die laatste feature is in Dragon.

Waar spraakassistenten als Amazons Alexa en Google Assistant vraaggestuurd zijn (“Alexa, wat voor weer wordt het morgen?”), laat Dragon zich anno 2018 nog aansturen met rechtstreekse commando’s. Dat voelt een beetje ouderwets. Even snel wat informatie opzoeken tijdens het dicteren, vereist een lange reeks commando’s. “Open Browser. Ga naar adresbalk. Wee-wee-wee-punt-google-punt-en-nl. Druk Enter. Klik op zoekbalk. Koffietentjes in Haarlem. Druk Enter.” Het alternatieve commando “Zoek op internet naar koffietentjes in Haarlem” werkt gelukkig vlotter, maar haalt het nog altijd niet bij de slimme speakers die in opmars zijn (al spreken die nog geen Nederlands).

Dragon kent talloze commando’s (PDF) die tot doel hebben je sneller te laten werken. Wie niet veroordeeld wil zijn tot de ingebouwde help-functie (“Wat kan ik zeggen?”), doet er goed een paar dagen flink te blokken. Na een week testen kende ik het gros van de veelgebruikte commando’s wel uit mijn hoofd. Toch merkte ik dat ik regelmatig zuchtend naar mijn toetsenbord en muis greep. Een beetje als een ongeduldige vader die het niet kan aanzien dat zijn zoon twee Duplo-blokjes niet op elkaar krijgt en besluit het zelf maar te gaan doen.

Ar-ti-cu-le-ren
Bij spraaktechnologie draait alles om duidelijk spreken en goede audio. Wie met Dragon aan de slag gaat, wordt daardoor al snel geconfronteerd met zijn eigen slechte articulatie. Tijdens de eerste dagen van mijn test had Dragon regelmatig moeite me te verstaan. Omdat ik me heb laten vertellen dat ik soms wat mompel, ging ik de dagen erna goed letten op mijn articulatie. Pas toen ging het beter. Toch ging het oplezen van wat ik wilde vertellen nog altijd trager dan zelf typen. Niet dat de software traag is (hij hield me goed bij), maar vooral omdat verbeteringen aanbrengen gewoon een stuk sneller gaat op een toetsenbord.

Naast het meeschrijven met wat er gezegd wordt, belooft Dragon NaturallySpeaking Premium 13 ook opgenomen gesprekken (lees: je interviews) te transcriberen. Dat doet Dragon met wav-, mp3-, wma-, dss-, ds2 en m4a-bestanden. Voor journalisten een welkome tijdsbesparing, mits het goed gebeurt. Dat daar best redelijke resultaten mee te behalen zijn bleek uit een eerdere test die we afgelopen december deden met vijf verschillende transcriptie-apps.

Missouri Bosch en Duin?
Dragon kreeg, net als die besproken apps, drie testbestanden te verstouwen: de met een professionele microfoon ingesproken audio van een video uit onze innovatienieuwsbrief, een audioclip van een rap pratende Matthijs van Nieuwkerk, en een interview tussen drie verschillende partijen.

Anders dan bij bijvoorbeeld AmberScript waren de resultaten met Dragon niet al te best. Het resultaat van de transcriptie zelf viel bij alle uitgevoerde tests tegen. Bij een laatste extra test verhaspelde Dragon een gesprek over ‘het nieuwe NU.nl’ in een transcriptie over voorwaarden, Missouri Bosch en Duin (?!) en… koeien. Terwijl geen van die woorden in het audiobestand terug te vinden is.

De transcriptie-test bleek overigens niet alleen maar kommer en kwel. Het audiobestand waarin Matthijs van Nieuwkerk een vlot interview met Arjen Lubach had, werd redelijk goed omgezet naar tekst (alleen niet zo goed als door AmberScript, HappyScribe en Trint). Daarnaast is de software van Nuance net wat sneller dan de apps uit onze eerste test en is ook het gebruik van interpunctie - iets wat bij de eerder geteste apps vaak niet werd ondersteund -benijdenswaardig. De vraag is alleen wat je daar aan hebt als de transcriptie zélf niet is om over naar huis te schrijven.

Oordeel
Er is ongetwijfeld een markt voor Nuance’s Dragon NaturallySpeaking Premium 13. Maar de journalistiek is niet die markt. De journalistiek draait veelal om snelheid en interviews zijn in de praktijk meestal niet gesproken in een tempo en met de articulatie die Dragon van zijn sprekers verwacht. Daardoor is het prijskaartje van bijna 170 euro nauwelijks goed te praten. **

Dragon NaturallySpeaking Premium 13
Systeemeisen: Minimaal 2GB vrije ruimte, geluidskaart voor 16-bits opnames, Windows 7, 8 of 8.1 (Nederlands wordt in de Mac-versie nog niet ondersteund)
Te koop als: Disc en digitale download
Prijs: 169 euro (Goedkopere Home-versie beschikbaar voor 99 euro)
Meer informatie: Nuance.com

Praat mee

2 reacties

G.C.J.M. Vierbergen, 28 februari 2018, 09:49

Ondanks dat het artikel uitgebreid is, is de informatie zeer oud. Premium 13 is bijna EOL. Momenteel werken we met Dragon Professional Individual 15, de opvolger van Dragon Premium 13. Dus de systeemeisen etc. zijn niet toereikend. Godie Vierbergen

Nick Kivits, 21 maart 2018, 13:43

Bedankt voor je reactie Godie. De recensie betreft Dragon Premium en niet Dragon Professional Individual. Bij Premium is versie 13 de nieuwste.

Met vriendelijke groet,

Nick Kivits
Redactie Villamedia

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl
020-30 39 750

Redactie (tips?)

Dolf Rogmans
Hoofdredacteur, 020-30 39 751

Marjolein Slats
Adjunct-hoofdredacteur, 020-30 39 752

Linda Nab
Redacteur, 020-30 39 758

Lars Pasveer
Redacteur, 020-30 39 755

Trudy Brandenburg-Van de Ven
Redacteur, 020-30 39 757

Anneke de Bruin
Vormgever, 020-30 39 753

Marc Willemsen
Webontwikkelaar, 020-30 39 754

Vacatures & advertenties

Karen Bais
020-30 39 756

Sofia van Wijk
020-30 39 711

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.