— vrijdag 16 april 2021, 10:43 | 0 reacties, praat mee

ADAM en Maura, de nieuwe robotcollega’s op de redactie

© Truus van Gog

Net als bij de komst van het internet staan we opnieuw aan de vooravond van een technologische revolutie. Kunstmatige intelligentie gaat de komende jaren de samenleving én de journalistiek radicaal veranderen. In deel 2 van een 4-delige serie: de robot­redacteur.

‘Ik denk dat de journalistiek veel gaat veranderen. AI (Artificiële Intelligentie, red.) kan journalisten helpen hun werk beter te doen. Het zal in staat zijn om saaie werkzaamheden, zoals data-analyse, uit te voeren. In de toekomst zullen journalisten zich kunnen concentreren op de meer creatieve delen van hun baan.’ Dat is het antwoord op de vraag: Hoe gaat kunstmatige intelligentie de journalistiek veranderen? Alleen komt het antwoord niet van een menselijke expert, maar van taalgenerator GPT-3.

Het systeem van de Amerikaanse organisatie OpenAI is getraind op miljarden webpagina’s en kan daardoor het menselijk schrijven moeiteloos imiteren. GPT-3 kreeg veel aandacht toen de Britse krant The Guardian een opiniestuk publiceerde dat was gegenereerd met deze technologie. In zeventien alinea’s legt het algoritme knap uit waarom mensen de komst van kunstmatige intelligentie niet moeten vrezen. Het stuk kwam de krant ook op kritiek te staan: GPT-3 had acht varianten van het artikel gegenereerd, waar de journalisten de beste onderdelen uit hebben geput.

Omdat GPT-3 nog niet vrij beschikbaar is, had de krant hulp nodig van een techneut met goede connecties. Liam Porr is student aan de Berkeley universiteit in Californië en is al langer actief in de wereld van machine learning. ‘Dat project is behoorlijk ontploft’, lacht Porr vanuit zijn studentenkamer. De telefoon stond roodgloeiend.

Ook vanuit OpenAI die wilde weten hoe hij toegang had gekregen tot het algoritme. Porr vertelt dat het kinderlijk eenvoudig was om het stuk te genereren. ‘We hebben een paar keer gebeld over de instructies die we moesten meegeven, anders weet GPT-3 niet waar het over moet schrijven. Verder was het een kwestie van een paar regels code en een beetje stoeien met de instellingen.’ Porr zet gelijk een kanttekening bij de mogelijkheden. ‘Het taalalgoritme heeft geen begrip van wat het schrijft. Het gokt als het ware het volgende woord in een zin. Dat ziet er op het eerste oog leuk uit, maar qua feiten zie je al snel de beperkingen.’

Ook hoogleraar Emiel Krahmer die zich vanuit de Tilburg Universiteit specialiseert in computerlinguïstiek, waarschuwt voor de beperkingen: ‘De tekst die uit GPT-3 komt, heeft geen enkele link met de werkelijkheid en is daarmee ongeschikt voor journalistieke doeleinden.’ Het artikel in The Guardian noemt hij teleurstellend: ‘De titel is bedacht door een mens, het plot is bedacht door een mens en de inhoud is gekozen door een mens. Het is niets meer dan een woordenbrij, maar het is wel fascinerend.’

Voor de journalistiek ziet Krahmer meer heil in de stapsgewijze opkomst van het doorvertalen van feitelijke data naar een geschreven artikel: ‘Dat kan gaan over weersvoorspellingen, beurskoersen of voetbaluitslagen. Je neemt dan een aantal gegeven feiten als uitgangspunt en kleed dat aan met leesbare taal. Het is voor een redactie ondoenlijk om van elke voetbalwedstrijd op zaterdagmiddag een artikel te schrijven, terwijl lokale fans daar dolblij mee zouden zijn. Geautomatiseerde berichtgeving is dan een uitkomst: die pakt een aantal datapunten en schrijft daaromheen een leesbaar artikel. Het volume van het aantal stukken zal daarmee enorm omhoog gaan, want je genereert artikelen over gebeurtenissen op wijkniveau in een handomdraai.’

ADAM
Een van de redacties die hier volop mee experimenteert is RTL Nieuws. Robotredacteur ADAM (Automatische Data Artikel Machine) draait alweer twee jaar mee en werd zelfs genomineerd voor een journalistieke Tegel. ‘ADAM vertaalt grote datasets door naar artikelen op lokaal niveau’, vertelt datajournalist Jasper Bunskoek. Bunskoek gebruikte het systeem onder meer om de verkeersveiligheid voor elke gemeente inzichtelijk te maken, artikelen te maken over de prestaties van scholen en recentelijk voor lokale verkiezingsuitslagen. ‘Onze redactierobot schrijft zodra een uitslag bekend is, binnen één minuut een artikel op maat voor elke gemeente. Met grafieken, kaarten en duiding.’

Datajournalist Jasper Bunskoek van RTL Nieuws. Tekst loopt verder onder de foto.

ADAM gaat verder dan een simpel artikeltemplate waar lokale data in worden geplakt. ‘Alleen al voor het genereren van een goede, pakkende, maar ook kloppende kop, kan het rekening houden met diverse variabelen. Zo kan het voor gemeente A uniek zijn dat een bepaalde partij een grote overwinning boekt, terwijl het voor gemeente B belangrijk is dat de opkomst dat jaar abnormaal hoog is. Als redactie geven wij die scenario’s mee en op basis van de lokale situatie kiest ADAM de juiste kop.’

Bij de introductie was niet iedereen even enthousiast. Sommigen waren bang voor de gevolgen voor hun baan. Anderen vonden dat een robot nooit het werk van een journalist kon overnemen en dachten dat de lokale journalistiek hierdoor nog verder zou afkalven. ‘In de praktijk blijkt niemand te zijn vervangen en de lokale journalistiek heeft vooral een duwtje in de rug gekregen, zo vertelt Bunskoek. ‘Lokale journalisten hebben vaak geen tijd om te grasduinen in gigantische datasets over het aantal verkeersongelukken. Wij maken die data toegankelijk, waarna een lokale journalist naar de wethouder kan gaan met vragen over de verkeersveiligheid. Als je kijkt naar het aantal vragen in gemeenteraden die zijn gesteld naar aanleiding van de berichtgeving van ADAM, ben ik daar best trots op.’

Moderatiebot
Op de reactie van NU.nl hebben ze sinds anderhalf jaar moderatierobot Maura (‘Machine voor automatisch reacties afhandelen’). ‘Zonder Maura had NUjij in deze vorm niet kunnen bestaan’, zo blikt adjunct-hoofdredacteur Colin van Hoek terug. Het aantal reacties op het platform steeg – mede door de coronacrisis – van circa 150.000 tot bijna 600.000 per maand. ‘Maura is steeds beter geworden in het bepalen of een reactie geschikt is voor NU.nl of dat het wordt afgewezen. Het kan nu in 80 procent van de gevallen correct voorspellen, de overige 20 procent wordt nog steeds handmatig nagekeken. Die laatste 20 procent is heel moeilijk te automatiseren.

Adjunct-hoofdredacteur Colin van Hoek van NU.nl. Tekst loopt verder onder de foto.

De moderatiebot werkt onder meer met een zwarte lijst van woorden die per definitie worden afgekeurd, maar heeft ook een grijze lijst waarbij het gaat om de context. Heeft iemand het over kanker, dan kan dat gaan om een scheldwoord, maar ook om de ziekte. We kunnen daarom per artikel aangeven waar Maura niet wordt gebruikt en waarbij we handmatig de reacties screenen.’

Ook in het geval van Maura heeft de technologie niet gezorgd voor minder werk voor journalisten, maar vooral dat het werk meer betekenis heeft gekregen. ‘We hadden voorheen dagelijks vier diensten met mensen die reacties moesten goed- of afkeuren. Dat is behoorlijk saai werk. Die tijd kan nu worden ingezet om in gesprek te gaan met onze lezers. Daardoor weten we als redactie beter wat er speelt en krijgen we dikwijls artikelideeën uit de reacties die mensen plaatsen. En je ziet ook dat lezers die reageren vaker terugkomen en langer op het platform blijven.’

Aanbevelingsalgoritme
NU.nl is sinds vorig jaar onderdeel van DPG Media waar ze een aparte afdeling hebben die de merken middels kunstmatige intelligentie moet ondersteunen. Anne Schuth is machine learning architect die zich specialiseert in personalisatie middels aanbevelingssystemen. Schuth verdiende zijn strepen bij Blendle en Google alvorens hij zich stortte op kranten als de Volkskrant, het AD, Trouw en Het Parool. Het is logisch dat uitgevers investeren in personalisatie, stelt Schuth, omdat de concurrentie vanuit big tech niet stil zit: ‘Je strijdt uiteindelijk om de aandacht van je gebruiker en daarom wil je zo relevant mogelijk zijn.’

Bij het doel om de gebruiker artikelen te tonen die voor hem of haar interessant zijn, houdt het team van Schuth de journalistieke waarde altijd als belangrijkste uitgangspunt: ‘Dat betekent dat we de gebruiker goed moeten informeren, ook als dat in strijd is met de relevantie. Iemand kan geen fan zijn van Donald Trump en het liefst niets over hem willen lezen, maar als een artikel volgens de redactie belangrijk is voor de algemene kennis, moet deze toch bovenaan staan in het nieuwsoverzicht. De redactie moet te allen tijde invloed hebben op het algoritme. Echter: wanneer iemand zich totaal niet interesseert voor sport, mag de uitslag van een willekeurige wedstrijd best worden weg gefilterd. Belangrijk is dat je een filterbubbel voorkomt. Daar heeft niemand baat bij.’

Hoewel er ook aanbevelingsalgoritmes te koop zijn, zou Schuth kleinere merken afraden deze zonder diepgaand onderzoek te implementeren: ‘Als je niet weet hoe het algoritme tot aanbevelingen komt en je als redactie geen invloed hebt op de nieuwskeuze, geef je als het ware je journalistieke keuzes uit handen. Dat moet je voorkomen.’ In de ontwikkeling van de technologie spreekt het team van Schuth geregeld met de verschillende redacties binnen het uitgeefconcern. ‘We vallen onder oud-Volkskrant-hoofdredacteur Philippe Remarque. We zijn dus niet een stel IT’ers die stilletjes iets aan het bouwen zijn op een kamertje achteraf.’ 

Audio
Naast podcasts en Clubhouse is ook het ingesproken artikel gemeengoed geworden bij online longreads. Stem­expert Jente Kater van voicebooking.com weet hoe lastig het is om een computer het vermogen van de menselijke stem te laten evenaren. Zijn bedrijf ontwikkelde een voice-over generator die gratis te gebruiken is voor producties met een klein budget. Toch zou hij het niet gebruiken voor journalistieke verhalen: ‘Het eerste dat je moet beseffen is dat schrijftaal heel anders is dan spreektaal. Als je een artikel dus letterlijk woord voor woord zou voorlezen, is het zelfs met de beste stem lastig om je publiek lang te blijven boeien. Daarnaast missen computerstemmen begrip van de inhoud en weten niet waar de nadruk of nuance moet liggen. De techniek zit misschien al op 80 procent van wat daarvoor nodig is, maar die laatste 20 procent te behalen, gaat misschien nog wel tien of twintig jaar duren.’

Algoritme redacteur
Machine learning en kunstmatige intelligentie kunnen ook individuele journalisten helpen om beter en efficiënter te werken, zo stelt Laurens Vreekamp. Hoewel Vreekamp geen opleiding in de journalistiek heeft, werkte hij lange tijd voor KRO-NRCV en Google News Lab. Hij is oprichter van het platform Future Journalism Today en geeft bij de NVJ cursussen hoe journalisten gebruik kunnen maken van bestaande AI-tools en algoritmes kunnen schrijven om tot betere inzichten achter datasets te komen.

‘Ik ben een soort rij-instructeur die je op weg helpt. Gelukkig hoef je daarvoor geen wiskundige te zijn of afgestudeerd in de statistiek. Google heeft bijvoorbeeld de tool pinpoint die in een handomdraai woorden, bedrijven of namen weet te vinden in miljoenen e-mails, pdf’s of zelfs handgeschreven brieven. Geweldig handig als je bijvoorbeeld bezig bent met een wob-verzoek. Microsoft heeft een product gemaakt Lobe.ai waarbij je zelf een systeem kunt trainen om objecten te herkennen op foto’s.

Weer een ander systeem kan je leren om het sentiment in Twitter-berichten te herkennen. Zo kan je bijvoorbeeld achterhalen wat de opinie is over bepaalde politici. Ik verwacht dat het kunnen werken met dergelijke middelen binnen een paar jaar gemeengoed is op menig redactie. Niet iedereen hoeft ermee te kunnen werken, maar misschien krijg je wel een rol ‘algorithmic editor’ of ‘ai journalist’, net zoals ‘datajournalist’ inmiddels heel gebruikelijk is.’

China
Veel techneuten kijken als het gaat over AI naar China. Niet alleen stelt het land jaarlijks vele miljarden beschikbaar voor onderzoek, ook bulkt het van data. De staatsomroep pronkte met het nieuws dat ze een van hun menselijke presentatoren hadden gedigitaliseerd – vanaf dat moment zou ook een virtuele avatar met de gelijkenis van de presentator het nieuws kunnen brengen.

Volgens NOS-correspondent Sjoerd den Daas, die ruim vijf jaar woont en werkt in Beijing, valt het in de praktijk mee: ‘China is een heel duaal land als het aankomt op vernieuwing. Aan de ene kant heb je hier technologische wereldspelers, aan de andere kant moeten interviewverzoeken gefaxt worden naar de overheid en ziet het staatsjournaal eruit alsof het een uitzending uit de jaren 70 is. Virtuele nieuwslezers heb ik nog niet kunnen ontdekken. Op journalistiek vlak is nieuwsplatform Toutiao in de praktijk het meest succesvol. Het is een nieuwsaggregator die is ontwikkeld door Bytedance, het bedrijf achter het sociale medium TikTok. Met machine learning zorgen ze ervoor dat de artikelen in je tijdlijn je blijven boeien – al zorgen ze er ook voor dat bepaalde berichten, bijvoorbeeld over de staatspartij, altijd bovenaan staan.’

De serie artikelen over kunstmatige intelligentie wordt mede mogelijk gemaakt door het Lucas Ooms Fonds.

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Dolf Rogmans
Hoofdredacteur

Marjolein Slats
Adjunct-hoofdredacteur

Linda Nab
Redacteur

Lars Pasveer
Redacteur

Trudy Brandenburg-Van de Ven
Redacteur

Anneke de Bruin
Vormgever

Marc Willemsen
Webontwikkelaar

Vacatures & advertenties

redactie@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.