mgm nvj maart

— zaterdag 16 april 2022, 09:15 | 0 reacties, praat mee

Waarom je als journalist algoritmisch moet kunnen denken

Waarom je als journalist algoritmisch moet kunnen denken
Marlies van der Wees en Laurens Vreekamp - © Van Duuren Media

Het regent. Alweer. Wanneer we op pad zijn om een data scientist of machine learning engineer te interviewen is het steeds vies weer. Of dat tekenend is voor de relatie tussen technologie en journalistiek mag je zelf bepalen. Ook op deze donkere donderdagmiddag in februari is het niet anders. Het gesprek is dat wel: vandaag geen interview over AI (Artificial Intelligence) maar met een AI. Laatste wijziging: 19 april 2022, 08:23

Dit artikel wordt met je gedeeld door NVJ-lid Marjolein Slats. Ook lid worden?

Dat lichten we even toe. Kunstmatige intelligentie (AI) is het vakgebied dat zich bezighoudt met het ontwikkelen van intelligentie in computers. AI-toepassingen variëren van aanbevelingen voor artikelen op nieuwssites en slimme assistenten tot zelfrijdende auto’s.

We spreken vandaag met een kunstmatige intelligente gesprekspartner, voluit ‘GPT-3-text-davinci-001’, over de werking en waarde van algoritmes. Want onafhankelijk van elkaar vertelden verschillende experts ons tijdens het schrijven van ons boek ‘The Art of AI - een praktische introductie in machine learning’ dat journalisten ‘algoritmisch moeten leren denken’. Wat dat inhoudt willen we ook ‘horen’ van de computer zelf. 

We gebruiken gratis toegankelijke software van OpenAI, een onderzoeks­laboratorium voor kunstmatige intelligentie. Als we in onze webbrowser in een vrij tekstveld ‘hallo’ typen en vervolgens onze eerste vraag formuleren, valt op dat deze AI geen beleefdheden verlangt, en al helemaal geen gekeuvel over koetjes of kalfjes (Wil je zelf ook eens spreken met GPT-3-text-davinci-001, klik dan hier).

De eerste vraag die we stellen is: wat zijn de basisprincipes van algoritmes?
AI: ‘Iedereen kent het algoritme van de rekenmachine. Je typt in: 2 + 2 en er verschijnt 4 op het scherm. Dat is het basisprincipe: je geeft een bepaalde instructie in en de computer voert die uit. Dat principe is ook van toepassing op veel andere dingen: bijvoorbeeld het versturen van een e-mail. Je typt je bericht en de computer zorgt ervoor dat het verstuurd wordt. Of als je op internet surft: de computer leest alle informatie van de website en toont die vervolgens op je scherm. Basisprincipes van algoritmes kunnen onder andere zijn: herhalen, vergelijken, sorteren en selecteren.’

Marlies van der Wees is Machine Learning Engineer bij DPG Media en werkt aan personalisatie van nieuws. Ze legt de werking van algoritmes uit met een voorbeeld. ‘Heb je thuis een boekenkast? Grote kans dat de boeken daarin niet op volstrekt willekeurig plekken staan. Je kunt op meerdere manieren orde aanbrengen, bijvoorbeeld door boeken alfabetisch te sorteren of op kleur. Welke manier je kiest, is aan jou. Je doel bepaalt hoe je te werk gaat. Een stappenplan (zie onderaan dit artikel) om sorteertaken uit te voeren kun je een algoritme noemen.’

Algoritmes, AI en Machine Learning
Van der Wees: ‘Een programmeur kan deze algoritmen met wat simpele regels invoeren en de computer kan de taak keer op keer goed uitvoeren.’ Er is hiervoor geen vorm van kunstmatige intelligentie nodig of een veel toegepast onderdeel daarvan: machine learning (ML). Dit is het proces waarbij computers leren aan de hand van voorbeelden, zonder dat er expliciete regels worden geprogrammeerd. Ondanks dat ML een onderdeel is van AI, is het niet erg intelligent. ML is vooral goed in nadoen, in patronen herkennen uit voorbeelden, in precies dát doen wat het eerder heeft gezien. Desondanks maakt ML digitale toepassingen veel interessanter dan wanneer programmeurs alle regels en instructies handmatig invoeren. Door ML kunnen computers patronen afleiden die wij mensen over het hoofd zien.

Van der Wees vervolgt haar voorbeeld van de boekenkast: ‘Het wordt een ander verhaal als je je boeken op categorie wil groeperen. Een algoritme hiervoor zou conceptueel nog steeds eenvoudig zijn: pak een boek, lees de flaptekst, bepaal op welk ander boek het lijkt en plaats het daarnaast in de kast. Het sorteren van een hele boekenkast zal veel werk zijn en de definitie van een categorie is minder eenduidig dan die van alfabet, grootte of kleur.’ Volgens Van der Wees zou ML hier van grote waarde kunnen zijn, bijvoorbeeld als je de teksten van de boeken digitaal hebt. ‘Je kunt die dan door een computer laten “lezen”. Zo kun je vervolgens het ML-model laten bepalen welke boeken op elkaar lijken en welke niet.’

Algoritmisch denken
Aan de d.school van de Stanford Universiteit in Californië leren niet-computerwetenchappers werken met algoritmes. Ze redeneren dat ‘als je weet wat de code kan doen, hoef je deze niet zelf te kunnen schrijven’. Je kunt zo de gevolgen van ontwerpkeuzes of bepaalde toepassingen beter overzien, in goede en kwade zin. Met die kennis voer je betere gesprekken op de redactie over data en vooringenomenheid. Ideeën over het inzetten van AI voor onderzoeksjournalistiek maak je tastbaarder.

Tessel Bogaard, data scientist bij NRC Media, deelt die ­mening. Journalisten hoeven geen ML-specialist te worden: ‘Het zou wel goed zijn als ze algoritmisch kunnen denken.’ Bogaard werkt aan twee grote projecten. Een gaat over archiefontsluiting op basis van metadata. Dat zijn gegevens die horen bij een artikel, zoals auteur, datum van publicatie, het aantal woorden en bijbehorende katern. Dankzij metadata kan een AI-systeem relevantere artikelen aanbieden aan lezers. Het andere project gaat over spraaksynthese. Dat is een AI-techniek waarbij de computer het stemgeluid van een persoon leert na te bootsen. Op basis daarvan genereert de computer een zogeheten synthetische stem die digitale teksten ‘uitspreekt’. Het resultaat van Bogaards werk zijn de ‘spraakrobots’ Fenna en Maarten. Zij ‘lezen’ nu zo’n 50 procent van de artikelen op NRC.nl voor.

Tekst loopt door onder de foto.

Bogaards projecten gaan over het bedienen van lezers. Ze houdt van het samenbrengen van mensen met verschillende disciplines. ‘Ieder project start met een vraag. Vervolgens wil je weten hoe je het gemakkelijkst antwoord krijgt.’ Ligt er een vraag die ze open en ingewikkeld genoeg vindt, dan start ze met het lezen van papers. Daarna kijkt ze of de technologie vrij (of tegen betaling) beschikbaar is en makkelijk toepasbaar. Hiervoor hanteert ze altijd het perspectief van journalist.

Ook ethiek en explainability (uitlegbaarheid van de werking van een systeem, red.) zijn begrippen die Bogaard belangrijk vindt om aan te kaarten tijdens gesprekken met collega’s. ‘Dat je snapt dat de bias (vooringenomenheid, red.) die in je data zit, er altijd weer uitkomt. Haal ras eruit, en je algoritme is nog steeds racistisch. Dat moet je echt onderzoeken en begrijpen voordat je AI gaat toepassen.’ Een gebrek aan diversiteit of overrepresentatie in de voorbeelden waarmee een ML-model wordt getraind kan de oorzaak zijn van bias.

Bogaard vindt dat je bepaalde vragen altijd moet stellen: ‘Wil je dingen laten beslissen door algoritmes? Kun je nog begrijpen wat er gebeurt? En: kun je dat ook weer aan een ander uitleggen? Zolang je al die stappen in de gaten houdt, denk ik dat je niet bang voor hoeft te zijn voor AI.’

Terug naar onze kunstmatige gesprekspartner met de vraag: wat betekent ‘denken’ voor jou?
AI: ‘Dat is een goede vraag! We weten nu dat computers algoritmen gebruiken om beslissingen te nemen of problemen op te lossen. Maar hoe denkt een computer dan precies? Dat is niet zo eenvoudig te zeggen. Computers denken niet zoals mensen, omdat ze geen emoties of gevoelens hebben. Maar ze kunnen wel heel goed rekenen en logisch nadenken.’

Vincent Koops is data scientist bij RTL Nederland en werkt dagelijks met editors van RTL en ontwerpers van Videoland. Hij helpt ze bij hun creatieve proces door met gebruik van ML gezamenlijk nieuwe mogelijkheden te ontdekken. Want, zo stelt hij: ‘Componeren is niet het probleem. Video’s editen, designen - mensen vinden het leuk om die dingen te doen. Ze zullen niet roepen: we zijn blij dat we nu nooit meer muziek hoeven te maken.’

Tekst loopt door onder de foto.

Als promovendus deed Koops onderzoek naar het herkennen van akkoorden in liedjes door computers. ‘Als je een paar experts vraagt om de akkoorden te geven van hetzelfde liedje, dan zijn ze het niet met elkaar eens.’ De uitdaging is dan om te kiezen: ‘Welk instrument pak ik, welke tonen? Mensen horen daar verschillende dingen in, vinden verschillende dingen belangrijk.’ Koops is duidelijk over wat vandaag de dag niet kan met AI: ‘Je kunt niet zeggen: dit is goede muziek, dus genereer maar goede muziek. Want ja: wat is goede muziek?’

Hij spreekt makers voortdurend om helder te krijgen welke informatie zij belangrijk vinden en bruikbaar. Bijvoorbeeld bij het kiezen van afbeeldingen uit series voor de thumbnails die wij als Videolandkijker zien wanneer we door de digitale catalogus bladeren. In samenspraak met ontwerpers is een systeem ontwikkeld dat automatisch de beste stills selecteert. Koops: ‘Dan zeggen ze tegen ons: “er moeten een tot drie gezichten op de thumbnail staan, het moet een mooi plaatje zijn, in focus, en fijn als een van de hoofdrolspelers erop staat.” Dat soort dingen nemen we dan allemaal mee.’

Creatief zijn
‘De leukste projecten zijn die waarbij we mensen binnen RTL helpen met AI zodat ze hun werk beter kunnen doen - niet per se efficiënter of sneller. Als je feedback krijgt en iemand zegt: nu kan ik echt dingen doen die ik hiervoor niet kon, op creatief gebied, dan heb je impact gemaakt.’ Bogaard stelt zich voor dat AI taken uit handen neemt, zoals het handmatig toevoegen van metadata. ‘Dat kan nu al, maar we hebben het alleen nog niet geïmplementeerd.’ Ze somt verdere voordelen op: ‘Het helpen vinden van onderwerpen, de juiste mensen om mee te praten, het aandragen van het goede moment, begrijpen van je publiek, de behoeften van mensen achterhalen.’

Een laatste vraag aan GPT-3-text-davinci-001: wat verwacht je van ons, mensen?
AI: ‘Ik verwacht van jullie dat je me blijft leren en me steeds beter begrijpt.’ 

Vraag je het aan deskundigen als Satya Nadella (CEO van Microsoft), Kevin Roose (New York Times columnist) en Kate Darling (AI ethicus bij MIT Media Lab) dan zijn ze van mening dat samenwerken met AI belangrijk wordt. Het betekent dat we moeten beseffen waar computers goed in zijn. Denk aan patroonherkenning, snelheid, schaal, onvermoeid repetitieve en voorspelbare taken uitvoeren. En wat unieke menselijke eigenschappen zijn, zoals creativiteit, associatie, inzicht, empathie, emotie.

Kijk nog even uit het raam: regent het? Net als het seizoen invloed heeft op het weer, heeft de selectie van de trainingsvoorbeelden invloed op de werking van AI-modellen. De vooroordelen die we toedichten aan een systeem, vinden hun oorsprong bij de mens. Want wat is ‘vies weer’? Door onze (gemankeerde) voorkeuren, onze particuliere (beperkte) blik en referentiekader en de (onvolledig geïnformeerde) keuzes die we maken, geven we aan intelligente systemen onze subjectiviteit door. Dat hoeft geen probleem te zijn, zolang we ons ervan vergewissen en ernaar handelen.

Werken in navolgbare stappen en het beschrijven van uitzonderingen - het zijn zaken die wij als journalisten goed kunnen. Algoritmisch denken is daar een nieuwe manifestatie van. Doe er je voordeel mee. Slecht weer bestaat niet; slechte kledingkeuzes wel. 

OP KLEUR OF ALFABET? BRENG JE BOEKENKAST ALGORITMISCH OP ORDE

Deze voorbeelden van algoritmes helpen je bij het nadenken over hoe computers taken uitvoeren. Heb je die manier van denken onder de knie, dan ben je beter in staat om de mogelijkheden van nieuwe technologie (zoals machine learning) in je werk toe te passen.

Sorteer je je boeken alfabetisch, gebruik dan dit stappenplan:

1. Pak een boek.
2. Lees de eerstvolgende letter van de naam van de auteur.
3. Zoek in je kast andere boeken met auteurs met dezelfde letter: staan die er niet? Zoek de dichtstbijzijnde letters in het alfabet, plaats het boek tussen de voorgaande en volgende letters. Ga verder met stap 1 voor het volgende boek.
4. Staan er wel boeken met de huidige letter, lees dan de volgende letter van de auteursnaam.
5. Herhaal stap 3 en 4 totdat je een plekje hebt gevonden voor je boek. Ga verder met stap 1 voor het volgende boek.
6. Herhaal tot alle boeken alfabetisch gesorteerd in de boekenkast staan.

Boeken op kleur groeperen? Dit zijn je stappen:

1. Kies een kleur.
2. Pak alle boeken waarvan de rug van de kaft grotendeels die kleur heeft.
3. Kies een plek in je boekenkast en zet daar alle boeken van de betreffende kleur naast elkaar.
4. Herschik eventuele boeken om nuances binnen de gekozen kleur te verwerken: lichtgeel bij lichtgeel, donkergeel bij donkergeel.
5. Ga verder met stap 1 voor de volgende kleur.
6. Herhaal tot alle boeken een plek hebben gekregen in de boekenkast.             

Deze serie over journalistieke innovatie wordt mede mogelijk gemaakt door het Lucas Ooms Fonds.

Dit artikel is een voorpublicatie met fragmenten uit ‘The Art of AI - een praktische introductie machine learning voor mediaprofessionals’. Dit boek van Laurens Vreekamp, m.m.v. Marlies van der Wees, wordt in mei 2022 uitgegeven bij Van Duuren Media.

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Uitgever

Dolf Rogmans

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Factuurgegevens

Villamedia Uitgeverij BV
Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Chris Helt, hoofdredacteur

Marjolein Slats, adjunct-hoofdredacteur

Linda Nab, redacteur

Lars Pasveer, redacteur

Trudy Brandenburg-Van de Ven, redacteur

Rutger de Quay, redacteur

Nick Kivits, redacteur

Sales

Sofia van Wijk

Emiel Smit

Teddy van der Laan

Webbeheer

Marc Willemsen

Vacatures & advertenties

vacatures@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.