word studentlid

— donderdag 1 augustus 2013, 08:48 | 0 reacties, praat mee

Grabbelen in gegevens

Datajournalistiek is al twee jaar bezig aan een enorme opmars. Steeds meer media snuffelen in grote hoeveelheden gegevens in hun speurtocht naar nieuws. Maar waar houdt de gewone journalistiek op en begint dataverslaggeving?

Ah, datajournalistiek, dat zie je zo. Maarre… wat is het?’ Terwijl hij vertwijfeld aan zijn hoofd krabt werpt Villamedia-hoofdredacteur Dolf Rogmans een blik op een beeldscherm dat volgepropt staat met tabellen. Allemaal vertellen ze een ander verhaal. Zo is er een tabel die laat zien hoeveel journalistieke vacatures er de afgelopen maanden online zijn verschenen, spitst een andere tabel zich toe op het totale aantal baanaanbiedingen dat smeekt om webredacteuren en is er een lijst met bijna 11.000 verschillende vacatures die sinds 2008 gepubliceerd zijn op het wereld wijde web.

Zoveel cijfers… wie niet weet waar hij moet kijken zou er duizelig van worden. Toch probeerde Villamedia de afgelopen maand aan de hand van deze enorme cijferbrei de journalistieke arbeidsmarkt in kaart te brengen. Een maand lang flink stoeien met cijfers dus. Dat grabbelen in gegevens is de essentie van wat de laatste twee jaar liefkozend ‘datajournalistiek’ wordt genoemd. Om ons daarin op weg te helpen maakten we gebruik van de gratis online videocursus ‘Datajournalistiek voor beginners’ (inmiddels beschikbaar op Villamedia.nl), die aspirerend datareporters stap voor stap door het proces leidt.

Vissen naar vacatures

Een dataproject staat of valt bij de gegevens waarmee gewerkt wordt. ‘Eigenlijk is het werk van een datajournalist niet heel anders dan dat van een reguliere journalist’, weet Hille van der Kaa. In 2011 stond ze aan de wieg van de masteropleiding datajournalistiek van de Universiteit van Tilburg, de eerste in zijn soort in Nederland. ‘Het belangrijkste verschil met andere journalistiek is dat je je informatie niet bij mensen haalt, maar dat je data ondervraagt. Een dataverslaggever wacht niet totdat een organisatie met onderzoek­conclusies naar buiten komt, maar gaat zelf op zoek in de ruwe gegevens. Voor de rest zijn alle journalistieke hand­regels nog gewoon van toepassing.’

Volgens Van der Kaa zijn er grofweg twee manieren om een data-onderzoek aan te vliegen: óf je vindt een mooie dataset en gaat daarin op zoek naar nieuws óf je werkt vanuit een vraag die je beantwoord wilt zien en zoekt daar de juiste data bij. ‘Vooral die eerste manier is op dit moment heel erg in’, weet Henk van Ess, co-auteur van het vorig jaar verschenen ‘Handboek datajournalistiek’. ‘Zomaar gegevens opvragen en daar nieuws in vinden is net zoiets als lukraak gaan googelen in de hoop dat je geheime informatie tegenkomt. Gericht zoeken werkt veel beter. Maar zelfs dan kan het lastig zijn om de juiste gegevens boven tafel te krijgen. Het is niet alleen verschrikkelijk belangrijk om te weten waar je moet zoeken. Weten hoe je cijfers bij instanties lospeutert is minstens net zo belangrijk. Veel bedrijven voelen er weinig voor journalisten in hun gegevens rond te laten neuzen.’

Dat laatste ervaren we zelf ook. De talloze vacature­sites die we om inzicht in hun database vragen komen allemaal met dezelfde reactie: ze willen best even kijken hoeveel journalistieke vacatures er sinds het begin van de crisis jaarlijks geplaatst zijn, maar inzicht in de vacatures zélf krijgen we niet. Na een week speuren, bellen, slijmen en zeuren stuiten we op softwareleverancier Textkernel die ons meteen inzicht geeft in Jobfeed, een tool die alle vacatures van het Nederlandse web bij elkaar raapt, categoriseert en doorzoekbaar maakt. In één klap krijgen we inzicht in 11.325 journalistieke vacatures, die allemaal tussen 2009 en 2012 online geplaatst zijn. Voor de volledigheid trekken we ook de vacature­ database van Villamedia leeg (8254 vacatures in vier jaar). Bingo! 

Een duik in de data

Aan alleen een enorme stapel gegevens heb je ­weinig. De kunst van dataverslaggeving is volgens NRC Handels­blad-redacteur Arlen Poort juist om de speld te vinden in die enorme hooiberg aan data. Poort zelf gooide in 2004 hoge ogen met een project waarbij hij de Nederlandse woningmarkt in kaart bracht aan de hand van gegevens van huizenmarktplaats Funda. ‘Als je de gegevens hebt komt het echte journalistieke werk om de hoek kijken. Je moet een verhaal kunnen herkennen.’ Wie door de bomen zicht wil krijgen op het bos gaat eerst aan de slag met het inzichtelijk maken van zijn gegevens. Een spreadsheetprogramma (zoals Excel) is daarbij volgens Poort onmisbaar. Daarmee kunnen gebruikers snel en gemakkelijk gegevens ordenen en er berekeningen op uitvoeren. ‘Eigenlijk zou iedereen die iets met computers doet met Excel overweg moeten kunnen. Dat geldt helemaal voor journalisten. Nieuws draait vaak om uitwassen. Met Excel breng je die snel in kaart.’

Even alle vacatures van de afgelopen maanden bij elkaar optellen? Of een lange rij namen op alfabetische volgorde zetten? Na een paar minuten spelen met wat spreadsheets steken de eerste voorzichtige resultaten van het onderzoek al de kop op. Door de Jobfeed-vacatures per functie op te tellen zien we in één oogopslag dat webredacteuren de afgelopen jaren populair waren. Voor dergelijke functies werden ruim twee keer zoveel vacatures geplaatst als voor offline redacteuren. Een snelle rekensom laat vervolgens zien dat het aantal journalistieke vacatures in vier jaar tijd over de hele linie gedaald is met ruim 8 procent, maar ook dat de vraag naar webredacteuren harder daalt dan die naar redacteuren.

Monnikenwerk

De door Jobfeed aangeleverde gegevens zijn lekker overzichtelijk: ze bestaan uit reeksen cijfers, waar gemakkelijk mee gerekend kan worden. Bij de data uit de Villamedia-databank is dat wel anders. In plaats van een lijst met cijfers heeft iedere journalistieke vacature in de dataset een naam. Alleen al voor webredacteuren zijn er 262 verschillende vacatureomschrijvingen, variërend van ‘web-redacteur’ en ‘(web)redacteur’ tot ‘enthousiaste webredacteur’ en ‘spin in het (wereld wijde) web’. Willen we met die gegevens gaan rekenen, dan moeten ze onderverdeeld worden in rubrieken. En daar begint het échte monnikenwerk dat datajournalistiek is. Uren zijn we zoet met het aanpassen van vacatureomschrijvingen. ‘Data opschonen is vaak ontzettend frustrerend werk’, weet Jelle Kamsma, oprichter van de datagedreven nieuwsdienst LocalFocus.

Toch is het hersendodende lopendebandwerk volgens hem de moeite waard. ‘In de regel vind je de interessantste dingen in data die je flink moet opschonen. Als alle gegevens al netjes voor je op een rijtje staan is de kans dat iemand anders met dezelfde data aan de slag is geweest natuurlijk veel groter.’
Na het opschonen van de gegevens verschijnt ook in de Villamedia-vacatures een lijn en kunnen we conclusies trekken. Zo is het aantal vacatures op de site in vier jaar tijd met 17,5 procent gedaald. Het verschil met de Jobfeed-cijfers kan worden verklaard doordat Villamedia niet alle journalistieke vacatures aangeboden krijgt terwijl Jobfeed actief het internet afspeurt en alle gevonden baanaanbiedingen opneemt in zijn resultaten. Toch zijn er aardig wat overeenkomsten in trends. Ook uit de cijfers van Villamedia blijkt dat de vraag naar webredacteuren de afgelopen vier jaar harder daalde dan de vraag naar redacteuren en dat er, ondanks de dalende algehele markt, een lichte stijging is in de vraag naar verslaggevers.

Inzicht in trends

Welke cijfers we ook gebruiken, de conclusie van het onderzoek is duidelijk: het aantal journalistieke vacatures is in vier jaar tijd flink teruggelopen. Maar met alleen die conclusie zijn we er nog niet, vindt Frédérik Ruys, datareporter bij Nederland van Boven. ‘Datajournalistiek begint natuurlijk met het vinden van nieuws, maar het beeldcomponent is minstens net zo belangrijk. Bij datajournalistiek breng je altijd wat in beeld, ook al maak je soms alleen maar een grafiek voor jezelf. Pas wanneer je je gegevens in beeld brengt kun je echt zien of de gevonden data ook écht een verhaal vertellen.’

Het visualiseren van data is een van de breedste takken van de dataverslaggeving. Het aantal (gratis) softwarepakketten op internet is eindeloos en er komen telkens nieuwe pakketten bij. Bij ons eigen project kiezen we voor de gratis variant van Tableau, een softwarepakket dat ruwe gegevens omzet in grafieken. Met een paar muisklikken veranderen we de ruwe Jobfeed-data in een overzichtelijk staafdiagram. Die grafiek is niet alleen overzichtelijk, maar ook interactief, waardoor eventuele lezers zelf kunnen beslissen welke gegevens ze met elkaar vergelijken. Voor de volledigheid knutselen we met Google Fusion Tables ook nog een landkaart in elkaar waarop we de in 2012 werkloze journalisten per provincie in beeld brengen (resultaat te zien op de vorige pagina’). En ook hier weer: interactief.

Tussenstation

Alle partijen die we ondervragen geven te kennen dat datajournalistiek draait om gegevens vinden, verwerken en presenteren. Toch zijn er in Nederland maar weinig dataverslaggevers die alle drie deze disciplines perfect beheersen. ‘Maar dat hoeft ook niet’, vindt NRC Handelsblad-redacteur Poort. In een ideale situatie ziet hij teams van datareporters voor zich die allemaal een eigen specialisatie hebben. Toch moet iedere datareporter basiskennis hebben van alle drie de disciplines. ‘Een chef bij een krant hoeft geen expert te zijn op het gebied van vormgeving, maar moet wel weten hoe een opgemaakte krantenpagina er uit moet zien. Datajournalisten moeten genoeg van alle disciplines weten om met elkaar te kunnen communiceren.’

Hoe interessant de eerste grafieken en landkaarten die we aan de hand van ons eigen dataproject maken er ook uit zien, helemaal afgerond is het project daarmee niet. ‘Een datavisualisatie moet nooit je eindpunt zijn’, vindt handboekschrijver Henk van Ess. ‘Het is altijd een tussenstation. Data vertellen je vaak over het hoe en wat van een onderwerp, maar het waarom staat er meestal niet tussen. Na het verwerken van je data zal je toch altijd nog op zoek moeten gaan naar de menselijke invalshoek. Dat verliezen sommige datajournalisten nog wel eens uit het oog. Het belangrijkste wat je moet kunnen als datajournalist is dan ook gewoon journalist zijn.’

Bekijk meer van

Dossiers

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Uitgever

Dolf Rogmans

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Factuurgegevens

Villamedia Uitgeverij BV
Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Chris Helt, hoofdredacteur

Marjolein Slats, adjunct-hoofdredacteur

Linda Nab, redacteur

Lars Pasveer, redacteur

Trudy Brandenburg-Van de Ven, redacteur

Rutger de Quay, redacteur

Sales

Sofia van Wijk

Emiel Smit

Teddy van der Laan

Webbeheer

Marc Willemsen

Vacatures & advertenties

vacatures@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.