Met open data is Sinterklaas-intocht open boek
Sinterklaas en Zwarte Piet? Ging dat vroeger ook al zo? Waren er ook witte pieten? Dat is simpelweg te controleren via open data. Arjan El Fassed, directeur van Open State Foundation, wijst journalisten op de waarde van openbare data bij de publieke omroep.
Vanaf 9 november begint het Sinterklaasjournaal weer. Daarin vertelt Dieuwertje Blok dagelijks over de tocht van de boot. En elk jaar is er weer iets mis of zoek om de spanning erin te houden. Dit jaar komt de televisiesint op 14 november aan in Meppel.
Als je wilt zien hoe de intocht in de afgelopen jaren ging, kun je online al veel vinden. Door bijvoorbeeld YouTube te scrapen en de resultaten vervolgens op jaartal in een timeline zetten. Hiermee krijg je een redelijk overzicht van verschillende intochten van 1926 tot 2014.
Er zijn geluidsloze beelden uit 1926 te zien en witte Pieten in 1935. Tijdens de oorlogsjaren 1941 en 1942 wordt Sinterklaas toegezwaaid door NSB-jongeren en na de bevrijding kun je zien hoe er in 1945 Pieten rondrijden in Amerikaanse legerjeeps. De landelijke intochten vinden pas sinds 1952 plaats. Je ziet verschillende presentatoren voorbij komen, zoals Mies Bouwman, Edwin Rutte en Wieteke van Dort.
Het Sinterklaasjournaal wordt vanaf 2002 uitgezonden. Elk jaar is er een nieuw thema. Maar wist je dat je aan de hand van bijvoorbeeld Teletekst-ondertitelingen zelf kunt achterhalen wat het thema is van de Sinterklaasjournaals die eraan voorafgingen?
Dit jaar is de NPO begonnen met het ontsluiten van (meta)data van diverse programma’s via NPO Backstage. In een open NPO Backstage API vind je zo’n 250.000 items met onder andere data van NPO Journalistiek, programma’s ingedeeld in dossiers, fragmentbeschrijvingen en artikelen. Ook de metadata van alle NTR-programma’s, School TV’s en gidsdata van 41 nationale en regionale TV en radiozenders zijn er te vinden. Van alle programma’s die zijn opgenomen in de API kun je ook de Dordrecht in 2011, Roermond in 2012, Groningen in 2013 en Gouda van 2014. Daarnaast vind je van deze uitzendingen de metadata en de ondertitelingsdata (TT888). Als je uit de 5 ondertitelingen met een algoritme de 100 meest onderscheidende woorden ten opzichte van de andere haalt, kun je wordclouds maken (zie foto hierboven) waarmee je kunt zien wat het thema was.
In 2010 was een baby meegekomen, in 2011 moest een vlag de Pieten de weg wijzen en een jaar later verwisselden Pieter zakken pepernoten met zakken geld. In 2013 was er verwarring over de staf van Sinterklaas en vorig jaar werd Opa Piet geïntroduceerd.
Er kan veel meer met open data van de omroep. Langzamerhand wordt de NPO Backstage API verder gevuld met open data. Het is een eerste belangrijke stap en je kunt er nu al mee aan de slag. Een eerste app-competitie liet al zien wat de mogelijkheden met deze data is, maar er kan veel meer.
Op zaterdag 14 november, terwijl Sinterklaas hopelijk voet aan wal zet in Meppel, vindt op het mediapark in Hilversum een hackathon plaats. Programmeurs, ontwikkelaars datajournalisten en anderen kunnen daar laten zien wat voor mooie dingen er nu al met deze data worden gemaakt. Hopelijk inspireert dit meer omroepen en programmamakers om de rijke data die in Hilversum opgeborgen ligt te ontsluiten.
Arjan El Fasses is directeur van OpenState Foundation.
Praat mee