word studentlid

— woensdag 4 november 2015, 15:10 | 0 reacties, praat mee

Met open data is Sinterklaas-intocht open boek

Met open data is Sinterklaas-intocht open boek

Sinterklaas en Zwarte Piet? Ging dat vroeger ook al zo? Waren er ook witte pieten? Dat is simpelweg te controleren via open data. Arjan El Fassed, directeur van Open State Foundation, wijst journalisten op de waarde van openbare data bij de publieke omroep. Laatste wijziging: 4 november 2015, 16:52

Vanaf 9 november begint het Sinterklaasjournaal weer. Daarin vertelt Dieuwertje Blok dagelijks over de tocht van de boot. En elk jaar is er weer iets mis of zoek om de spanning erin te houden. Dit jaar komt de televisiesint op 14 november aan in Meppel.

Als je wilt zien hoe de intocht in de afgelopen jaren ging, kun je online al veel vinden. Door bijvoorbeeld YouTube te scrapen en de resultaten vervolgens op jaartal in een timeline zetten. Hiermee krijg je een redelijk overzicht van verschillende intochten van 1926 tot 2014.

Er zijn geluidsloze beelden uit 1926 te zien en witte Pieten in 1935. Tijdens de oorlogsjaren 1941 en 1942 wordt Sinterklaas toegezwaaid door NSB-jongeren en na de bevrijding kun je zien hoe er in 1945 Pieten rondrijden in Amerikaanse legerjeeps. De landelijke intochten vinden pas sinds 1952 plaats. Je ziet verschillende presentatoren voorbij komen, zoals Mies Bouwman, Edwin Rutte en Wieteke van Dort.

Het Sinterklaasjournaal wordt vanaf 2002 uitgezonden. Elk jaar is er een nieuw thema. Maar wist je dat je aan de hand van bijvoorbeeld Teletekst-ondertitelingen zelf kunt achterhalen wat het thema is van de Sinterklaasjournaals die eraan voorafgingen?

Dit jaar is de NPO begonnen met het ontsluiten van (meta)data van diverse programma’s via NPO Backstage. In een open NPO Backstage API vind je zo’n 250.000 items met onder andere data van NPO Journalistiek, programma’s ingedeeld in dossiers, fragmentbeschrijvingen en artikelen. Ook de metadata van alle NTR-programma’s, School TV’s en gidsdata van 41 nationale en regionale TV en radiozenders zijn er te vinden. Van alle programma’s die zijn opgenomen in de API kun je ook de Dordrecht in 2011, Roermond in 2012, Groningen in 2013 en Gouda van 2014. Daarnaast vind je van deze uitzendingen de metadata en de ondertitelingsdata (TT888). Als je uit de 5 ondertitelingen met een algoritme de 100 meest onderscheidende woorden ten opzichte van de andere haalt, kun je wordclouds maken (zie foto hierboven) waarmee je kunt zien wat het thema was.

In 2010 was een baby meegekomen, in 2011 moest een vlag de Pieten de weg wijzen en een jaar later verwisselden Pieter zakken pepernoten met zakken geld. In 2013 was er verwarring over de staf van Sinterklaas en vorig jaar werd Opa Piet geïntroduceerd.

Er kan veel meer met open data van de omroep. Langzamerhand wordt de NPO Backstage API verder gevuld met open data. Het is een eerste belangrijke stap en je kunt er nu al mee aan de slag. Een eerste app-competitie liet al zien wat de mogelijkheden met deze data is, maar er kan veel meer.

Op zaterdag 14 november, terwijl Sinterklaas hopelijk voet aan wal zet in Meppel, vindt op het mediapark in Hilversum een hackathon plaats. Programmeurs, ontwikkelaars datajournalisten en anderen kunnen daar laten zien wat voor mooie dingen er nu al met deze data worden gemaakt. Hopelijk inspireert dit meer omroepen en programmamakers om de rijke data die in Hilversum opgeborgen ligt te ontsluiten.

Arjan El Fasses is directeur van OpenState Foundation.

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Uitgever

Dolf Rogmans

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Factuurgegevens

Villamedia Uitgeverij BV
Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Chris Helt, hoofdredacteur

Marjolein Slats, adjunct-hoofdredacteur

Linda Nab, redacteur

Lars Pasveer, redacteur

Trudy Brandenburg-Van de Ven, redacteur

Rutger de Quay, redacteur

Sales

Sofia van Wijk

Emiel Smit

Teddy van der Laan

Webbeheer

Marc Willemsen

Vacatures & advertenties

vacatures@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.