888zoeker.nl maakt NPO-programma’s doorzoekbaar
Een fragment in een digitale tekst opzoeken is al jaar en dag een eitje. Maar wie een specifiek fragment uit een tv-programma wil opzoeken, heeft het minder makkelijk. Dat moet beter kunnen, vond journalist en programmeur Erik van Zummeren. Hij bouwde daarom 888zoeker.nl, een website die uitzendingen van NPO-programma's doorzoekbaar maakt en die sinds vandaag live is. “Fragmenten terugvinden kán wel, maar je komt bij de officiële websites van de NPO eigenlijk alleen bij grote fragmenten uit. Mijn tool brengt je rechtstreeks naar de juiste minuut van het programma.”
Omdat beeld en spraak doorzoeken op technisch vlak nogal uitdagend is, richtte Van Zummeren zich met zijn project op de ondertiteling van de programma’s. Die bestaat uit tekst en is daardoor makkelijker te doorzoeken. “Ik heb software – een crawler – gebouwd die iedere week de NPO-sites afgaat en de ondertiteling uit 115 verschillende programma’s haalt. Die worden door mijn algoritme geïndexeerd. De crawler richt zich nu nog vooral op journalistieke en levensbeschouwelijke programma’s. In de toekomst komen daar misschien nog andere programma’s bij.”
Tijdcodes
De ondertitelingen bevatten tijdcodes, die gekoppeld zijn aan het beeld. Wie op 888zoeker.nl een zoekopdracht ingeeft, kan met een knop rechtstreeks naar het stukje programma surfen waarin het gevonden stukje ondertiteling in te zien is. Een bijbehorende plugin voor Google Chrome, die hier te downloaden is, stuurt gebruikers ook rechtstreeks naar het juiste fragment. “Bij de oude NPO-website kon je nog zelf kiezen waar een fragment moest beginnen door achter de url een vraagteken te zetten met een aantal secondes erachter. Die functionaliteit is er bij NPO Start uitgehaald. De plugin herstelt die mogelijkheid.”
Van Zummeren werkte een maand aan zijn project, dat nog niet helemaal vlekkeloos werkt. De NPO werkt er niet aan mee. 888zoeker.nl – 888 verwijst naar de Teletekst-pagina voor ondertitelingen – is onderdeel van het project researchassistant.nl, een collectief dat tools maakt om journalisten te helpen in hun werk. “Journalisten die voor hun research op zoek zijn naar specifieke fragmenten van NPO-programma’s, kunnen hier veel tijd mee besparen”, aldus Van Zummeren, die zich naast journalisten ook op academici richt. 888zoeker.nl bevat bij lancering 22199 afleveringen van 115 verschillende NPO-programma’s.
Vooruitkijken
Hoewel 888zoeker.nl pas net klaar is kijkt Van Zummeren ook vooruit naar de toekomst. Hoewel zijn tool nu al enige mogelijkheden tot analyse bevat (gebruikers kunnen in een grafiek zien in welke maand het onderwerp van hun zoekopdracht veel op tv was), wil de journalist/programmeur de analysemogelijkheden uitbreiden. Hij denkt aan automatische inhoudsanalyses en de mogelijkheid om te achterhalen wie precies wat zegt, zonder dat de gebruiker daarvoor een fragment zelf hoeft te bekijken. “Maar dat is allemaal nog toekomstmuziek.”
Praat mee