‘New York Times houdt bewust Internet Archive-bot buiten de deur’

De New York Times heeft in 2021 een wijziging aan de website doorgevoerd die de zogenoemde ia_archiver weert. Dit geautomatiseerde proces van het Internet Archive maakt kopieën voor toekomstig onderzoek. Volgens onderzoeksplatform The Intercept wil de krant pottenkijkers weren die wijzen op ongedocumenteerde correcties en wijzigingen binnen artikelen.
Deze stealth edits (wijzigingen zonder publieke melding) kwamen meestal dankzij eerder geïndexeerde pagina’s aan het licht.
In de instructies aan externe indexeerders wordt overigens ook de GPTbot geweerd, die speurt naar tekst om het ChatGPT-taalmodel te voeden. Overigens worden deze instructies niet altijd gevolgd, aldus The Intercept. Het Internet Archive negeert die instructies sinds 2017 grotendeels en leunt op maatwerk in overleg met de (nieuws)organisatie.
Wat er wel en niet door het Internet Archive wordt geïndexeerd wisselt, maar van veel stukken is maar één kopie, zonder later herhaalbezoek. Het maakt vergelijkingen trekken tussen artikelen moeilijk, aldus The Intercept.
In augustus publiceerde de New York Times over een monsterproces tegen het Internet Archive door boekenuitgevers. In juni publiceerde het een opinie waarin werd gewaarschuwd voor het gebrek aan een deugdelijk digitaal wereldarchief.
NYT what the fuck are you doing bro pic.twitter.com/mK6WbLLsPZ
— Katelyn Burns (@transscribe) June 30, 2023
In het Intercept-stuk worden diverse stealth-edits genoemd die de New York Times doorvoerde, onder meer in 2016, rond een profiel van toenmalig presidentskandidaat Bernie Sanders. Ook werd in 2023 - onhandig geformuleerd - doodgaan gebracht als oplossing om onder studieschuld uit te komen. De krant maakte er na kritiek van dat studieschuld niet op nabestaanden wordt verhaald. Meer bij The Intercept
Praat mee