— dinsdag 13 augustus 2024 14:05 | 0 reacties , praat mee

Stichting BREIN haalt illegaal aangelegde Nederlandstalige AI-dataset offline

Stichting BREIN haalt illegaal aangelegde Nederlandstalige AI-dataset offline
Midjourney

Stichting BREIN heeft ervoor gezorgd dat een grote Nederlandstalige dataset offline is gehaald. De gegevens in die dataset werden gebruikt om kunstmatige intelligentie (AI)-modellen te trainen. Een tipgever toonde aan dat de dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites zoals nu.nl en ondertitels van talloze films en tv-series uit illegale bron. Laatste wijziging: 13 augustus 2024, 14:07

Stichting BREIN, die auteurs, artiesten, uitgevers, producenten en distributeurs beschermt tegen illegaal aanbod, treedt op tegen onrechtmatig gebruik van AI. Directeur Bastiaan van Ramshorst van BREIN stelt in de dataset te hebben gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’. Dit leverde volgens hem meer dan 10.000 resultaten op.

“Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrechtvoorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel”, aldus Van Ramshorst.

De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. BREIN onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

De grote dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door AI-computermodellen. Hoewel de dataset niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is kopiëren niet toegestaan. Het zogeheten dataminen (waardevolle inzichten, teksten of afbeeldingen genereren op basis van de data) is niet toegestaan, omdat de bron zelf illegaal is.

Ook voor het dataminen van legale bronnen met een auteursrechtenvoorbehoud is volgens BREIN toestemming van de auteursrechthebbenden vereist. Bij dit proces worden grote hoeveelheden informatie onderzocht en geanalyseerd om patronen en trends te ontdekken.

NVJ LID 26-05

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee