Nederlandse en Belgische kranten toegevoegd aan Corpus Hedendaags Nederlands (CHN)

Nederlandse en Belgische kranten van DPG Media zijn toegevoegd aan het Corpus Hedendaags Nederlands. Ontwikkelingen in de hedendaagse Nederlandse taal worden opgenomen in een groeiende verzameling van Nederlandstalige teksten door het Instituut voor de Nederlandse taal (INT). De CHN heeft naar eigen zeggen een tekstverzameling van meer dan 2.500.000 teksten uit onder meer kranten, tijdschriften en journaaluitzendingen.
Het INT heeft onlangs een overeenkomst gesloten met DPG Media. Het archief wordt uitgebreid met teksten uit de Belgische en Nederlandse titels van de uitgever. Directeur Frida Steurs van het INT: ‘Zo is de recente hype rond ChatGPT en generatieve AI een goede reden om ook voor het Nederlands een zo krachtig mogelijk taalmodel te bouwen.’
DPG Media hoopt met de samenwerking een bijdrage te kunnen leveren aan wetenschappelijk taalonderzoek. ‘De Nederlandse taal is voortdurend in ontwikkeling. Dit wordt weerspiegeld in de teksten in dagbladen en op hun sites. Nieuwe woorden en veranderend taalgebruik komen daar snel tevoorschijn. Wij zijn blij dat we taalwetenschappers kunnen helpen met de taal uit onze media’ zegt Bart Verkade, zakelijk directeur van DPG, in een persbericht van het INT.
Praat mee