Marc van Oostendorp

266 Artikelen
48 Reacties
Achtergrond: Jay Huang (cc)
Marc van Oostendorp is onderzoeker aan het Meertens Instituut (KNAW). Hij heeft een website, een YouTube-kanaal en een Twitter-account.
Foto: Paul Keller (cc)

Taalpolitiek in tijden van Kunstmatige Intelligentie

Taalpolitieke kwesties hebben mij altijd meer geïnteresseerd dan de gemiddelde mens: hoe stellen we vast in welke omstandigheden welke taal of talen gebruikt mogen of moeten worden? Moeten alle kinderen op het schoolplein altijd Nederlands praten? Welke talen moeten worden gesproken in het Europese Parlement om alles tegelijk efficiënt en democratisch te laten verlopen? Moeten we ons verweren tegen het Engels in het hoger onderwijs of die taal juist omarmen?

De laatste tijd dringt tot me door dat in de toekomst die vragen weleens allemaal zouden kunnen verdwijnen, of in ieder geval een heel andere vorm zouden kunnen krijgen. Dat komt door Kunstmatige Intelligentie, systemen als ChatGPT maar vooral Google Translate en DeepL, automatische vertalers. Steeds beter worden die dingen: als je weleens iets moet vertalen, doen die systemen dat voor je in een handomdraai. Vaak is hooguit nog een lichte redactieslag nodig.

Genoeg

Het moment lijkt niet ver meer dat die systemen niet alleen voor geschreven tekst werken, maar ook in staat zijn de gesproken taal te begrijpen en voort te brengen. Ik bedoel niet dat zulke systemen er over vijf jaar zijn, maar wel dat ik niet verbaasd zou zijn als we ze in pakweg 2045 overal hebben. Dat je tegen die tijd een knopje in je oor kunt doen die alles wat de ander zegt in diens eigen stem maar in jouw taal laat klinken.

Foto: Thomas van de Weerd (cc)

Excuses voor het ongemak

COLUMN - Studenten zijn voor de gemiddelde hoogleraar natuurlijk het contact met de jeugd. En ik geloof dat ik onder studenten een nieuwe stap zie in de ontwikkeling van een Nederlandse uitdrukking: ‘excuses voor het ongemak’.

Het is, vermoed ik, een uitdrukking die in eerste instantie gebruikt is door dienstverlenende instanties die een bepaalde dienst niet konden verlenen. “Het loket is de hele middag gesloten. Onze excuses voor het ongemak.” “De trein naar Den Helder van 11.23 rijdt vandaag niet. Onze excuses voor het ongemak.” “De bloem is op, er komt pas volgende week donderdag weer nieuwe. Onze excuses voor het ongemak.” Dat dit de oorsprong is, wordt bevestigd dat er een boekje uit 2011 is van Robert Giebels dat zo te zien vol klachten staat over de dienstverlening van de NS. (Van alle instanties die ongemak veroorzaken, associeer ik die excuses ook vooral met de NS. Ooit stopte die trein midden in de nacht in Hengelo, het zou de laatste trein zijn, maar hij ging niet verder en wij moesten de nacht doorbrengen op het station. Ongemak!)

Maar kennelijk is de uitdrukking verder geëvolueerd. Ik krijg nu afmeldingen van studenten voor colleges omdat ze ziek zijn, met “excuses voor het ongemak”. Voor mijn taalgevoel is dat raar, want dat een student ziek is, vind ik naar voor die student en minder gezellig tijdens college, maar daarmee is het nog geen ‘ongemak’.

Foto: Toon Tellegen, creative commons by-sa-2.0

Vanuit de Tellegen-hemel

Waarom Toon Tellegen lezen?

Wie het raadsel van stijl wil bestuderen in de Nederlandse literatuur, moet Toon Tellegen lezen: een schrijver met een heel divers oeuvre, waarvan je iedere pagina kunt herkennen als geschreven door Tellegen: of het nu proza of poëzie betreft, voor volwassenen of voor kinderen geschreven is, grappig is of ernstig. Je kunt dat allemaal trouwens meestal niet eens zeggen, daar begint het al.

Tegelijkertijd is het lastig aan te wijzen waar dat aan ligt, want op het eerste gezicht gebruikt Tellegen heel gewone taal: wie de woordenschat gaat kwantificeren, hoeft geen heel groot telraam mee te nemen, en grammaticaal is er ook meestal weinig opvallends aan de hand. Het raadsel speelt zich puur af op een ander niveau van de stijl, de manier waarop zinnen en teksten in elkaar zitten.

Niet bestaan!

Een deel van de aantrekkingskracht zit daarbij geloof ik juist in de herkenbaarheid. Een individueel verhaal over de eekhoorn en de mier, een individueel gedicht over twee vrouwen, kun je ter kennisgeving aannemen. Het is juist het feit dat de teksten allemaal hetzelfde klinken en dat er toch steeds weer iets anders wordt gezegd die relatief veel lezers (in de wereld van lezers zijn alle beweringen over ‘veel’ relatief) naar ieder nieuw boek van Tellegen doen uitkijken.

Foto: Gerard Stolk (cc)

Ook heel persoonlijk naar mijzelf kijkend

RECENSIE - Enthousiasme is misschien niet het eerste wat je verwacht van een boek over de retorische analyse van politiek taalgebruik. Maar de titel van Robbert Wigts boek over ‘de overtuigende taal van Mark Rutte’ heet Supergaaf, en het toont de premier in zijn kenmerkende schaterlach. Het is dan ook echt een boek dat het plezier laat zien in overtuigen. Dat komt door Rutte en het komt door Wigt.

Rutte is volgens Wigt “misschien wel de verbaal meest begaafde premier uit de Nederlandse geschiedenis”, maar dat komt vooral ook doordat hij er zoveel lol in heeft. Hij heeft zich zijn hele leven bekwaamd in de kneepjes van het vak: met andere mensen omgaan, proberen met ze tot een akkoord te komen, proberen ervoor te zorgen dat dit akkoord zo goed mogelijk uitkomt voor jouw partij. Rutte vindt dat gaaf. Voor hem is communicatie daarbij niet in de eerste plaats een middel om een doel te bereiken – laten we zeggen: de wereld beter te maken –, maar een doel op zich. Hij kent de retorische trucjes, en hij geniet ervan ze te gebruiken.

Robbert Wigt, behalve schrijver ook docent Nederlands in Amsterdam, geniet er dan weer van zulke trucjes op te sporen. Dat levert een heerlijk boek op: een kenner die vol liefde analyseert wat een man die houdt van zijn vak vermag.

Foto: bertknot (cc)

Als de werkelijkheid doodloopt, bouwen we een ark.

Dit is een beetje een treurige Poëzieweek, omdat Lieke Marsman aftreedt als Dichter des Vaderlands. Het leed wordt niet eens verzacht doordat er een andere dichter aantreedt – de kandidaat heeft zich volgens de organisatie teruggetrokken ‘om persoonlijke redenen’ – maar het lijkt me voor iedere kandidaat heel lastig om in Marsmans voetsporen te treden.

Kenmerkend voor haar oeuvre is dat haar afscheidsbundeltje Ter gelegenheid van poëzie, waarin ze haar werk uit de afgelopen twee jaar verzamelde, behalve gedichten ook columns en essays bevat, want bij Marsman lopen genres altijd in elkaar over en dat heeft ze niet vanwege de zware mantel van het Dichterschap ineens veranderd. Ze vullen elkaar ook aan, ze vormen een geheel, die verschillende teksten, een zoektocht naar het Dichterschap met een grote D en het dichterschap met een kleine – wat moet je met je goedgekozen woorden in een tijd van crisis?

In haar voorwoord komt Marsman tot een radicale conclusie:

Hoe vaker ik politiek geëngageerde gedichten schrijf, hoe meer ik er dan ook van overtuigd raak dat kunst de wereld alleen kan veranderen wanneer kunstenaars de politiek in gaan. Daarmee bedoel ik niet dat kunstenaars geen geëngageerde kunst meer moeten maken, ik bedoel eigenlijk vooral: in hemelsnaam – meer kunstenaars in de politiek, hoe fijn zou dat zijn.

Foto: John C Bullas BSc MSc PhD MCIHT MIAT (cc)

Eentaligheid is een verminking

COLUMN - Het staat al een paar maanden op internet, maar de laatste weken ging het ineens rond: een artikel waarin de Franse taalkundige Mélanie Jouitteau betoogt dat mensen eentaligheid opleggen een vorm is van verminking.

Het argument is even eenvoudig als origineel. Uit heel veel onderzoek weten we niet alleen dat de mens best meertalig kan zijn, maar dat het misschien wel de natuurlijke staat van de mens is. Nog steeds worden in grote delen van de wereld verschillende talen gebruikt: op de markt praten mensen een andere taal dan thuis, en daar weer een andere dan op het werk. Zelfs blijkt uit onderzoek (voorzichtig) dat meertaligheid goed is voor de cognitieve vermogens van sprekers – dat ze bijvoorbeeld mogelijk gemiddeld wat later Alzheimer krijgen.

Mensen van die natuurlijke staat afhouden, er kunstmatig voor zorgen dat ze maar één taal leren spreken is, zegt Jouitteau, daarom te vergelijken met bijvoorbeeld de Chinese politiek voor de twintigste eeuw dat van jonge meisjes de voeten moesten worden ingebonden zodat deze klein bleven en vrouwen nauwelijks zelfstandig konden lopen. Zoals deze verminking liet zien dat je ouders brave burgers waren, zo laat ook de dwang om kinderen alleen maar de taal van hun land te laten leren – en niet bijvoorbeeld de moedertaal van hun ouders – zien dat de opvoeders hun best doen om hun kinderen in het keurslijf van de staatsideologie te drukken.

Foto: Rubina V. (cc)

We denken nooit in ons eentje

COLUMN - Steengoede brief, van mijn Nijmeegse collega Mark Dingemanse en een indrukwekkende lijst andere geleerden, in het tijdschrift Cognitive Science deze week. In de brief vatten ze samen wat zij, en naar mijn indruk steeds meer onderzoekers, beginnen te vatten: we denken niet in ons eentje – misschien wel nooit. De menselijke hersenen zijn geen makkelijk van de omgeving af te snijden entiteit, ideeën en gedachten ontstaan eigenlijk altijd in samenspraak met anderen.

Het is natuurlijk hoe lang is gedacht over het denken: als iets dat je hersenen doen. Het model was een computer, en wel een soort desktop-computer zonder internet aansluiting, waar je een som in kon voeren die het dan uitvoerde. Steeds duidelijker wordt dat je de hersenen misschien beter kunt zien als netbooks, laptops zonder veel eigen opslag die al hun gegevens en zelfs hun programma’s voortdurend ophalen van de cloud.

De brief is een soort manifest: stel voortaan juist de interactie centraal. Dingemanse en zijn collega’s geven voorbeelden uit allerlei domeinen waaruit blijkt dat de mens, inderdaad, eigenlijk nooit in zijn eentje opereert. Studie van de structuur van alledaagse gesprekken laat bijvoorbeeld zien hoe er voortdurend heel kleine misverstandjes dreigen die over het algemeen door de gesprekspartners zo moeiteloos worden opgelost dat het eigenlijk nauwelijks opvalt. En zelfs redeneren, op het eerste gezicht het paradepaardje van denken in je eentje, heeft blijkens onderzoek vaak het karakter van een dialoog.

Foto: Rusty Clark ~ 100K Photos (cc)

Het belang van het laatste woord

COLUMN - Eergisteren kwam Eugen Rochko, de maker van het socialemediaplatform Mastodon met een voor sommigen schokkend bericht: hij zou overwegen om een functie voor ‘quote posten’ te maken omdat mensen erom vroegen.

Het bericht kwam een paar dagen nadat de Zweedse activiste Greta Thunberg op een ander socialemediaplatform, Twitter, een nu al beroemde ‘quote post’ had geplaatst. op een bericht van de kickboxer Andrew Tate. Die was haar komen sarren door in een post te melden dat hij 33 auto’s had die allemaal heel vervuilend waren, lekker puh. Een ‘quote post’ geeft iemand op Twitter de mogelijkheid zo’n bericht te herpubliceren met eigen commentaar erboven. Dat is wat een quote post is:

Rochko heeft lange tijd geweigerd om dit soort crossposts mogelijk te maken op Mastodon, omdat ze volgens hem een van de oorzaken zijn van de giftig opgewonden sfeer op Twitter. Blijkens de reacties op zijn voornemen, zijn in ieder geval veel mensen het met hem eens over die giftigheid. Tegelijkertijd hebben anderen hem juist eerder kennelijk gesmeekt om deze functie.

Aggressief

Ik zat ooit – toen ik jong was en onbezonnen, vorig jaar – ook op Twitter. Ik maakte ook wel gebruik van de quotepost-functie, bijvoorbeeld om een bericht van iemand anders van harte aan te bevelen (ik schreef er dan boven ‘Lees dit!’) of om een grapje te maken over een bericht van een beroemdheid (‘Moet je haar eens zien!’). Aan het gebruik dat mensen ‘giftig’ vinden – en waaraan Thunberg zich dan schuldig heeft gemaakt – heb ik me geloof ik niet bezondigd: om bijtend commentaar te geven op een aan mij persoonlijk geschreven bericht.

Foto: Gemaakt met DALL·E thinking fast and thinking slow

Chatbot kan niet langzaam denken

Het menselijk gedruis over tekst producerende kunstmatige intelligentie zal nog wel even voortduren. ChatGPT hielp me begin deze maand een artikel schrijven dat volgens sommigen behoorde tot het beste dat ik ooit schreef. Sindsdien ben ik ermee blijven experimenteren – vaak nog verbaasd over wat het systeem ineens bleek te kunnen bedenken, maar gaandeweg toch ook steeds meer vertrouwd met de beperkingen: de doodsheid van het geproduceerde proza (of van de geproduceerde plaatjes), de weigering om er ooit iets bij te leren.

Bijna 25 jaar geleden schreef ik een stuk, ‘grandeur en misère van de computertaalwetenschap‘. Ik weet niet of ik kan zeggen dat ik het toen goed zag; ik weet wel dat ik het nog op dezelfde manier zie. Aan het eind van het stuk wees ik er op dat dommekracht waarschijnlijk de toekomst was: computers die op basis van een enorme verzameling voorbeeldteksten aan de hand van statistiek steeds weer nieuwe teksten kunnen maken die op de oude lijken. Na “op een mooie” volgt meestal pinksterdag en dus schrijf je ‘op een mooie pinksterdag’.

Ratio

Dat is precies het principe waarop de systemen die nu furore maken gebouwd zijn. Ik voorzag dit indertijd niet omdat ik nu zo’n visionair was, maar omdat iedereen die zich er 25 jaar geleden een beetje in verdiepte het kon zien.

Foto: Arch, CC0, via Wikimedia Commons, standbeeld Ton Koops, Jip en Janneke Zaltbommel,

Hoger opgeleiden hechten meer aan eenvoudige teksten

COLUMN - Er is de laatste jaren af en toe nogal wat te doen over eenvoudige teksten. Laatst ging het daar ook over tijdens een college voor de eerstejaars die hun eerste onderzoekjes moesten presenteren. Een van hen is bezig met de vraag of het voor de overheid nu verstandig is om teksten te schrijven in een zogeheten ‘B1-niveau’, en toen kwam mijn collega Wilbert Spooren aanzetten met het nieuwste nummer van Tijdschrift voor Taalbeheersing met een artikel over het onderwerp, dat die ochtend was binnengekomen. (Zo actueel zijn wij in ons onderwijs!)

Gisteren heb ik het artikel meteen ook gelezen. De auteurs, Henk Pander Maat en Jet Gravekamp, legden twee teksten voor aan een aantal groepen lezers – een brief van een bank en een brief van een zorginstelling. Van ieder van die brieven waren er twee versies: een in eenvoudige taal en een met een wat ingewikkelder taalgebruik. De vraag was niet alleen of er een verschil in begrijpelijkheid was, maar ook wat lezers van de teksten vonden en vooral ook van de auteur. Vind je iemand deskundiger naarmate hij meer moeilijke woorden gebruikt?

Verschillende groepen kregen verschillende versies van die brief te zien. In ieder van de groepen maakten de onderzoekers bovendien verschil tussen hoger opgeleiden en anders opgeleiden.

Foto: republica GmbH (cc)

Niet spreken om begrepen te worden, maar spreken om te zijn

RECENSIE - Taal is een centraal onderwerp in het huidige maatschappelijke debat. Hoe benoemen we minderheidsgroepen? Hoe gaan we met elkaar om? Hoe laten we mensen aan het woord die nog niet veel aan het woord komen? De Duitse schrijfster Kübra Gümüşay laat een heel waardevol geluid horen in dat debat in haar boek Spreken en zijn. Ik vind dat het beste boek dat ik las over dit debat.

Gümüşay is in de eerste plaats een publieke intellectueel en taal – de Duitse titel van het boek is Sprache und Sein – is voor haar in de eerste plaats een vorm van deelnemen aan het publieke debat. Sterker nog, er lijkt voor haar weinig verschil te zijn tussen taal en deelname aan dat debat. Wat dat betreft is de keuze van de Nederlandse vertaler Ymke van der Staay om te kiezen voor Spreken en zijn een heel gelukkige.

Expositiestukken

De taal van het publieke debat is publieke taal – de normale manier van over mensen praten. Gümüşay maakt in dit verband verschil tussen ‘ongelabelden’ – ruwweg de witte man – en ‘gelabelden’ – de anderen. De eersten zijn de bezoekers van het museum van de taal, die alles mogen bekijken, horen, aanraken, beoordelen en die zelf als het ware onzichtbaar zijn. De tweede groep worden besproken, gelabeld, als exemplarisch gezien voor hun soort. Die algemene observatie is vaker gemaakt, maar Gümüşay weet hem, in ieder geval voor mij, heel invoelbaar te maken door zichzelf naar voren te brengen: een gesluierde Duitse vrouw die altijd maar vragen krijgt over die sluier:

Foto: Illustratie gemaakt door DALL-E, een product van OpenAI copyright ok. Gecheckt 06-12-2022

Een reis naar de eenhoorns met ChatGPT

Vrijdag 2 december verscheen er een spectaculair nieuwe chatbot online: ChatGPT van het software-bedrijf OpenAI. Het is een systeem waarmee je gesprekken kunt voeren in ieder geval alle talen die ik enigszins beheers. Het is een systeem dat getraind is door honderden miljarden woorden – vermoedelijk vooral van het internet geschraapt – te lezen en zo te leren welke woorden vaak in de omgeving van welke andere woorden staan, en wat voor andere patronen de taal die ze lezen kenmerken.

Zo’n ’taalmodel’ kun je vervolgens op allerlei manieren gebruiken. Als je weet wat er vaak voorkomt, kun je dat inzetten om zelf taal voort te brengen die sterk lijkt op al die bestaande taal die je tot je hebt genomen. Automatische vertalers werken er bijvoorbeeld mee, en instrumenten die schrijvers kunnen bijstaan, maar OpenAI heeft het nu dus gebruikt om een chatbot te maken. Ik heb de indruk dat ChatGTP vooral geschikt is om zakelijke vragen te beantwoorden. Het kan putten uit allerlei encyclopedische kennis, maar kan bijvoorbeeld ook opdrachten uitvoeren zoals redactiesommen (‘Een boer heeft vijf kippen en iedere kip legt vijf eieren…’) of programmeertaken (‘Schrijf een Pythonscript dat telt hoe vaak de letter m voorkomt in een tekst”).

Dat werkt allemaal verbluffend goed. Nadat ik een en ander had geprobeerd, besloot ik ChatGTP tot enige fictie te verleiden. Mijn eerste vraag (mijn vragen staan steeds in vet) was geïnspireerd door een vraag die een paar jaar geleden aan een eerdere versie van ChatGTP was gesteld. Ik geef het hier weer als een soort documentatie van waar we met dit soort systemen nu staan. Je moet je voorstellen dat de antwoorden van ChatGTP er over het algemeen binnen een paar seconden waren.

Vorige Volgende