Marc van Oostendorp

308 Artikelen
48 Reacties
Achtergrond: Jay Huang (cc)
Marc van Oostendorp is hoogleraar Nederlands aan de Radboud Universiteit Hij heeft een website, een YouTube-kanaal.
Foto: "graf Annie M.G. Schmidt" by EddieBerman is licensed under CC BY-NC-SA 2.0

De auteur staat op van de doden

Het onderzoeken van de taalvermogens van grote taalmodellen is inmiddels een heuse eigen industrie. Kunnen we teksten van chatbots herkennen? En zo ja, waar ligt dat dan aan?

We stuiten hier meteen op een pikant onderwerp: onderzoekers kunnen inderdaad verschillen vaststellen, maar tegelijkertijd lijkt het alsof menselijke lezers ongevoelig voor die verschillen zijn. Met andere woorden: computers lijken beter in het ontmaskeren van door computers geschreven teksten dan mensen. Hier zijn bijvoorbeeld twee recente artikelen (hier en hier) die min of meer dezelfde conclusies trekken. Chatbots schrijven over het algemeen wat formeler en daarnaast zijn ze geneigd wat meer informatie per vierkante centimeter te verwerken. Dat betekent dat ze bijvoorbeeld meer zelfstandig naamwoorden gebruiken – heel veel informatie zit in de zelfstandig naamwoorden – terwijl mensen percentueel wat meer lidwoorden, voorzetsels en andere betrekkelijk inhoudsloze woorden gebruiken. (Hier schreef ik over nóg een onderzoek meteen vergelijkbare conclusie.)

De verschillen zijn meetbaar, al zijn ze ook statistisch (niet iedere door een chatbot of door een mens gemaakte tekst is op deze manier te herkennen). Maar met het blote oog op te merken zijn ze nauwelijks.

Keurmerk

Desalniettemin hebben met name ervaren redacteuren wel het gevoel dat ze de verschillen kunnen ontdekken. Chatbottekst voelt gladder aan, en cliché-matiger. Gek zou dat ook niet zijn: chatbots zijn als het ware gemaakt om gladde en cliché-matige teksten te maken. In essentie doen ze niet anders dan steeds het meest voor de hand liggende woord te gebruiken, dat wil zeggen het woord dat in het corpus het vaakst voorkomt in deze context. Als veel mensen ‘op een mooie pinksterdag’ geschreven hebben, zal de computer na ‘op een mooie…’ geneigd zijn pinksterdag te schrijven.

Foto: "Eurasian wolf 2" by User:Mas3cf is licensed under CC BY-SA 4.0

Zin van het jaar: ‘Wij spreken elkaar niet vaak één op één’

Het wordt tijd om de zoektocht naar de taalbrok van het jaar te verleggen naar nieuwe gronden. Op mijn oproep voor een beter woord van het jaar, schreef Roland de Bonth streng dat de kwestie van het woord van het jaar wetenschappelijk beslecht kan worden: de is het meest gebruikte woord van het jaar 2025, in ieder geval volgens de bronnen van het Instituut voor de Nederlandse Taal.

Op mijn oproep kwamen wel wat interessante alternatieven. Mijn favoriet is probleemwolf, een manier van niet-menselijke dieren benoemen die mateloos intrigerend is en waarschijnlijk veelzeggend voor onze tijd. We zien de wolf niet als een wild verscheurend beest en ook niet als een knuffeldier, maar als een probleem: de ultieme manier om de totale vervreemding van de mens met zijn medebewoners op de planeet te benoemen. Ik voorspel de probleemwolf daarom een fijne toekomst, en zie uit naar de komst van het probleemzwijn op het moment dat ook de everzwijnen hun domein vergroten dan alleen de Veluwe.

Vertrouwdheid

Het probleem met deze verkiezing was alleen dat er zoveel verschillende inzendingen kwamen, dat er geen lijn op te trekken viel. De stem van het neerlandistische volk laat geen duidelijk geluid horen. Dus houden we het maar op de.

Foto: Max Fischer on Pexels

Een achterhoedegevecht voor de eentaligheid

Het tij begint voorzichtig te keren. Waar het Nederlandse onderwijs de afgelopen decennia heeft gezucht onder een puur door de politiek afgedwongen eentaligheid – op school moest iedereen altijd en alleen maar Nederlands spreken, we waren toch potdorie in Nederland! – met rampzalige resultaten, begint men nu voorzichtig in te zien dat wat aandacht voor de realiteit – kinderen die thuis andere talen spreken hebben daarmee een enorm reservoir aan kennis dat we kunnen aanboren om hun Nederlands te verbeteren.

Maar onmiddellijk staan er dan mensen op die het negentiende-eeuwse ideaal van één volk heeft één taal niet willen opgeven. Zoals de psycholoog Iris Breetvelt in een stuk op Vakdidactiek Nederlands.

Alle middelen

De mensheid is op het grootste deel van de wereld op een volkomen natuurlijke manier meertalig – in veel samenlevingen in bijvoorbeeld Afrika spreekt iederéén meerdere talen en wisselt die moeiteloos af. Maar het gebruik van meer talen, vooral op school werd in de Nederlandse politiek sinds ongeveer het begin van deze eeuw vooral als probleem gezien – iets wat maar zou leiden tot alles waar iederee bang voor is, zoals “taalachterstand”, “achterstandswijken”, “risicoleerlingen”. Dat is allemaal gebaseerd op een zeer diep in de Nederlandse, in de Europese geest, gewortelde ideologie: dat één volk één taal moet hebben, en dat je als individu slechter af bent als je niet al je talen in alle mogelijke domeinen – van de keukentafel tot het katheder – kunt gebruiken.

Foto: Dilan Yeşilgöz, De Balie, 2022, via Wikimedia Commons.

De mensen thuis

COLUMN - De VVD-leider Dilan Yeşilgöz is een geschikt object voor een cursus framing voor beginners. Ze legt het er voortdurend zo dik bovenop dat je niet heel doorkneed hoeft te zijn in de techniek om willekeurig welk fragment een paar frames aan te kunnen wijzen.

Een coalitie kan de meest radicale partners hebben en in de taal van Yeşilgöz nog steeds ‘centrumrechts’ zijn, terwijl er zodra er maar één partner bij zit die weleens een kritische noot heeft geplaatst bij de hypotheekrenteaftrek, het meteen verandert in een ‘links’ kabinet. Zonder centrum. En zo plaatst ze voortdurend ‘centrumrechts’ tegenover ‘links’, liefst vier keer in één zin achter elkaar.

Dat is dus wel een heel eenvoudig voorbeeld. Toch zijn er ook wel doordenkertjes, zoals de door Yeşilgöz eveneens veelvuldig gebruikte uitdrukking ‘de mensen thuis’. De vraag is hier natuurlijk: wat doen die mensen voortdurend thuis? Komen ze ook nog wel eens buiten?

Over het algemeen stelt Yeşilgöz deze mensen voor, alsof ze geërgerd hun hoofd schudden over wat de tegenstanders van de VVD allemaal te berde brengen. Daar zitten zij niet op te wachten. Maar hoewel ze óók ‘hardwerkende Nederlanders’ zijn, doen ze dat schudden dus toch voortdurend thuis. Over ‘de mensen op het werk’ hoor je Yeşilgöz niet.

Foto: Alex Knight on Unsplash

Chatbots gebruiken meer naamwoorden

COLUMN - Kun je herkennen of een tekst geschreven is door een computer? Ja, zegt een groep onderzoekers in een recent online geplaatst artikel. Tenminste, als je een computer hebt die het herkennen voor je kan doen.

De onderzoekers lieten mensen en chatbots een aantal taalopdrachten doen. Zo moesten ze teksten herschrijven in de stijl van een schoolopstel of een Wikipedia-artikel. Hoe succesvol waren ze erin? Chatbots bleken hun teksten wel licht aan te passen aan het genre, maar veel minder dan de mensen deden. Dat valt in ieder geval op een statistische manier vast te stellen: als je kijkt naar wat voor woorden er gebruikt worden, dan zit er bij de teksten van chatbots minder variatie.

Een belangrijk verschil tussen mensen en chatbots was, los van het gekozen genre, dat chatbots een veel ‘naamwoordelijker stijl’ hadden. Ze gebruikten meer zelfstandig naamwoorden (‘huis, genre, chatbot’), meer zogeheten nominalisaties (‘werken is een genot’ in plaats van ‘ik werk graag’) en bijvoeglijk naamwoorden werden vaker bij een zelfstandig naamwoord gezet (‘het mooie huis’) dan in het gezegde (‘het huis is mooi’). Mensen deden veel meer met werkwoorden (‘het huis schittert in de zon’).

Simuleren

Wat verklaart nu dit verschil? Die chatbots hebben de taal immers van ons geleerd, wat verklaart dan dat ze dingen op zo’n specifieke manier anders doen? De onderzoekers wijzen erop dat het gebruik van veel zelfstandig naamwoorden een tekst erg rijk aan informatie maakt: ieder zelfstandig naamwoord benoemt een zaak of een idee, hoe meer je daarvan geeft, hoe meer informatie in de tekst. Werkwoorden geven je zin wat dat betreft meer lucht.

Foto: © Huis van het Boek - News from nowhere over de Kunstenaarsroman

Kunst op Zondag | Kunstenaarsroman

De kunstenaarsroman komt eraan! Het Huis van het Boek in Den Haag heeft vanaf eind van deze maand een tentoonstelling met 678 van dat soort romans. News from Nowhere, heet de tentoonstelling, naar de gelijknamige roman van William Morris (1834-1896), die de eerste vertegenwoordiger van het genre zou zijn geweest.

Een kunstenaarsroman? Wat is dat nu weer voor woord?

Het begrip in de neerlandistiek al langer bekend, maar met een andere betekenis dan in de tentoonstelling bedoeld wordt. Het Algemeen Letterkundig Lexicon omschrijft het als ‘die bepaalde soort ontwikkelingsromans waarin de groei van een artistiek personage wordt beschreven’. In het begrip zoals het het museum het hanteert, gaat de roman niet noodzakelijkerwijs over een kunstenaar, maar wordt het gemaakt door een kunstenaar. De kunstenaar is als het ware niet het lijdend voorwerp van het schrijven, maar het onderwerp.

Is niet iedere romanschrijver automatisch een kunstenaar? De tentoonstelling laat zien dat er een eigenaardige dubbelzinnigheid is van het woord kunst. Een die iedereen wel aanvoelt, maar die in woordenboeken helemaal niet goed gedocumenteerd is. Aan de ene kant gaat het over, zoals Van Dale dat noemt, ‘het ver­mo­gen om dat wat in geest of ge­moed leeft of daar­in ge­wekt is, tot ui­ting of voor­stel­ling te bren­gen op een wij­ze die schoon­heids­ont­roe­ring kan ver­oor­za­ken’, en dat kan dan op allerlei manieren, zoals door op een trompet te blazen, een plissé te laten zien, een gedicht te schrijven of een schilderij te verven.

Foto: Claude Monet, Public domain, via Wikimedia Commons

Beïnvloedt taal het denken?

Deel 8 in de serie Wat iedereen moet weten over taal

Onlangs verschenen de resultaten van een onderzoek: wat vinden taalwetenschappers dat mensen moeten weten over taal? Dat resulteerde onder andere in een lijst van 25 vragen. Korte antwoorden op die vragen staan hier op een rijtje.

‘Beïnvloedt taal het denken?’ is een grote vraag, misschien wel te groot voor wetenschappelijk onderzoek. ‘Beïnvloedt je taal je denken’ is behapbaarder, en ondertussen het onderwerp van heel veel wetenschappelijke literatuur.

Zou de mens anders denken als ze in het geheel geen taal had? Het is waarschijnlijk. Een kenmerk van taal is dat je vorm kunt geven aan je gedachten, je kunt ze immers omzetten in woorden en zinnen. Dat betekent op zijn beurt dat we van onze gedachten een soort dingen kunnen maken, die min of meer los van ons staan. We gebruiken dat vermogen om die gedachten te uiten en zo met anderen te delen. Maar we kunnen ze ook gebruiken om zélf kritisch over een eigen gedachte na te denken. Je bewust zijn van het feit dat je een bepaald idee hebt, vereist waarschijnlijk taal.

Makkelijk aan te tonen is het niet, want je zou een vergelijking moeten maken tussen mensen mét en mensen zónder taal, en de tweede groep is bijzonder lastig te traceren. Vervolgens zou je het denkproces van al deze mensen moeten vaststellen, zonder taal. De technieken om iemands gedachten te lezen zijn daarvoor lang niet ver genoeg ontwikkeld. Wat we kunnen zeggen over de relatie tussen taal en denken blijft in die zin vooralsnog op het niveau van speculatie.

Foto: Rien Hack, Mens en Machine, Rijksmuseum, CC0, via Wikimedia Commons.

Hoe AI de wetenschap slechter maakt. Of beter

COLUMN - Betekent de komst van AI dat de problemen voor de wetenschap alleen maar erger worden? Ja, zeggen Sayash Kapoor en Aravind Narayanan, auteurs van het weblog (en boek) AI Snake Oil, in een kraakhelder betoog.

Hét probleem van de moderne wetenschap in de afgelopen decennia is misschien wel dat het zo gericht is op kennis. Daardoor raakt het inzicht, het begrip, gaandeweg buiten beeld. We weten steeds meer dingetjes over de wereld, maar we ons daadwerkelijk begrip blijft daarbij ver achter. Dat betekent onder andere dat terwijl het aantal beroepswetenschappers wereldwijd explosief is gegroeid in de afgelopen eeuw, de grote wetenschappelijke doorbraken daarbij zijn achtergebleven. Heel veel zaken die de grote wetenschappelijke vragen waren na de Tweede Wereldoorlog, staan nu nog steeds open. Ondertussen zijn de investeringen in onderzoek bij de belangrijkste investeerders (de VS, China, Japan, Duitsland, Zuid-Korea, het Verenigd Koninkrijk en Frankrijk) tussen 2001 en 2021 verviervoudigd.

Verstikkend

Dat dit zo is gegaan is begrijpelijk. De wetenschap is geprofessionaliseerd en daarbij hoort verantwoording aan de samenleving, en die verantwoording neemt vaak de vorm aan van kwantificatie: een wetenschapper moet zo-en-zoveel artikelen per jaar publiceren. Dat is gemakkelijker te doen als je naar feiten zoekt (zo’n feit heb je wel of niet gevonden) dan als je zoekt naar inzicht (dat veel subjectiever is). Precies de explosieve groei van de beroepswetenschap heeft dat allemaal nog veel sterker gemaakt: je moet bepaalde procedures volgen om tot bewijsbare resultaten te komen. Degene die jarenlang zoekt naar het juiste inzicht heeft het lastig in de rat race, zeker als dat zoeken ook nog vruchteloos blijkt te zijn. Het effect is dat er jaarlijks miljoenen wetenschappelijke artikelen worden gepubliceerd die vrijwel geen van allen beklijven.

Foto: Daniel Thomas on Unsplash

Schrijvend je menselijke stem vinden

COLUMN - De zomer is voor wie aan de universiteit werkt de tijd om na te denken over je onderwijs. Doorheen het jaar is het college van volgende week, en het huiswerk voor dat college, en een update voor je dia’s over het huiswerk altijd urgenter zodat het lastig is om na te denken over de grote lijnen. In de zomer valt dat allemaal weg – en kun je erover nadenken.

Ik geef al vele jaren een schrijfcursus, schrijven voor een breder publiek. Studenten oefenen daarbij met vooral journalistieke genres zoals het nieuwsbericht, de column, het interview en de reportage. Dé grote vraag is daar natuurlijk: wat doen we met kunstmatige intelligentie? Mogen studenten dat gebruiken? Moeten we ze er zelfs mee trainen? De laatste jaren was de politiek zo’n beetje: ga je gang, ik vis de stukken die door AI geschreven zijn er toch wel uit, ons niveau ligt echt wel een stukje hoger dan bij Google of OpenAI.

Principiële houding

Maar inmiddels is dat natuurlijk een naïeve gedachte. Als ik eerlijk ben, weet ik echt niet of ik bij een blinde test waarbij ik tien teksten kreeg voorgelegd, de vijf eruit kon halen die door chatbots geschreven zijn – zeker als die chatbots de instructie krijgen af en toe een menselijk tik- of spelfoutje te maken.

Foto: Ulm choir stalls Quintilius, Rictor Norton & David Allen, CC BY 2.0, via Wikimedia Commons

Quintilianus for the millions!

RECENSIE - Hoe wij met elkaar communiceren is momenteel zo dramatisch aan het veranderen dat ik niet zou durven voorspellen hoe we er over pakweg vijf jaar voor staan. Alles is aan het veranderen. Je ziet dat aan de nieuwe, negende druk van het bekende leerboek Leren communiceren. In het voorwoord schrijven de auteurs dat ‘veel van de adviezen van de toenmalige communicatie-experts, de Griekse en Romeinse retorici, nog niets van hun betekenis verloren hebben’. Anderzijds kondigen ze in diezelfde inleiding aan dat ze in het boek adviezen geven voor ‘een verstandig en effectief gebruik van de nieuwe mogelijkheden’ van generatieve taalmodellen. Die idealen zijn, laat deze negende druk zien, heel lastig te verenigen.

Wie de geschiedenis van de talige communicatie in Nederland wil bestuderen, kan de negen drukken van Leren communiceren naast elkaar leggen. De eerste druk verscheen in 1979, dat is 46 jaar geleden, in de tijd dat je een betoog nog op een typemachine tikte en het heel modern was als die typemachine een bolletje had. Van het oorspronkelijke auteursteam is alleen Carel Jansen nog betrokken bij deze editie, als eindredacteur. Verder is alles anders, en de voortekenen zijn er dat de tiende druk misschien wel nog radicaler anders zal moeten zijn. (De auteurs zijn deze keer, naast Carel Jansen zelf, Aline Douma, Joyce Karreman en Jan Ravesteijn.)

Foto: Wilhelm Fassbinder - Beethoven beim Komponieren im Studierzimmer, via Wikimedia Commons.

Humaniora in tijden van chatbots

COLUMN - Je kunt allerlei gedachten hebben over chatbots. Je kunt bijvoorbeeld juichen over de fantastische commerciële mogelijkheden die je ziet, of je zorgen maken over types die overal commerciële mogelijkheden in zien. Je kunt denken dat kunstmatige intelligentie gaat helpen onze kinderen beter onderwijs te geven, of vrezen dat we allemaal nog dommer en luier worden onder de invloed van die dingen.

Al die reacties zijn vast terecht, maar voor de humaniora schudden deze apparaten ook aan de fundamenten van het vak. Nu er ineens niet-menselijke wezens zijn die dingen lijken te kunnen waarvan we 10 dagen geleden nog dachten dat alleen mensen ze konden. Een cartoon tekenen. Een pianosonate schrijven. Het centraal eindexamen maken.

Je kunt natuurlijk zeggen dat de vingers op die cartoons er belachelijk uitzien, dat de sonate saai is, dat er rare fouten zitten in de beantwoording van de eindexamen. Maar dan zijn we beland bij een nieuwe definitie wat het betekent om mens te zijn – één die ertoe leidt dat ik in ieder geval ook niet zo menselijk ben, want mijn pianosonates trekken vooralsnog ook geen volle zalen.

Je kunt ook zeggen: uiteindelijk willen mensen toch vooral werk van mensen. Ik kan dat, alleen als amateurschaker beamen. Ik vind het leuk om af en toe online een spelletje te spelen, maar alleen op websites waar je speelt tegen andere mensen van ongeveer jouw niveau. Tegen computers speel ik niet, daar is niks aan. Dat ik van die mensen alleen weet welke zetten ze spelen en hoe ze zichzelf genoemd hebben – voegt zo goed als niets toe – vind ik ook niet belangrijk. Maar ze moeten wel mensen zijn. Uit experimenten blijkt overigens ook dat mensen soms de voorkeur geven aan door kunstmatige intelligentie geproduceerde gedichten, maar alleen als ze niet weten dat die door kunstmatige intelligentie gemaakt is.

Foto: XxXddddddddd, via Pixabay

Begrijpt de chatbot dit of doorgrondt hij het slechts?

COLUMN - Soms worden filosofische vragen na vele jaren ineens praktisch. Zoiets beleven we nu met het woord begrip. Filosofen hebben baden met bloed gevuld tijdens hun discussies over de vraag wat het precies wil zeggen dat we een bepaalde tekst begrijpen, en nu wordt de mensheid ineens geconfronteerd met een apparaat waarvan je je concreet kunt afvragen wat het begrijpt. De chatbot.

Neem dit artikel dat onlangs verscheen op de taalkunde-site LingBuzz. Een groep Amerikaanse taalkundigen laat er zien dat chatbots testjes zoals de volgende uitstekend kunnen doorstaan:

Flavia en Jack ontweken Mary en Franck werd ontweken door Lucy en Flavia. Heeft Franck in deze context iemand ontweken?

Het antwoord op deze vraag is natuurlijk nee. Een jaar geleden deden chatbots het niet altijd goed. Als ik het nu aan ChatGPT vraag, antwoordt deze:

Nee.
Er staat dat Franck werd ontweken door Lucy en Flavia — hij is dus het object van het ontwijken, niet degene die iemand anders ontweek.

Zelfs de fouten die de bots maakten lijken op die van mensen. Zo zeiden ze vaker ten onrechte ja op de volgende variant van deze vraag:

Cleo kuste Alice en Alice werd gekust door Mary. Cleo en Alice werden gekust door Mary. Werd Mary in deze context gekust?

Volgende