Marc van Oostendorp

315 Artikelen
48 Reacties
Achtergrond: Jay Huang (cc)
Marc van Oostendorp is hoogleraar Nederlands aan de Radboud Universiteit Hij heeft een website, een YouTube-kanaal.
Foto: "Penne With Milan Sauce" by Photos By Dlee is licensed under CC BY-ND 2.0

Onderzoek in kommetjes

In 1986 opende een vestiging van McDonald’s bij de Spaanse Trappen in Rome. De Italiaanse journalist Carlo Petrini, protesteerde niet met spandoeken maar met kommen penne die hij uitdeelde aan voorbijgangers. Zo begon Slow Food, inmiddels een wereldbeweging met honderdvijftigduizend leden in honderdzestig landen — gebouwd op het besef dat we niet sneller moeten eten, maar beter.

Nu is er Slow Science: een nieuw manifest, van begin dit jaar, die oproept tot een vergelijkbare omwenteling in de wetenschap. (De initiatiefnemers verwijzen expliciet naar de parallel met Slow Food.) Het nieuwe manifest is pan-Europees. Wat ze delen is een grondgedachte: dat versnelling een vijand is van kwaliteit.

Die gedachte komt geen moment te laat, want de snelkookpan van de wetenschap staat op ontploffen. De wereldwijde productie van wetenschappelijke artikelen steeg van twee miljoen in 2010 naar 3,3 miljoen in 2022 — een groei van 65 procent in twaalf jaar. Verwacht wordt dat door de komst van kunstmatige intelligentie die stroom alleen maar toeneemt. En er zijn weinig aanwijzingen dat hiermee ook de groei van kennis toeneemt.. Een bekende studie in Nature uit 2023, gebaseerd op een analyse van 45 miljoen artikelen en 3,9 miljoen patenten over zes decennia, toonde aan dat die artikelen en patenten steeds minder ‘disruptief’ zijn. Ze bouwen voort op bestaand werk in plaats van het te vervangen. Steeds meer onderzoekers, steeds meer artikelen, steeds minder echt nieuw inzicht.

Foto: John Tenniel, Public domain, via Wikimedia Commons Alice and the Red Queen

Wat zou wiskunde hier überhaupt kunnen toevoegen?

Verhalen maken de biologische wetenschap

Het was een goed idee van de redactie van Nederlandse letterkunde om een themanummer te maken over de manier waarop er in andere vakken wordt omgegaan met literatuur. Het leverde onder andere een pakkend artikel op van Johannes Müller over het gebruik van verhalen in de biologie.

De biologie is onder de natuurwetenschappen een beetje een uitzondering. Ze komt voort uit een vak dat ‘natuurlijke historie’ werd genoemd en dus alleen al in die naam een verband legde met de geesteswetenschappen. Bovendien blijkt het veel lastiger om het gedrag van mieren of mensapen in wiskundige formules te vangen dan dat van elektronen of waterstofmoleculen. De wereld is op het niveau waarop ze tot leven komt toch net iets te rommelig voor precieze deterministische modellen. En dus, schrijft Müller, is het verhaal altijd een rol blijven spelen in de wetenschap.

Een prominent recent voorbeeld is de theoretisch bioloog Stuart Kaufmann die in zijn boek A world beyond physics: the emergence and
evolution of life
 (2019) de grenzen van de wiskundige modeleerbaarheid aanwijs. Müller:

In een verhalende beschrijving van hoe de eerste levensvormen bepaalde ecologische niches veroverden en creëerden laat Kauffman de proto-cellen Sly, Gus, Patrick en Rupert optreden om uit te leggen hoe verschillende organismen op elkaar aangewezen zijn en de voorwaarde zijn voor elkaars bestaan. De verhalende vorm van deze beschrijving is voor Kauffman cruciaal: ‘The story is pretty much all you have to know. What would mathematics do here at all?’

Foto: "Bloggers hard at work at Youth For Change" by DFID - UK Department for International Development is licensed under CC BY 2.0

Bloggers parodiëren met kunstmatige intelligentie

Een tijdje geleden bezweek Neerlandistiek bijna onder de belangstelling van kunstmatige intelligentie. Zoveel chatbots kwamen ons bezoeken dat de mensen er af en toe niet meer doorheen kwamen. Ondertussen zijn er wat maatregelen genomen waardoor het wat rustiger is, in ieder geval voor de mensen, maar ik bleef zitten met de vraag: wat leren die chatbots er eigenlijk van?

Dus vroeg ik zelf aan kunstmatige intelligentie (Claude) om op basis van een stuk of vijftig blogposts – sommige van Neerlandistiek, andere van de eigen blogs, maar allemaal openbaar toegankelijk – rapporten te maken over enkele van mijn favoriete bloggende neerlandici. Hier is een korte karakterisering van sommige van hen. Ik geef het ongewijzigd weer (ook de volgorde heb ik door de chatbot laten bepalen):

Louise Cornelis — Nuchtere tekstvakvrouw die hardop nadenkt over haar vak en daar altijd een praktische les uit trekt. Kort, conversationeel, Zeeuws-onderkoeld, met een scherp oog voor taal in het wild.

Robbert-Jan Henkes — Vertaler die hardop twijfelt over het ene woord dat niet mee wil. Associatief, geestig, met een zwak voor het onvertaalbare.

Marc Kregting — Melancholische essayist die elke zin laat vertakken tot hij verdwaalt, en dat verdwalen tot methode verheft. Lang, erudit, cultuurkritisch, met een ondertoon van weemoed.

Marita Mathijsen — Enthousiaste geleerde die bij een glas wijn vertelt wat ze in het archief vond. Verhalend, warm, precies, met de spanning van een detective en de ontroering van iemand die van haar onderwerp houdt.

Nicoline van der Sijs — Etymoloog die woorden laag voor laag afpelt, van het heden terug naar de zeventiende eeuw en verder, met uitstapjes naar het Koreaans en het Russisch. Encyclopedisch, precies, licht verwonderd, nooit uitverteld.

Foto: Fröknarna Salomon door Anders Zorn, via Wikimedia Commons, Public domain

Gezellig onvertaalbaar

Er bestaat een genre op het internet dat je de onvertaalbare-woordenlijst zou kunnen noemen. Het werkt zo: iemand verzamelt een stuk of wat woorden uit diverse talen waar geen equivalent voor bestaat in de taal aller talen, het Engels, zet er een foto van een aquarel bij als illustratie. Het Japanse komorebi (zonlicht dat door bladeren valt), het Deense hygge (een soort gezelligheid, maar dan op zijn Deens), het Portugese saudade (een soort weemoed, maar dan op zijn Portugees). Het zijn als je genoeg van dit soort woordenlijsten leest altijd dezelfde woorden, en trouwens ook altijd dezelfde aquarellen.

Het Nederlands komt in zulke lijstjes weinig voor, en dat is een schandvlek voor de mensheid. Wij hebben namelijk ook een aardig arsenaal aan woorden waarmee vertalers worstelen. Hieronder een poging tot inventarisatie; met de kanttekening dat ‘onvertaalbaar’ natuurlijk flauwekul is. Mededelingen in iedere taal kunnen worden omgezet in iedere andere taal. Maar we moeten iets doen voor onze language marketing.

Hier zijn er alvast zeven, het lijstje valt natuurlijk uit te breiden. Deze zijn er op geselecteerd om mensen te laten denken dat sprekers van het Nederlands een bijna net zo unieke kijk op de wereld hebben als Japanners, Denen en Portugezen.

1. Uitwaaien

Foto: Anna Shvets on Pexels

Taalbeleid op twee benen

COLUMN - Met D66 kun je alle kanten op, als het om taalpolitiek gaat. Tot een jaar of vijf geleden was de partij nog een groot voorstander van het Engels in het hoger onderwijs. Het kon bij wijze van spreken allemaal niet Engels genoeg, leve de grote kosmopolitische wereld waarin die taal ons, en met name onze universiteiten, zou laten opstijgen.

De laatste jaren leek dat omgeslagen: zoals alle andere partijen was D66 heel kritisch over de internationale instroom van studenten – die inderdaad ook soms uit de hand leek te lopen, in de zin dat de buitenlandse studenten soms geen woonruimte konden vinden en er tentenkampen moesten worden ingericht – en meende de partij dat dit kon worden verwerkelijkt door Engelstalige opleidingen aan banden te leggen.

Robbert Dijkgraaf kwam als het ware uit Princeton om hier als minister de basis te leggen van de Wet Internationalisering in Balans – een wet die overigens nog steeds niet in werking is getreden.

Ruim baan

We zijn nog maar een paar jaar verder, en inmiddels is de vlag weer heel anders gaan hangen. De nieuwe minister van OCW, Rianne Letschert, is al jaren een van de grote tegenstanders van het aan banden leggen van de verengelsing. Als bestuurder van de zeer internationaal ingestelde Universiteit Maastricht heeft ze zich er herhaaldelijk in heel duidelijke bewoordingen tegen uitgesproken. Daar komt bij dat de internationalisering van het hoger onderwijs sinds een paar jaar al niet meer zo’n onbeheersbaar probleem is dat nodig in balans moet worden gebracht. De aanwas aan internationale studenten is aanzienlijk afgenomen.

Foto: Nasrine Mbarki Ben Ayad (screenshot)

La parole heeft een prijs

Een van de bekendste gedichten die Ramsey Nasr schreef tijdens zijn periode als Dichter des Vaderlands was ‘Mi have een droom’, een gedicht uit 2009 dat kolkte van de talen en zo begon:

wullah, poetry poet, let mi takki you 1 ding: di trobbi hier is dit
ben van me eigen now zo 66 jari & skerieus ben geen racist, aber
alle josti op een stokki, uptodate, wats deze shit? ik zeg maar zo

Het was een speels gedicht, en belangrijk was dat erboven stond ‘(Rotterdam 2059)’. Inmiddels heet de Dichter des Vaderlands Dichter der Nederlanden, en sinds deze maand wordt dit functie vervuld door Nisrine Mbarki Ben Ayad. Zij mocht gisteren de NRC openen met haar eerste gedicht der Nederlanden. Dat gedicht heet ‘beginselverklaring’, het staat hier en de eerste regels gaan zo:

zij

op een novemberochtend
kijk ik in de ogen d’une face feminine dat het mijne is geworden

heb je jezelf ooit van bovenaf gezien
de patronen die je achterlaat terwijl je voortbeweegt op aarde
dress toujours like je naar een veldhospitaal gaat

la parole heeft een prijs
dans toutes mes langues
اللي ما فهمكش خسرك

Anders dan voor Nasr is voor Mbarki de meertaligheid geen gimmick – het zit ook in haar debuutbundel oeverloos en in haar prozadebuut Kookpunt. Ze gebruikt geen inherent vluchtige straattaal, maar Frans, Arabisch en Engels. Het gedicht gaat ook niet over een ‘droom’, maar heet een ‘beginselverklaring’. Waar men in tijden van weleer zo’n beginselverklaring in één taal deed, in ferme taal, kunnen we dat nu niet meer doen. De samenleving en de mens zijn niet meer eentalig.

Foto: Jurist in de rechtbank - Artur Puls, 1890. Collectie Rijksmuseum-Amsterdam Public domain

Begrijpelijkheid is een vorm van retoriek

COLUMN - Lang hebben we gedacht dat ingewikkelde taal een manier was om macht te laten gelden, of in ieder geval gold als een vanzelfsprekend teken van expertise. Wie gezag had, sprak niet eenvoudig, en omgekeerd. Moeilijke woorden, lange zinnen en impliciete voorkennis waren signalen dat hier iemand sprak die het overzicht had, die zoveel geleerdheid had verworven dat zijn waarheid alleen nog met moeite ontsloten kon worden. In wetenschap, recht en bestuur was helderheid geen kernwaarde. Te veel eenvoud wekte argwaan: was wat je begrijpen kon wel de moeite waard?.

Als het ooit waar geweest is, is die tijd nu wel voorbij. Dat blijkt bijvoorbeeld uit een artikel over klare taal in rechterlijke uitspraken in het Tijdschrift voor Taalbeheersing. De auteurs, Geerke van der Bruggen en Henk Pander Maat, onderzochten vaak genoemde tekstingrepen, zoals het vereenvoudigen van het taalgebruik, of uitleg verschaffen over juridische regels. Juridische leken lazen verschillende versies van echte rechterlijke uitspraken, zowel in civiele als in strafrechtzaken; daarna maten de onderzoekers niet alleen wat lezers begrepen, maar ook hoe zij de tekst ervaren hadden en of zij de beslissing accepteerden. Daarbij maakten de onderzoekers expliciet onderscheid tussen daadwerkelijk begrip (kun je antwoorden geven op vragen over de tekst) en ervaren begrijpelijkheid (heb je het gevoel dat je begrijpt – wat natuurlijk niet per se hetzelfde is).

Foto: "graf Annie M.G. Schmidt" by EddieBerman is licensed under CC BY-NC-SA 2.0

De auteur staat op van de doden

Het onderzoeken van de taalvermogens van grote taalmodellen is inmiddels een heuse eigen industrie. Kunnen we teksten van chatbots herkennen? En zo ja, waar ligt dat dan aan?

We stuiten hier meteen op een pikant onderwerp: onderzoekers kunnen inderdaad verschillen vaststellen, maar tegelijkertijd lijkt het alsof menselijke lezers ongevoelig voor die verschillen zijn. Met andere woorden: computers lijken beter in het ontmaskeren van door computers geschreven teksten dan mensen. Hier zijn bijvoorbeeld twee recente artikelen (hier en hier) die min of meer dezelfde conclusies trekken. Chatbots schrijven over het algemeen wat formeler en daarnaast zijn ze geneigd wat meer informatie per vierkante centimeter te verwerken. Dat betekent dat ze bijvoorbeeld meer zelfstandig naamwoorden gebruiken – heel veel informatie zit in de zelfstandig naamwoorden – terwijl mensen percentueel wat meer lidwoorden, voorzetsels en andere betrekkelijk inhoudsloze woorden gebruiken. (Hier schreef ik over nóg een onderzoek meteen vergelijkbare conclusie.)

De verschillen zijn meetbaar, al zijn ze ook statistisch (niet iedere door een chatbot of door een mens gemaakte tekst is op deze manier te herkennen). Maar met het blote oog op te merken zijn ze nauwelijks.

Keurmerk

Desalniettemin hebben met name ervaren redacteuren wel het gevoel dat ze de verschillen kunnen ontdekken. Chatbottekst voelt gladder aan, en cliché-matiger. Gek zou dat ook niet zijn: chatbots zijn als het ware gemaakt om gladde en cliché-matige teksten te maken. In essentie doen ze niet anders dan steeds het meest voor de hand liggende woord te gebruiken, dat wil zeggen het woord dat in het corpus het vaakst voorkomt in deze context. Als veel mensen ‘op een mooie pinksterdag’ geschreven hebben, zal de computer na ‘op een mooie…’ geneigd zijn pinksterdag te schrijven.

Foto: "Eurasian wolf 2" by User:Mas3cf is licensed under CC BY-SA 4.0

Zin van het jaar: ‘Wij spreken elkaar niet vaak één op één’

Het wordt tijd om de zoektocht naar de taalbrok van het jaar te verleggen naar nieuwe gronden. Op mijn oproep voor een beter woord van het jaar, schreef Roland de Bonth streng dat de kwestie van het woord van het jaar wetenschappelijk beslecht kan worden: de is het meest gebruikte woord van het jaar 2025, in ieder geval volgens de bronnen van het Instituut voor de Nederlandse Taal.

Op mijn oproep kwamen wel wat interessante alternatieven. Mijn favoriet is probleemwolf, een manier van niet-menselijke dieren benoemen die mateloos intrigerend is en waarschijnlijk veelzeggend voor onze tijd. We zien de wolf niet als een wild verscheurend beest en ook niet als een knuffeldier, maar als een probleem: de ultieme manier om de totale vervreemding van de mens met zijn medebewoners op de planeet te benoemen. Ik voorspel de probleemwolf daarom een fijne toekomst, en zie uit naar de komst van het probleemzwijn op het moment dat ook de everzwijnen hun domein vergroten dan alleen de Veluwe.

Vertrouwdheid

Het probleem met deze verkiezing was alleen dat er zoveel verschillende inzendingen kwamen, dat er geen lijn op te trekken viel. De stem van het neerlandistische volk laat geen duidelijk geluid horen. Dus houden we het maar op de.

Foto: Max Fischer on Pexels

Een achterhoedegevecht voor de eentaligheid

Het tij begint voorzichtig te keren. Waar het Nederlandse onderwijs de afgelopen decennia heeft gezucht onder een puur door de politiek afgedwongen eentaligheid – op school moest iedereen altijd en alleen maar Nederlands spreken, we waren toch potdorie in Nederland! – met rampzalige resultaten, begint men nu voorzichtig in te zien dat wat aandacht voor de realiteit – kinderen die thuis andere talen spreken hebben daarmee een enorm reservoir aan kennis dat we kunnen aanboren om hun Nederlands te verbeteren.

Maar onmiddellijk staan er dan mensen op die het negentiende-eeuwse ideaal van één volk heeft één taal niet willen opgeven. Zoals de psycholoog Iris Breetvelt in een stuk op Vakdidactiek Nederlands.

Alle middelen

De mensheid is op het grootste deel van de wereld op een volkomen natuurlijke manier meertalig – in veel samenlevingen in bijvoorbeeld Afrika spreekt iederéén meerdere talen en wisselt die moeiteloos af. Maar het gebruik van meer talen, vooral op school werd in de Nederlandse politiek sinds ongeveer het begin van deze eeuw vooral als probleem gezien – iets wat maar zou leiden tot alles waar iederee bang voor is, zoals “taalachterstand”, “achterstandswijken”, “risicoleerlingen”. Dat is allemaal gebaseerd op een zeer diep in de Nederlandse, in de Europese geest, gewortelde ideologie: dat één volk één taal moet hebben, en dat je als individu slechter af bent als je niet al je talen in alle mogelijke domeinen – van de keukentafel tot het katheder – kunt gebruiken.

Foto: Dilan Yeşilgöz, De Balie, 2022, via Wikimedia Commons.

De mensen thuis

COLUMN - De VVD-leider Dilan Yeşilgöz is een geschikt object voor een cursus framing voor beginners. Ze legt het er voortdurend zo dik bovenop dat je niet heel doorkneed hoeft te zijn in de techniek om willekeurig welk fragment een paar frames aan te kunnen wijzen.

Een coalitie kan de meest radicale partners hebben en in de taal van Yeşilgöz nog steeds ‘centrumrechts’ zijn, terwijl er zodra er maar één partner bij zit die weleens een kritische noot heeft geplaatst bij de hypotheekrenteaftrek, het meteen verandert in een ‘links’ kabinet. Zonder centrum. En zo plaatst ze voortdurend ‘centrumrechts’ tegenover ‘links’, liefst vier keer in één zin achter elkaar.

Dat is dus wel een heel eenvoudig voorbeeld. Toch zijn er ook wel doordenkertjes, zoals de door Yeşilgöz eveneens veelvuldig gebruikte uitdrukking ‘de mensen thuis’. De vraag is hier natuurlijk: wat doen die mensen voortdurend thuis? Komen ze ook nog wel eens buiten?

Over het algemeen stelt Yeşilgöz deze mensen voor, alsof ze geërgerd hun hoofd schudden over wat de tegenstanders van de VVD allemaal te berde brengen. Daar zitten zij niet op te wachten. Maar hoewel ze óók ‘hardwerkende Nederlanders’ zijn, doen ze dat schudden dus toch voortdurend thuis. Over ‘de mensen op het werk’ hoor je Yeşilgöz niet.

Foto: Alex Knight on Unsplash

Chatbots gebruiken meer naamwoorden

COLUMN - Kun je herkennen of een tekst geschreven is door een computer? Ja, zegt een groep onderzoekers in een recent online geplaatst artikel. Tenminste, als je een computer hebt die het herkennen voor je kan doen.

De onderzoekers lieten mensen en chatbots een aantal taalopdrachten doen. Zo moesten ze teksten herschrijven in de stijl van een schoolopstel of een Wikipedia-artikel. Hoe succesvol waren ze erin? Chatbots bleken hun teksten wel licht aan te passen aan het genre, maar veel minder dan de mensen deden. Dat valt in ieder geval op een statistische manier vast te stellen: als je kijkt naar wat voor woorden er gebruikt worden, dan zit er bij de teksten van chatbots minder variatie.

Een belangrijk verschil tussen mensen en chatbots was, los van het gekozen genre, dat chatbots een veel ‘naamwoordelijker stijl’ hadden. Ze gebruikten meer zelfstandig naamwoorden (‘huis, genre, chatbot’), meer zogeheten nominalisaties (‘werken is een genot’ in plaats van ‘ik werk graag’) en bijvoeglijk naamwoorden werden vaker bij een zelfstandig naamwoord gezet (‘het mooie huis’) dan in het gezegde (‘het huis is mooi’). Mensen deden veel meer met werkwoorden (‘het huis schittert in de zon’).

Simuleren

Wat verklaart nu dit verschil? Die chatbots hebben de taal immers van ons geleerd, wat verklaart dan dat ze dingen op zo’n specifieke manier anders doen? De onderzoekers wijzen erop dat het gebruik van veel zelfstandig naamwoorden een tekst erg rijk aan informatie maakt: ieder zelfstandig naamwoord benoemt een zaak of een idee, hoe meer je daarvan geeft, hoe meer informatie in de tekst. Werkwoorden geven je zin wat dat betreft meer lucht.

Volgende