Marc van Oostendorp

273 Artikelen
48 Reacties
Achtergrond: Jay Huang (cc)
Marc van Oostendorp is hoogleraar Nederlands aan de Radboud Universiteit Hij heeft een website, een YouTube-kanaal.
Foto: John C Bullas BSc MSc PhD MCIHT MIAT (cc)

Eentaligheid is een verminking

COLUMN - Het staat al een paar maanden op internet, maar de laatste weken ging het ineens rond: een artikel waarin de Franse taalkundige Mélanie Jouitteau betoogt dat mensen eentaligheid opleggen een vorm is van verminking.

Het argument is even eenvoudig als origineel. Uit heel veel onderzoek weten we niet alleen dat de mens best meertalig kan zijn, maar dat het misschien wel de natuurlijke staat van de mens is. Nog steeds worden in grote delen van de wereld verschillende talen gebruikt: op de markt praten mensen een andere taal dan thuis, en daar weer een andere dan op het werk. Zelfs blijkt uit onderzoek (voorzichtig) dat meertaligheid goed is voor de cognitieve vermogens van sprekers – dat ze bijvoorbeeld mogelijk gemiddeld wat later Alzheimer krijgen.

Mensen van die natuurlijke staat afhouden, er kunstmatig voor zorgen dat ze maar één taal leren spreken is, zegt Jouitteau, daarom te vergelijken met bijvoorbeeld de Chinese politiek voor de twintigste eeuw dat van jonge meisjes de voeten moesten worden ingebonden zodat deze klein bleven en vrouwen nauwelijks zelfstandig konden lopen. Zoals deze verminking liet zien dat je ouders brave burgers waren, zo laat ook de dwang om kinderen alleen maar de taal van hun land te laten leren – en niet bijvoorbeeld de moedertaal van hun ouders – zien dat de opvoeders hun best doen om hun kinderen in het keurslijf van de staatsideologie te drukken.

Foto: Rubina V. (cc)

We denken nooit in ons eentje

COLUMN - Steengoede brief, van mijn Nijmeegse collega Mark Dingemanse en een indrukwekkende lijst andere geleerden, in het tijdschrift Cognitive Science deze week. In de brief vatten ze samen wat zij, en naar mijn indruk steeds meer onderzoekers, beginnen te vatten: we denken niet in ons eentje – misschien wel nooit. De menselijke hersenen zijn geen makkelijk van de omgeving af te snijden entiteit, ideeën en gedachten ontstaan eigenlijk altijd in samenspraak met anderen.

Het is natuurlijk hoe lang is gedacht over het denken: als iets dat je hersenen doen. Het model was een computer, en wel een soort desktop-computer zonder internet aansluiting, waar je een som in kon voeren die het dan uitvoerde. Steeds duidelijker wordt dat je de hersenen misschien beter kunt zien als netbooks, laptops zonder veel eigen opslag die al hun gegevens en zelfs hun programma’s voortdurend ophalen van de cloud.

De brief is een soort manifest: stel voortaan juist de interactie centraal. Dingemanse en zijn collega’s geven voorbeelden uit allerlei domeinen waaruit blijkt dat de mens, inderdaad, eigenlijk nooit in zijn eentje opereert. Studie van de structuur van alledaagse gesprekken laat bijvoorbeeld zien hoe er voortdurend heel kleine misverstandjes dreigen die over het algemeen door de gesprekspartners zo moeiteloos worden opgelost dat het eigenlijk nauwelijks opvalt. En zelfs redeneren, op het eerste gezicht het paradepaardje van denken in je eentje, heeft blijkens onderzoek vaak het karakter van een dialoog.

Foto: Rusty Clark ~ 100K Photos (cc)

Het belang van het laatste woord

COLUMN - Eergisteren kwam Eugen Rochko, de maker van het socialemediaplatform Mastodon met een voor sommigen schokkend bericht: hij zou overwegen om een functie voor ‘quote posten’ te maken omdat mensen erom vroegen.

Het bericht kwam een paar dagen nadat de Zweedse activiste Greta Thunberg op een ander socialemediaplatform, Twitter, een nu al beroemde ‘quote post’ had geplaatst. op een bericht van de kickboxer Andrew Tate. Die was haar komen sarren door in een post te melden dat hij 33 auto’s had die allemaal heel vervuilend waren, lekker puh. Een ‘quote post’ geeft iemand op Twitter de mogelijkheid zo’n bericht te herpubliceren met eigen commentaar erboven. Dat is wat een quote post is:

Rochko heeft lange tijd geweigerd om dit soort crossposts mogelijk te maken op Mastodon, omdat ze volgens hem een van de oorzaken zijn van de giftig opgewonden sfeer op Twitter. Blijkens de reacties op zijn voornemen, zijn in ieder geval veel mensen het met hem eens over die giftigheid. Tegelijkertijd hebben anderen hem juist eerder kennelijk gesmeekt om deze functie.

Aggressief

Ik zat ooit – toen ik jong was en onbezonnen, vorig jaar – ook op Twitter. Ik maakte ook wel gebruik van de quotepost-functie, bijvoorbeeld om een bericht van iemand anders van harte aan te bevelen (ik schreef er dan boven ‘Lees dit!’) of om een grapje te maken over een bericht van een beroemdheid (‘Moet je haar eens zien!’). Aan het gebruik dat mensen ‘giftig’ vinden – en waaraan Thunberg zich dan schuldig heeft gemaakt – heb ik me geloof ik niet bezondigd: om bijtend commentaar te geven op een aan mij persoonlijk geschreven bericht.

Foto: Gemaakt met DALL·E thinking fast and thinking slow

Chatbot kan niet langzaam denken

Het menselijk gedruis over tekst producerende kunstmatige intelligentie zal nog wel even voortduren. ChatGPT hielp me begin deze maand een artikel schrijven dat volgens sommigen behoorde tot het beste dat ik ooit schreef. Sindsdien ben ik ermee blijven experimenteren – vaak nog verbaasd over wat het systeem ineens bleek te kunnen bedenken, maar gaandeweg toch ook steeds meer vertrouwd met de beperkingen: de doodsheid van het geproduceerde proza (of van de geproduceerde plaatjes), de weigering om er ooit iets bij te leren.

Bijna 25 jaar geleden schreef ik een stuk, ‘grandeur en misère van de computertaalwetenschap‘. Ik weet niet of ik kan zeggen dat ik het toen goed zag; ik weet wel dat ik het nog op dezelfde manier zie. Aan het eind van het stuk wees ik er op dat dommekracht waarschijnlijk de toekomst was: computers die op basis van een enorme verzameling voorbeeldteksten aan de hand van statistiek steeds weer nieuwe teksten kunnen maken die op de oude lijken. Na “op een mooie” volgt meestal pinksterdag en dus schrijf je ‘op een mooie pinksterdag’.

Ratio

Dat is precies het principe waarop de systemen die nu furore maken gebouwd zijn. Ik voorzag dit indertijd niet omdat ik nu zo’n visionair was, maar omdat iedereen die zich er 25 jaar geleden een beetje in verdiepte het kon zien.

Foto: Arch, CC0, via Wikimedia Commons, standbeeld Ton Koops, Jip en Janneke Zaltbommel,

Hoger opgeleiden hechten meer aan eenvoudige teksten

COLUMN - Er is de laatste jaren af en toe nogal wat te doen over eenvoudige teksten. Laatst ging het daar ook over tijdens een college voor de eerstejaars die hun eerste onderzoekjes moesten presenteren. Een van hen is bezig met de vraag of het voor de overheid nu verstandig is om teksten te schrijven in een zogeheten ‘B1-niveau’, en toen kwam mijn collega Wilbert Spooren aanzetten met het nieuwste nummer van Tijdschrift voor Taalbeheersing met een artikel over het onderwerp, dat die ochtend was binnengekomen. (Zo actueel zijn wij in ons onderwijs!)

Gisteren heb ik het artikel meteen ook gelezen. De auteurs, Henk Pander Maat en Jet Gravekamp, legden twee teksten voor aan een aantal groepen lezers – een brief van een bank en een brief van een zorginstelling. Van ieder van die brieven waren er twee versies: een in eenvoudige taal en een met een wat ingewikkelder taalgebruik. De vraag was niet alleen of er een verschil in begrijpelijkheid was, maar ook wat lezers van de teksten vonden en vooral ook van de auteur. Vind je iemand deskundiger naarmate hij meer moeilijke woorden gebruikt?

Verschillende groepen kregen verschillende versies van die brief te zien. In ieder van de groepen maakten de onderzoekers bovendien verschil tussen hoger opgeleiden en anders opgeleiden.

Foto: republica GmbH (cc)

Niet spreken om begrepen te worden, maar spreken om te zijn

RECENSIE - Taal is een centraal onderwerp in het huidige maatschappelijke debat. Hoe benoemen we minderheidsgroepen? Hoe gaan we met elkaar om? Hoe laten we mensen aan het woord die nog niet veel aan het woord komen? De Duitse schrijfster Kübra Gümüşay laat een heel waardevol geluid horen in dat debat in haar boek Spreken en zijn. Ik vind dat het beste boek dat ik las over dit debat.

Gümüşay is in de eerste plaats een publieke intellectueel en taal – de Duitse titel van het boek is Sprache und Sein – is voor haar in de eerste plaats een vorm van deelnemen aan het publieke debat. Sterker nog, er lijkt voor haar weinig verschil te zijn tussen taal en deelname aan dat debat. Wat dat betreft is de keuze van de Nederlandse vertaler Ymke van der Staay om te kiezen voor Spreken en zijn een heel gelukkige.

Expositiestukken

De taal van het publieke debat is publieke taal – de normale manier van over mensen praten. Gümüşay maakt in dit verband verschil tussen ‘ongelabelden’ – ruwweg de witte man – en ‘gelabelden’ – de anderen. De eersten zijn de bezoekers van het museum van de taal, die alles mogen bekijken, horen, aanraken, beoordelen en die zelf als het ware onzichtbaar zijn. De tweede groep worden besproken, gelabeld, als exemplarisch gezien voor hun soort. Die algemene observatie is vaker gemaakt, maar Gümüşay weet hem, in ieder geval voor mij, heel invoelbaar te maken door zichzelf naar voren te brengen: een gesluierde Duitse vrouw die altijd maar vragen krijgt over die sluier:

Foto: Illustratie gemaakt door DALL-E, een product van OpenAI copyright ok. Gecheckt 06-12-2022

Een reis naar de eenhoorns met ChatGPT

Vrijdag 2 december verscheen er een spectaculair nieuwe chatbot online: ChatGPT van het software-bedrijf OpenAI. Het is een systeem waarmee je gesprekken kunt voeren in ieder geval alle talen die ik enigszins beheers. Het is een systeem dat getraind is door honderden miljarden woorden – vermoedelijk vooral van het internet geschraapt – te lezen en zo te leren welke woorden vaak in de omgeving van welke andere woorden staan, en wat voor andere patronen de taal die ze lezen kenmerken.

Zo’n ’taalmodel’ kun je vervolgens op allerlei manieren gebruiken. Als je weet wat er vaak voorkomt, kun je dat inzetten om zelf taal voort te brengen die sterk lijkt op al die bestaande taal die je tot je hebt genomen. Automatische vertalers werken er bijvoorbeeld mee, en instrumenten die schrijvers kunnen bijstaan, maar OpenAI heeft het nu dus gebruikt om een chatbot te maken. Ik heb de indruk dat ChatGTP vooral geschikt is om zakelijke vragen te beantwoorden. Het kan putten uit allerlei encyclopedische kennis, maar kan bijvoorbeeld ook opdrachten uitvoeren zoals redactiesommen (‘Een boer heeft vijf kippen en iedere kip legt vijf eieren…’) of programmeertaken (‘Schrijf een Pythonscript dat telt hoe vaak de letter m voorkomt in een tekst”).

Dat werkt allemaal verbluffend goed. Nadat ik een en ander had geprobeerd, besloot ik ChatGTP tot enige fictie te verleiden. Mijn eerste vraag (mijn vragen staan steeds in vet) was geïnspireerd door een vraag die een paar jaar geleden aan een eerdere versie van ChatGTP was gesteld. Ik geef het hier weer als een soort documentatie van waar we met dit soort systemen nu staan. Je moet je voorstellen dat de antwoorden van ChatGTP er over het algemeen binnen een paar seconden waren.

Foto: Sagaru9535, CC BY-SA 4.0 , via Wikimedia Commons.

Python en poëzie

Een van de interessantste Nederlanders op dit moment is ongetwijfeld Guido van Rossum, de ontwerper van de programmeertaal Python. Het is niet overdreven om te zeggen dat dit inmiddels wereldwijd de populairste programmeertaal is – een taal die vrijwel iedere programmeur wel een beetje kent. Hij is bovendien iemand die over heel veel onderwerpen goed heeft nagedacht en zijn mening daarover eloquent kan verwoorden, zoals bijvoorbeeld blijkt uit het onderstaandre interview met Lex Fridman.

Dat soort interviews kom je in het Nederlands niet tegen. Ik vraag me af of Van Rossum ooit serieus in de Nederlandse media aan het woord is gekomen. Dat geldt zelfs niet voor podcasts of YouTube-kanalen of andere alternatieve kanalen. Wat zijn we toch ook een armoedige cultuur. Voor 99% procent van de Nederlanders bestaat Van Rossum helemaal niet.

(Even een rant. Het is in sommige kringen nog altijd sjiek om af te geven op de verengelsing: in zo’n vreemde taal kun je toch nooit een diepe gedachte uitdrukken? Wat die mensen nooit in de beschouwing betrekken is dat je in het Nederlands maar zelden een diepe gedachte hoort uitdrukken. Wie interessante hedendaagse intellectuele discussies wil horen, moet wel Engels leren. De verarming van het Nederlands komt niet door het Engels, maar door het gebrek aan intellectuele cultuur. Einde rant.)

Foto: Honden volgens Google Images copyright ok. Gecheckt 23-11-2022

Een plaatje zegt de computer meer dan duizend woorden

Kunnen computers taal leren? Het is een van de grote vragen van deze tijd en 7 november jl. legde Danny Merkx in Nijmegen een nieuw stukje van de puzzel. Hij promoveerde er op een proefschrift waarin hij onderzocht of het hielp als je computers plaatjes laat zien.

Merkx bood de computer daarvoor een verzameling plaatjes aan – bijvoorbeeld gehaald van de website Flickr – die beschreven waren door vrijwilligers: ‘een hond rent door het gras’, ‘een wit hondje in de sneeuw’, ’twee vrouwen op een tractor’. Als de computer hierdoor getraind was, bleek het in staat om ook op een nieuwe foto te zien of er een hond op voorkwam. En dat was niet alleen het geval als de beschrijving was uitgeschreven, maar ook als hij was ingesproken – terwijl gesproken taal veel moeilijker te analyseren is, bijvoorbeeld doordat er allerlei uitspraakvariatie is, of doordat we in gesproken taal geen pauzes leggen tussen woorden maar alles aan elkaar plakken. Bovendien wist de computer voor de training begon niets van taal: hij kende geen woorden, hij wist zelfs niet wat woorden waren.

Dat toevoegen van plaatjes om taal te leren is nieuw. De bestaande ’taalmodellen’ – ook die verantwoordelijk zijn voor de successen van chatbots of Google Translate – worden alleen maar getraind op tekst. Zij leren taal door heel veel heel grote verzamelingen teksten met elkaar te vergelijken. Dat is waarschijnlijk geen heel reële weerspiegeling van hoe kinderen woorden leren, zei Merkx tijdens zijn promotie. Zij hebben ook ouders die bijvoorbeeld op een hond wijzen en dan zeggen ‘hond’. Vandaar dat Merkx ook voor computers geïnteresseerd is in multimodaal leren. Nu zijn er ook andere ‘modaliteiten’ dan het zicht (het gehoor, de reuk, enzovoort), maar het visuele is voor de computer nu eenmaal het makkelijkst te analyseren. Er zijn wel databases van plaatjes, maar niet van geuren.

Foto: © Evelina Leivada et al Figure 5 from article DALL-E 2 fails to reliably capture common syntactic processes copyright ok. Gecheckt 15-11-2022

Computer begrijpt niet wat een vrouw zonder handtas is

COLUMN - Hoe goed kunnen computers menselijke taal begrijpen? Niet heel goed, laat de Catalaanse onderzoeker Evelina Leivada samen met Amerikaanse collega’s Elliot Murphy en Gary Marcus zien in een nieuw artikel.

Je hoort wel beweren dat het moment bijna daar is: computers kunnen denken en voelen en alles begrijpen wat we zeggen. Een paar jaar geleden sloot Elon Musk nog een project voor schrijvende computers omdat ze zo goed zouden zijn dat het eng werd. Eerder dit jaar werd een ingenieur bij Google ontslagen nadat hij een rapport had geschreven waarin hij beweerde dat een nieuwe chatbot van het bedrijf bewustzijn had, en mogelijk zelfs een ziel.

Van zielen hebben taalkundigen geen verstand, maar in ieder geval met het taalgevoel valt het voorlopig wel mee, zo laten Leivada en haar collega’s zien aan de hand van een aardig experimentje. Ze legden DALL-e, een van de bekendste AI-systemen van dit moment een aantal constructies voor waarvan bekend is dat ze kenmerkend zijn voor menselijke taal: mensen hebben er geen problemen mee en dieren (of computers) wel. Zou DALL-e dit wel begrijpen?

DALL-e is een van de voorbeelden van systemen die in het afgelopen jaar ineens in de belangstelling kwamen te staan: je kunt er een zinnetje intikken en de computer genereert een plaatje dat met het zinnetje correspondeert. Alleen blijken die plaatjes dus soms wel eigenaardig te zijn.

Foto: Vox España (cc)

Genderneutrale sjwa na het fascisme

Giorgia Meloni, een politica die wel ‘postfascistisch’ genoemd wordt, is de nieuwe premier van Italië, en een van haar eerste daden was dat ze aankondigde niet als ‘la presidente’ te willen worden benoemd, met een vrouwelijk lidwoord la, maar als ‘il presidente’. Het Italiaans telt traditioneel slechts twee grammaticale geslachten, en daarbij geldt de mannelijke vorm als neutraal, ongeveer zoals bakker in het Nederlands traditioneel als mannelijk en neutraal geldt.

Het leverde Meloni kritische commentaren op, bijvoorbeeld op Twitter:

(Meloni wil ‘il’ presidente genoemd worden. Nou, nee, mijn beste: alleen pronouns die corresponderen met wat je tussen je benen hebt, wij wijken niet voor gender-ideologie!)

De beslissing valt natuurlijk ook niet anders te zien dan als onderdeel van de discussie over genderneutrale taal die in grote delen van de wereld woedt, en zeker ook in Italië. Het is een eigenaardig kenmerk van al die discussies dat men nauwelijks over de taalgrenzen heen kijkt. Naar de discussie in Amerika wordt nog wel verwezen, maar dat overal in Europa over dit onderwerp gesproken wordt, daarvan lijkt vrijwel niemand zich bewust. Terwijl het, zou je zeggen, zowel voor voor- als tegenstanders interessant kan zijn kennis te nemen van wat er elders te berde wordt gebracht. (Voor de Italianen is het bijvoorbeeld potentieel interessant dat de Académie française enkele jaren geleden besloot dat naar vrouwelijke ministers verwezen moet worden met le ministre omdat ‘functie voor persoon gaat’; maar dat zelfs de Franse regering zich daar niet aan houdt.)

Foto: Floris van Dyck, Public domain, via Wikimedia Commons

Woorden doen ertoe (in onze kijk op de wereld)

COLUMN - Gelukkig klinkt af en toe het geluid van de rede. In het nieuwe nummer van het tijdschrift Cognition is Peter Hagoort, directeur van het Donders Instituut in Nijmegen de vertolker van dit geluid.

We komen uit een periode waarin het idee van embodied cognition sterk in de belangstelling: ons denken is niet abstract, maar wordt voortgebracht door ons lichaam. Hoe we de wereld zien, wordt bepaald door onze zintuigen, en door het functioneren van het menselijk lichaam. Dat klinkt allemaal heel plausibel en er zijn – natuurlijk – ook allerlei aanwijzingen dat inderdaad ons denken bepaald wordt door het feit dat we een lichaam hebben.

Het probleem is alleen dat sommige aanhangers van deze gedachte een en ander verkochten met de bewering dat deze bewijzen het einde zijn van het Cartesiaanse denken. Descartes had gesteld dat we een scheiding maken tussen lichaam en geest, maar zie eens aan! We hebben dat hele idee van een abstractere geest niet nodig.

Lichaamsgeur

Hagoort, iemand die een reusachtige reputatie heeft in het meten van hersenactiviteit bij taal, en die dus van alles weet over de rol van het lichaam in het denken (want neuronen horen ook bij het lichaam) keert zich in het nieuwe artikel tegen dit extremisme, door te laten zien dat ons denken en onze perceptie voor een deel óók bepaald worden door het abstracte systeem dat onze taal is.

Vorige Volgende