COLUMN - Nooit zal het wonder van de taalmachine die mens heet bezongen zijn. Wat wij allemaal niet weten en kunnen! Een verschil maken tussen de volgende zinnen bijvoorbeeld:
- Dit is de man die de vrouw die wilde aanvallen weggejaagd had.
- Dit is de man die de vrouw die wilde aanvallen mij weggejaagd had.
Als jij ook een Nederlandsetaalmachine bent, en dat ben je, anders zou je dit niet lezen, dan voel je meteen aan dat de eerste zin grammaticaal juist is, maar de tweede niet. Waarom?
De tweede zin kan zelfs betekenis hebben. Zoals de eerste een andere vorm is van de zin:
- De vrouw die wilde aanvallen had de man weggejaagd.
zo zou de tweede ongeveer kunnen betekenen:
- De vrouw die de man wilde aanvallen had mij weggejaagd.
Materie
Zoals uit de eerste zin de man naar voren is gehaald als lijdend voorwerp van wegjagen, zo zou het in de tweede naar voren zijn gehaald als lijdend voorwerp van aanvallen. Waarom kan dat tweede niet? En vooral: hoe weten wij dat die tweede zin niet kan? Nooit heeft iemand ons de reden verklaard – tenzij we behalve taalmachines ook docenten syntaxis zijn. Ook heeft niemand ons ooit op zo’n zin gewezen en gezegd: dat kun je dus niet zeggen, je kunt een zinsdeel zoals man wel naar voren halen als het lijdend voorwerp is van de hoofdzin, maar niet als het lijdend voorwerp is van een bijzin van het onderwerp.
Als je niet diep in de materie zit, moet je de vorige zin misschien wel twee keer overlezen. Maar je voelt wat daar is uitgedrukt wel aan – je weet immers dat die zin niet goed is, ook al kun je niet uitdrukken hoe dat zit.
Verbouwd
Er is een oud, leuk boek over taalkunde dat Je weet niet wat je weet heet: we weten kennelijk dingen over de grammatica waarvan we niet eens weten dat we ze weten.
Weet de chatbot die dingen ook? Daarover gaat een interessant artikel van de Utrechtse taalkundigen Iris Mulders en Eddy Ruys in het nieuwe Nederlandse taalkundige tijdschrift Nota Bene. Chatbots leren taal alleen maar op basis van voorbeelden. Heel veel voorbeelden, weliswaar, maar ook chatbots wordt er vermoedelijk nooit op gewezen dat de tweede hierboven genoemde zin weliswaar een logische structuur heeft, maar toch ongrammaticaal is.
In hun artikel laten Mulders en Ruys zien dat ChatGPT desalniettemin, als je het op de juiste manier vraagt, verschil weet te maken tussen de genoemde zinnen. Dat wil zeggen: hij wijst de juiste zinnen als ongrammaticaal aan. Ik heb het geprobeerd met een andere truc, en daarin blijkt ook wel iets van datzelfde taalgevoel: de zin moet behoorlijk verbouwd worden om er iets van te maken:
Het opwindende van de komst van chatbots is dat er voor het eerst in de geschiedenis van de mensheid andere objecten zijn die menselijke taal voortbrengen. Daar zullen we hopelijk veel van leren – zoals hoe dat nu kan, dat we dat zo abstracte verschil tussen zinnen kunnen vatten
Reacties (2)
Ben benieuwd wat de chatbot van dit artikel leert
Nu ja, de zin “Dit is de man die de vrouw die wilde aanvallen weggejaagd had.” is grammaticaal ook erg onhandig, omdat hij op twee manieren te interpreteren valt, namelijk de wijze die de auteur aanvoert (“De vrouw die wilde aanvallen had de man weggejaagd.” waarbij je wel heel erg de nadruk weghaalt van deze specifiek man), maar mij komt logischer over: “Déze man had de vrouw die wilde aanvallen weggejaagd”. Kortom, onderwerp en lijdend voorwerp zijn voor tweeërlei uitleg vatbaar (ik had ooit een soortgelijke ervaring toen iemand tegen zijn kind zei: “Dat is de student die papa heeft uitgescholden”, ik vermoedde dat hij dat opzettelijk zo zei om zijn kind de (valse) impressie te geven dat de student de schelder was, zonder daarbij daadwerkelijk te liegen).