Wat kan een computer het vermogen om te doen leren?

Er is belangrijk nieuws in een van de heftigste taalkundige discussies van de afgelopen vijftig jaar. We doen even een experiment met het taalmachientje onder je hersenpan. Wat betekent de volgende zin?

  • Wat geloof jij dat de actrice gisteren gekocht heeft?

De vraag is nu: wat is het lijdend voorwerp van gekocht? Dat is als je Nederlands spreekt hopelijk geen ingewikkelde vraag: dat is wat. Het staat weliswaar ver naar voren, maar vraagwoorden plaatsen we nu eenmaal naar voren in de zin. Maar neem nu de volgende zin:

  • Wat deel jij de overtuiging dat de actrice gisteren gekocht heeft?

De zin zou min of meer hetzelfde moeten betekenen als de vorige – de zinnen ‘ik geloof dat de actrice dit gekocht heeft’ en ‘ik deel de overtuiging dat de actrice dit gekocht heeft’ zijn parallel aan elkaar, en er wordt op parallelle manier een vraag van gemaakt– maar dat doet hij niet. Hij betekent niks.

De reden daarvoor, ontdekten taalkundigen meer dan vijftig jaar geleden is dat ‘jouw overtuiging dat…’ een zelfstandignaamwoordgroep is, en ‘geloof jij dat..’ een werkwoordgroep. Om de een of andere reden kan er geen relatie bestaan tussen een werkwoord en zijn lijdend voorwerp als dat werkwoord ingebed is in een zelfstandignaamwoordgroep en het lijdend voorwerp niet.

Ja, de vorige alinea is heel ingewikkeld.

Bouwplan

Maar dat is nu juist het punt: je taalintuïtie trekt zich weinig aan van die ingewikkeldheid. Je voelt dat de tweede zin niet kan en de eerste wel. De ingewikkelde alinea beschrijft waar dat gevoel vandaan komt, ook al ben je je daar niet van bewust. Je hebt dus op een bepaalde manier wel degelijk die ingewikkelde kennis.

Maar dan komt de volgende vraag: waar komt die kennis vandaan? Die vraag is de inzet geweest van die discussie van de afgelopen halve eeuw: die over het aangeboren taalvermogen. In hoeverre begint de baby de ingewikkelde taak van het verwerven van haar moedertaal volkomen blanco en in hoeverre zijn er in haar hersenen al ideeën ingebakken over hoe de grammatica van taal eruit zou moeten zien: in hoeverre verwacht een kind bijvoorbeeld al werkwoorden en zelfstandig naamwoorden te moeten onderscheiden?

Voor de aanhangers van dat aangeboren taalvermogen zijn de zinnen hierboven lang een gewichtig bewijsstuk geweest. Je leert nooit expliciet iets over het ingewikkelde verschil tussen die zinnen. Je ouders zeggen er niets over en op school wordt er ook niets over meegedeeld. Bovendien komen allebei de soorten zinnen niet erg veel voor, en zeker worden ze niet vaak tegen kinderen gezegd. Hoe komen die kinderen er dan achter dat de ene zin wel kan en de andere niet? Het antwoord van de aanhangers van aangeborenheid is: dat kan alleen maar zijn omdat we in ons hoofd bij geboorte een bouwplan hebben van hoe taal er in grote lijnen uitziet, en waar op de een of andere manier al de relatie in is opgenomen tussen vraagwoorden vooraan en het werkwoord verderop waarvan ze het lijdend voorwerp zijn.

Onbewust

Dat gold heel lang als een ijzersterk argument, maar een nieuw manuscript dat nu overal de ronde doet, slaat er wat gaten in: als je de heel krachtige software gebruikt die zichzelf taal kan leren (zoals GPT-3), dan kan die software ook dit soort verschillen oppikken. De computer wordt alleen gevoerd met grote hoeveelheden taal, bakken vol teksten, kasten vol, en past daar alleen maar statistiek op toe, zonder enige van te voren opgelegde kennis over vraagwoorden of naamwoorden of wat dan ook. En toch vindt die computer uiteindelijk de tweede zin hierboven vreemder dan de eerste.

De onderzoekers zijn zelf enigszins bescheiden over hun bevinding. Ze wijzen er bijvoorbeeld op dat de hoeveelheid taal die GPT-3 nodig heeft om een taal te leren naar schatting evenveel is als een tachtigjarige mens gehoord heeft. Wij mensen leren dus wel wat sneller: we hebben minder gegevens nodig om het subtiele verschil op te pikken. We weten bovendien dat die modellen energie slurpen, en we doen het dus ook een stuk efficiënter. Aan de andere kant kun je zeggen: misschien kunnen er nog verfijndere modellen komen die het nog sneller en efficiënter leren. Dat je principieel niet het verschil tussen deze zinnen zou kunnen leren is in ieder geval weerlegd. Een blanco blad kan wel degelijk met dit soort subtiliteiten gevuld raken.

Als het systeem het kan leren, is natuurlijk wel de vraag: hoe komt dat verschil dan in het taalmateriaal dat de computer gebruikt om dit te leren? Met andere woorden: waarom is dat verschil er überhaupt? De computer zou vast ook een taal kunnen leren waarin dat verschil niet wordt gemaakt; de hypothese is dat kinderen dat niet zouden kunnen. Waarom lijken alle talen een soortgelijk verschil dan toch te vertonen tussen zelfstandignaamwoordgroepen en werkwoordgroepen? Die patronen moeten er door mensen onbewust in gelegd zijn. Zou dat niet toch iets te maken kunnen hebben met hoe onze geest precies werkt?

Reacties (5)

#1 Jos van Dijk

dat nu overal de rondte doet

Hier bleef mijn taalintuïtie even haken. Moet het niet zijn ‘de ronde doet’? Zie hier meer over ronde en rondte

  • Volgende discussie
#1.1 P.J. Cokema - Reactie op #1

Gecorrigeerd.
Het is inderdaad ‘doet de ronde’ of ‘gaat rond’. En nee, ik sla nu geen slag in de rondte….

#2 Co Stuifbergen

Om de een of andere reden kan er geen relatie bestaan tussen een werkwoord en zijn lijdend voorwerp als dat werkwoord ingebed is in een zelfstandignaamwoordgroep en het lijdend voorwerp niet.

Ik weet niet of dit de reden is.

Volgens mij heeft het ermee te maken dat we niet zeggen:

Wat overtuiging deel jij
maar
Welke overtuiging deel jij.

Maar ik weet niet of ik het goed begrepen heb.

Volgens mij kan ook:
Welke overtuiging deel jij dat de actrice gisteren gekocht heeft?

(maar ik schrok ook niet van “de dag die je wist die zou komen” terwijl dat niet gebruikelijk nederlands is).

  • Volgende discussie
  • Vorige discussie
#2.1 Rigo Reus - Reactie op #2

Hoho Co, het is:

De dag die je wist dat zou komen

(terwijl die niet gebruikelijk nederlands is)

#3 Arduenn

Aha, eindelijk de discussie dat je dacht die komen zou.

  • Volgende discussie
  • Vorige discussie