0,00025 MB informatie per dag en je hebt een moedertaal

Foto: David D (cc)

COLUMN - De prijs voor de onbegrijpelijkste zin over taalkunde door een wetenschapsvoorlichter gaat dit jaar naar Berkeley News. In een artikel over een onderzoek dat zou hebben berekend hoeveel informatie een kind eigenlijk in die eerste achttien jaar moet verwerken om zijn moedertaal te kunnen leren, schrijft de voorlichter van dienst het volgende:

But new research from UC Berkeley suggests that language acquisition between birth and 18 is a remarkable feat of cognition, rather than something humans are just hardwired to do.

Wat dat voor tegenstelling mag zijn tussen een opmerkelijke prestatie van de cognitie en iets dat mensen van nature doen, blijft volkomen onduidelijk. Waarschijnlijk wordt hier bedoeld: onze onderzoekers hebben laten zien dat taal niet helemaal aangeboren is, maar dat je er heel veel voor moet leren. Dat is op zich al een vreemde bewering voor een normaal mens:  wie zou er nu denken dat je als Hongaars kind niet van alles hoeft te leren voor je Hongaars spreekt? Dat Hongaars is toch niet aangeboren?

Dat denkt dan ook niemand, maar het is al decennialang een topos in de wetenschapscommunicatie: net doen alsof er wél mensen zijn die denken dat Hongaars is aangeboren (die idiote gedachte dan verbinden aan die van Noam Chomsky, de George Soros van de linguïstiek) en dan net doen alsof het nieuws is dat nu voor de vijfentwintigduizendste keer is aangetoond dat deze gedachte niet klopt.

Nu is het onderzoek waarop deze onzin gebaseerd is, ook zelf niet vrij van onzin. Proberen te berekenen hoeveel ‘bits’ mensen in hun kindertijd te verwerken krijgen voor ze voldoende informatie hebben over hun moedertaal, dient geen enkel redelijk doel. Waarom zou je zoiets willen weten? Het resultaat van al het gereken is dat kinderen gemiddeld over iedere dag van de eerste 18 jaar van hun leven 2000 bits aan informatie leren. Is dat veel? Dat lijken de auteurs te suggereren. Maar waar moet je dat precies mee vergelijken? 2000 bits is 0,25 kB, ofwel 0,00025 MB. Ik vind dat niet zo erg veel, in een wereld waarin we via internet de ene terabyte na de andere naar elkaar toe slingeren. De auteurs zeggen met andere woorden dat je in een oogwenk de hele informatie over een taal zou kunnen uploaden.)

Maar belangrijker nog is het bezwaar dat je het niet eens kunt weten. Het is een volkomen slag in de lucht. We hebben geen idee wat je precies moet leren als je taal leert, laat staan dat we het zouden kunnen kwantificeren. Het best valt dit te illustreren aan de hand van het feit dat de auteurs beweren dat ongeveer de helft van alle informatie gaat over de betekenis van individuele woorden. Maar de wetenschap weet ondanks decennia van hard werken in het geheel niet hoe je de betekenis van willekeurig welk woord zou moeten beschrijven. De auteurs zeggen dan dat ze zich hierdoor niet uit de weg laten slaan en maar wat vereenvoudigingen hebben gemaakt, ‘net als de natuurkundige Fermi’. Want sinds Fermi dat één keer ergens heeft gedaan, mag je kennelijk voortaan altijd de wereld op een willekeurige manier veranderen als je niet weet hoe je haar anders zou moeten meten.

Ze geven zelf als voorbeeld het woord accordeon. Wat betekent dat woord? Ja, vagelijk kun je het wel zeggen: een muziekinstrument met toetsen en een trekzak. Maar hoeveel toetsen zijn nodig? Wat als er een paar ontbreken? Het probleem met de betekenis van woorden in het dagelijks spraakgebruik is dat ze altijd een beetje vaag zijn, en de betekenis op allerlei manieren afhankelijk is van de context. Wat water precies is, valt moeilijk te zeggen: stroomt er geen water in de Rijn omdat er andere deeltjes in zweven? Hoeveel theezakjes moeten we in de Rijn hangen om niet meer van water te spreken?

De auteurs lijken dat niet te beseffen en te denken dat ieder woord is als een wetenschappelijke term zoals H2O, waarvoor wel precieze definities bestaan. Als probleem voor het leren van accordeon geven ze als voorbeeld: “Does the extension cover harmoniums? Concertinas? Bayans?” Maar dat is nu precies niet een vraag die een willekeurige zevenjarige, voor het eerst geconfronteerd met dit woord, zich stelt.


Deze column verscheen eerder op Neerlandistiek
.

Reacties (6)

#1 DeVrede

Thanks. Nou zit ik al de halve morgen mijn werktijd te verdoen met de vraag, waar las ik toch eerder zulke gekkigheid?

https://slate.com/technology/2012/04/north-koreas-2-mb-of-knowledge-taunt-how-many-megabytes-does-the-human-brain-hold.html

  • Volgende discussie
#2 Henk van S tot S

@1:
Rest de vraag, waarom je je werktijd aan niet werken besteedt.

Is het misschien omdat je baas van het zelfde kaliber is als de onderzoekers in kwestie?
;-)

  • Volgende discussie
  • Vorige discussie
#3 DeVrede

Het is maandag, dat start traag…

Is het misschien omdat je baas van het zelfde kaliber is als de onderzoekers in kwestie?

Tempting… :)

  • Volgende discussie
  • Vorige discussie
#4 Bismarck

“in een wereld waarin we via internet de ene terabyte na de andere naar elkaar toe slingeren.”
Als we terabytes naar elkaar toe slingeren, dan doen we aan ontzettend inefficiënte communicatie via HD-filmpjes, waarvan we waarschijnlijk niet meer dan een paar bytes aan informatie daadwerkelijk opslaan in ons geheugen.

  • Volgende discussie
  • Vorige discussie
#5 KJH

Nou, een beetje onzin is dit stukje wel, het is namelijk al een tijdje lang een volstrekt gangbare hypothese dat data entropie (bits) en intelligentie (oa het vermogen om te leren) zaken zijn, die in elkaar uitgedrukt kunnen worden. Zie ook het gebruik van bijvoorbeeld compressie https://www.aclweb.org/anthology/W16-4825), en http://prize.hutter1.net/hfaq.htm .

  • Volgende discussie
  • Vorige discussie
#6 børkbørkbørk

@5: Maar het beantwoordt bij lange na de vraag niet hoeveel informatie iets is. Als je luistert naar gesproken taal, krijg je dan grofweg 176.000kB per seconde (bandbreedte van een cd) binnen, of gaat het om een handjevol (die 10 of 20 die je nodig hebt om de meeste woorden uit elkaar te houden)? Er is geen objectieve maatstaf voor, en al helemaal niet in de context van een lerend kind. Daarnaast is het ook een vrij onzinnige manier om iets uit te drukken, want het is niet duidelijk of het veel of weinig is en t.o.v. waarvan dat uitgedrukt zou moeten worden.

  • Vorige discussie