Is het Nederlands triviaal?

Marc van Oostendorp 1 november 2015 , 11:00

De Britse wiskundige Alex Bellos schreef gisteren in The Guardian een artikel dat ook in Nederland enig stof deed opwaaien. In dat stuk besprak Bellos het feit dat de Engelse spelling triviaal is: als je ieder woord ziet als een vermenigvuldiging, en iedere letter als een variabele in die vermenigvuldiging, dan kun je bewijzen dat de waarde van iedere letter gelijk is aan 1.

Neem bijvoorbeeld de woorden aisle en isle, zegt Bellos. Die spreek je op dezelfde manier uit, en dus kun je zeggen aisle=isle. Omdat je ieder woord ziet als een vermenigvuldiging van de letters, krijg je dan:

•axixsxlxe = ixsxlxe

Maar dan staat er dus eigenlijk: ax(isle) = isle. Dat is alleen waar als a staat voor 1. Die truc kun je ook voor allerlei andere letters uithalen: plumb en plum klinken ook hetzelfde, dus volgens deze redenering staat de b ook voor 1. Voor andere letters is het iets bewerkelijker. Voor de c observeer je eerste dat scent en cent hetzelfde klinken. Daaruit volgt dat s gelijk is aan 1. Daarna besef je dat sent en cent ook hetzelfde klinken. Daaruit volgt dat c=s, en omdat s=1 dus ook c=1.

Al in 1993 heeft een groep wiskundigen laten zien dat je op deze manier kunt uitrekenen dat iedere letter in het Engels en het Frans gelijk staat aan 1. Dat is de definitie van triviaal.

De vraag doet zich nu natuurlijk voor: is het Nederlands ook zo triviaal?

De vraag werd gesteld op dit leuke wiskundige weblog, en de Taalprof probeerde hem te beantwoorden op zijn eigen weblog. Zoals ik in het commentaar daaronder zeg, denk ik dat zijn bewijs niet helemaal klopt, en uiteindelijk kom ik niet verder dan de volgende letters:

t (want red=redt)
d (want pat=pad)
c (want rock=rok)
k (want rocken=rokken)
r (want verrassen=verassen)
l (want grill=gril)
n (want rasse=rassen)
m (want impasse=inpassen)
q (want qat=kat)
p (want kampt=kamt)
b (want lab=lap)

Een zekere Jutt voegt daar nog een aantal letters aan toe:

e: re = ree -> e = 1
o: doodde = dode -> o = 1 (want d = 1)
a: laadde = lade -> a = 1 (want d = 1)
j: hij = hei -> j = 1 (want e = 1)
s: rees = race -> s = c = 1 (want a = e = 1)
h: shock = sjok -> h = j = 1 (want c = 1)
g: lag = lach -> g = h = 1 (want c = 1)
w: kou = kauw -> w = 1 (want o = a = 1)
x: boxer = bokser -> x = ks = 1
y: yen = jen -> y = j = 1
z: lezer = laser -> z = s = 1 (want e = a = 1)

Maar nu kunnen we toevoegen:

v (want wreed=vreet, en v=d=t=1)
f (want lef=lev)

Ik dacht oorspronkelijk dat het Nederlands niet triviaal zou zijn, maar we hebben hiermee al 22 van de 26 letters triviaal verklaard. De i en de u zijn nog problematisch. Je zou ze kunnen oplossen als je een beetje structuralistisch met de sjwa rommelt:

u (want hut=het)
i (want katterig=katterug)

Maar ik vind dat toch minder bevredigend.

Zoals ik vrijwel zeker weet dat het Italiaans of het Spaans helemaal niet triviaal zijn. Daarvoor hebben die talen teveel een één-op-één relatie van klank en letter. Er zijn in het Italiaans bijvoorbeeld eigenlijk geen ‘onuitgesproken’ letters, en ook nauwelijks letters die op dezelfde manier worden uitgesproken als een andere letter. En dan valt het hele systeem in duigen. Het Frans en het Engels hebben allebei juist relatief veel verschillende manieren om dezelfde klank te schrijven én veel onuitgesproken letters in allerlei woorden.

We hebben hiermee dus een eenvoudige rekenkundige maat in handen van hoe fonologisch de spelling van een bepaalde taal is, die we kunnen uitdrukken met de eenvoudige formule:

φ = Λ / (λ+Λ)

Hierin staat Λ voor het totaal aantal letters in de taal en λ voor het aantal letters dat triviaal is. Hoe meer van dat soort letters, des te kleiner de maat φ, dus omgekeerd: hoe groter φ, des te duidelijker drukt het alfabet het klanksysteem van de taal uit. De waarde kan variëren tussen 1 (heel fonologisch systeem) en 1/2 (triviaal systeem). Het Nederlands heeft vooralsnog een φ van 0,52.

De trivialiteitsindex kan zelfs nog een échte toepassing hebben. Er wordt immers wel beweerd dat er in talen als het Italiaans minder mensen kampen met dyslexie dan in talen als het Engels. Je zou nu kunnen meten of er een correlatie bestaat tussen φ en het aantal dyslectici in de bevolking.

Reacties (8)

#1 børkbørkbørk 1 november 2015 , 11:52

Grappige maat, maar wel erg irrelevant: de conditionele verdeling van fonemen over letters is veel interessanter. Bello’s “1” kan dan pas gehaald worden als alle verdelingen uniform zijn.

Overigens gaat je gelijkschakeling van m en n, i en u en v en w wel uit van een heel slordige uitspraak (kun je het verschil tussen vreet en wreed echt niet horen?) en negeert het de klemtoon.

Onderzoek naar dyslexie als functie van orthografische complexiteit is al heel vaak gedaan. Probeer google scholar maar eens.

#2 Henk van S tot S 1 november 2015 , 12:11

De trivialiteitsindex kan zelfs nog een échte toepassing hebben. Er wordt immers wel beweerd dat er in talen als het Italiaans minder mensen kampen met dyslexie dan in talen als het Engels. Je zou nu kunnen meten of er een correlatie bestaat tussen φ en het aantal dyslectici in de bevolking.

“Minder kampen” lijkt mij niet juist:
Het lijkt minder, omdat in het Italiaans de woorden worden geschreven met letters zoals men die letters op zich uitspreekt.
Kom daar maar eens om in het Engels ;-)

Verder ben ik van mening dat Alex Bellos beter in een moestuintje kan gaan wroeten; doet hij nog wat nuttigs ;-)

#3 okto 1 november 2015 , 12:13

Erg arbitrair allemaal. In het westen is jouw n misschien triviaal, maar in het noorden is de n helemaal niet triviaal, want daar wordt de eind-n wel uitgesproken.
Verder verlies je de context totaal uit het oog, en dat maakt dat het hele verhaal op losse schroeven komt. Een n aan het einde van een woord mag dan in West-Nederland triviaal zijn, maar dat wil nog niet zeggen dat de letter n in elke context triviaal is. Ik hoor nog geen westerling “eide” zeggen waar het “einde” moet zijn. Je kunt de letter n dus helemaal niet als triviaal aanmerken puur omdat hij in sommige gevallen niet uitgesproken wordt.

De enige echt triviale letters die dan over blijven zijn c, q en x.

De excercitie is dus nogal onzinnig omdat de uitspraak van een letter afhankelijk is van z’n context in het woord. Die domme wiskundige gaat er eenvoudigweg vanuit dat als x=1 in een bepaalde context, x altijd in elke andere context ook 1 is. Onzin natuurlijk.

#4 børkbørkbørk 1 november 2015 , 14:46

@3: “Verder verlies je de context totaal uit het oog, en dat maakt dat het hele verhaal op losse schroeven komt”

Dat is het hele punt van Bellos: de context is vreselijk belangrijk voor de juiste uitspraak.

#5 Konminder 2 november 2015 , 10:44

Deze hele vraagstelling is triviaal.

#6 6822 2 november 2015 , 10:55

Triviaal, zijn dat niet van die gekrulde tattoos?

#7 Bismarck 2 november 2015 , 11:44

Veel valsspelerij!
Om te beginnen zijn er (veel!) leenwoorden nodig om trivialiteiten te vinden (de meeste niet toevallig uit dat triviale Engels):
rock
rocken
grill
qat
lab
race*
shock
boxer
yen
laser*

*Hier moet niet alleen het woord, maar ook de wijze van uitspraak geleend worden om klankgelijkheid te creëren.

Daarnaast moet er behoorlijk slordig Nederlands gesproken worden, om gelijke klanken te krijgen:
rasse=rassen
impasse=inpassen
kampt=kamt
wreed=vreet
lef=lev (wat betekent lev eigenlijk? Een uitgang op v bestaat in het Nederlands helemaal niet, en dat heeft een reden!)
hut=het
katterig=katterug
Bij een beetje correct sprekende Nederlander geldt geen enkele = in dat rijtje.

#8 Bismarck 2 november 2015 , 12:02

@2: Daar zit hem de bodem van deze hele exercitie natuurlijk in: Omdat je letters op tig manieren kunt uitspreken in het Engels, ontstaan er veel meer letters die wel eens dezelfde uitspraak kennen (in de juiste context) als andere letters. Trivialiteit is dus (net als een grotere proportie mensen waarvan de dyslexie opvalt) een gevolg van klankvariabiliteit in de letters. Gezien mijn eigen waarneming (Marc heeft veel leenwoorden nodig voor zijn Nederlandse trivialiteiten), valt ook wel te verklaren waarom het Engels zoveel klankvariabiliteit heeft, omdat het een Germaanse taal is met een extreem grote proportie vrij recente leenwoorden (uit een Romaanse taal). Omdat beide takken ook hun eigen uitspraakregels voor letters kennen, ontstaat die variabiliteit.