Een taalkundige die de macht van het grote getal misbruikt

ACHTERGROND - In het nieuws dook hij de afgelopen weken weer op: een van wat mij betreft de meest bedenkelijke figuren in het toch al zo bedenkelijke politieke spel dat in Amerika wordt gespeeld is iemand die van huis uit taalwetenschapper is. Robert Mercer staat nu in het nieuws als de baas van Cambridge Analytica, het bedrijfje dat 50 miljoen Facebook-profielen opvroeg en analyseerde om zo samen met Steve Bannon de Amerikaanse presidentsverkiezingen te beïnvloeden.

In 2014 won Mercer de ‘lifetime achievement’-prijs van de Association for Computational Linguistics (ACL), de belangrijkste vakorganisatie op dit deelgebied van de taalwetenschap. Zoals het juryrapport toen vermeldde, was hij in de jaren zeventig en tachtig een van de pioniers van het ‘big data’-onderzoek naar computertaalkundige toepassingen: het verzamelen van enorme hoeveelheden taalgegevens en die statistisch analyseren zonder veel ingebouwde vooronderstellingen over hoe taal werkt. Het is de technologie die Google bijvoorbeeld uiteindelijk succesvol zou toepassen voor Google Translate, zoals Antal van den Bosch vorig jaar uitlegde in dit filmpje. Het is, als ik het goed zie, ook anderszins de meest succesvolle technologie waar het erom gaat computers met taal te laten omgaan.

Subtiel gemanipuleerd

In de jaren negentig begon Mercer de techniek van de analyse van grote verzamelingen gegevens te gebruiken om met succes de beurzen te bespelen. Het geld dat hij daarmee verdiende zet hij nu alweer enige tijd in voor het soort politiek dat in Amerika en steeds vaker ook bij ons ‘conservatief’ wordt genoemd. Met als voorlopig dieptepunt dus zijn betrokkenheid bij de Amerikaanse verkiezingen. Waarbij het niet in eerste instantie gaat om welke richting hij die verkiezingen op heeft willen duwen, maar dat hij kennelijk denkt dat je dat op deze manier kunt doen: door het rationele debat over te slaan en bij miljoenen in te spelen op allerlei drijfveren waarvan ze zichzelf nauwelijks bewust zijn.

Wat je uit Mercers leven en werk in ieder geval kunt afleiden is dat zijn methode kennelijk werkt, al is hij niet volmaakt. Toegepast op de taal heeft hij de beste automatische vertaalcomputers opgeleverd die er zijn, al maken die nog steeds soms malle fouten. Toegepast op de financiële markten heeft het Mercer enorm rijk gemaakt en mogelijk bijgedragen aan de grote crash van 2008. Toegepast op de politiek heeft het de Amerikaanse verkiezingen mogelijk op een subtiele manier gemanipuleerd, al weten we natuurlijk momenteel nog lang niet of de uitslag zonder die manipulaties niet precies hetzelfde was geweest. Hoe dan ook zou je vanuit Mercers overtuiging kunnen denken dat alle onvolmaaktheden alleen voorkomen dat er misschien nog niet genoeg gegevens zijn gevoerd aan de zelflerende computers.

Wapenen

De filosofie die achter deze manier van werken zit zegt dat de mens een gegevens verwerkende machine is: je gooit er deze of gene data in, en dan komen er aan de andere kant weer data uit die gebaseerd zijn op wat je erin gooide. Woorden in de ene taal erin, woorden in een andere taal eruit. Cijfers over de beurs erin, beursgedrag eruit. Statusupdates erin, een stembiljet eruit. In het wereldbeeld van Mercer is de mens zo manipuleerbaar als een computer.

Dit mensbeeld blijkt in ieder geval tot op zekere hoogte in de praktijk toepasbaar. Het lijkt mij op zijn minst ongewenst dat kennis daarover in handen blijft van (rijke) enkelingen, die daarmee grote groepen mensen weten te manipuleren in hun eigen voordeel. Organisaties als de ACL moeten daarom, vind ik, hun verantwoordelijk nemen: zorgen dat er meer voorlichting komt over dit soort methodes. Waarom werkt het? Wat zegt dat over ons?

Bovendien heeft die organisatie tal van leden die deze technologie beheersen en het beste voorhebben met de mensheid. De computertaalkundigen die ik ken zijn misschien wel de aardigste, de beschaafdste en de meest ontspannen van alle taalkundigen, die hun werk ook vaak doen uit idealisme:  de wereld beter maken voor de mens door ons door computers beter te laten helpen. Ik hoop dat zij snel van zich laten horen. Hoe moeten burgers ermee omgaan? Wat moeten ze erover weten? Hoe kan de individuele mens, hoe kan de democratie zich ertegen wapenen?

  1. 1

    Ik vind met name de opmerking van Bannon wel heel interessant (toont ook dat de man gewoon intelligent is), namelijk dat politiek zich heden ten dage voor een belangrijk deel afspeelt als een functie van ‘mode’. Wat ik ook al jaren roep: de meeste mensen geven niets om de meeste politieke issues maar zullen, indien naar zo’n issue gevraagd, het antwoord geven waarvan zij denken dat het sociaal wenselijk is. En sociale wenselijkheid wordt heden ten dage voor een belangrijk deel bepaald door hoe de wolven huilen op Facebook en whatnot.

    En dan nog dit: The Guardian en The Observer stonden gisteren geel-gloeiend te ronken over deze ‘onthullingen’, maar behalve een long-read human-interest interview met een enigszins seksueel verwarde jongeman kon ik niet opmaken dat en of er hier nu iets illegaals gebeurd was. Volgens mij iig niet.

  2. 2

    @1

    Als nergens wordt gemeld dat het illegaal is, zal het dus wel niet illegaal zijn. So what?

    Volgens mij is het idee van een democratie dat mensen volksvertegenwoordigers en/of leiders kiezen die opkomen voor hun belangen en opvattingen. En dus niet dat politici en/of partijen met alle mogelijke middelen en trucs stemmen proberen binnen te harken, zolang het maar niet illegaal is. Democratische principes zouden wel wat verder mogen gaan dan alleen maar je aan de wet houden. Maar daar heeft wat tegenwoordig doorgaat voor conservatief niet zo veel boodschap aan, zo blijkt regelmatig.

  3. 3

    @2: Obama kreeg niks dan lof voor hoe hij het Internet en de sociale media had leren bespelen tijdens de verkiezingen van ’12. Wat jij wil is een oncontroleerbare fantasie.

  4. 4

    Obama voerde openlijk campagne via sociale media en deed dat erg handig. Daar kreeg hij lof voor. Dat is iets totaal anders dan sociale media gebruiken voor stiekeme trucs om verkiezingen te beïnvloeden.

  5. 5

    @4: Hij deed dat dermate handig dat hij al snel een Nobelprijs voor de Vrede kreeg. Helaas bleek dat een tikje voorbarig, want geen president vóór hem voerde zo lang oorlog – en bovendien in in totaal zeven verschillende landen. Voor de praatjes van Obama hebben de Amerikanen weinig gekocht – integendeel.

    Daartegenover staat Trump, die zich weliswaar pleegt te uiten als een onbehouwen hork maar ondertussen de Amerikaanse economie en de vrede grote diensten heeft bewezen.

  6. 6

    @5:
    “Daartegenover staat Trump, die zich weliswaar pleegt te uiten als een onbehouwen hork maar ondertussen de Amerikaanse economie en de vrede grote diensten heeft bewezen.”

    WTF ? In welke sprookjeswereld leef jij eigenlijk ?

    O, w8 … natuurlijk in de sprookjeswereld die zorgvuldig voor je is geschapen door Mercer et. al. …

  7. 7

    Cambridge Analytica gebruikt(e) niet de taalkundige algoritmen van Mercer, maar veel meer de modernere “big data” gereedschappen zoals diepe neurale netwerken. Het ergste is misschien wel dat een Phd van Cambridge (UK) zijn als waarschuwing bedoelde Proof of Concept in de praktijk zag gebracht door een bedrijf in Cambridge (US).