Quote du Jour | Selectiebias

Iedereen die iets weet van risicoselectie weet dat je alert moet zijn op selectiebias. Cynthia Liem, universitair hoofddocent Kunstmatige Intelligentie aan de TU Delft, reageert op de nieuwste onthulling in de toeslagenaffaire. De Belastingdienst gebruikte een zelflerend algoritme om fraude op te sporen, en dat algoritme selecteerde vooral mensen met een lage inkomen voor controle. Hogere inkomens werden juist ontzien. Volgens de Belastingdienst bleek er ‘een statistisch verband tussen de hoogte van het inkomen en de kans op een (on)juiste aanvraag’. Maar iedereen die claimt te weten iets van risicoselectie te weten, zoals de Belastingdienst, moet dus alert zijn op selectiebias. Volgens Liem wijst de enorme oververtegenwoordiging van lage inkomens op zogeheten selectiebias in het model. Kort gezegd: als het model vermoedt dat bij lagere inkomens meer kans is op fraude, worden vooral die aanvragen gecontroleerd. Dat leidt ertoe dat vooral aanvragen van lage inkomens worden gecorrigeerd. Omdat het model weer getraind wordt met die uitkomsten, wordt er steeds verder ingezoomd op lage inkomens. Hoe die 'feedback loop' uitpakt, legde wiskundige Ionica Smeets twee jaar geleden al goed uit, nadat bekend werd dat de Belastingdienst selecteerde op afkomst. Op basis van een fictief voorbeeld over een ver land waar de huffelpuffers en de ravenklauwen leven concludeerde ze zelf al: zo fictief was haar voorbeeld niet, want je hoeft niet lang te zoeken naar rampzalige voorbeelden van risicoprofielen die vanwege selectiebias leiden tot enorme discrepanties en discriminatie in controles. Als de Belastingdienst dus claimt iets te weten over risicoselectie - anders gebruik je zo'n selectiesysteem immers niet - dan hadden ze geweten van al die niet-fictieve voorbeelden, dan had iedereen die bezig was met zelflerende algoritmen net als Smeets ook gedacht aan het boek Weapons of Math Destruction van Cathy O’ Neill (dat werd gepubliceerd in het jaar dat de Belastingdienst dit risicomodel ging gebruiken: 2016), en dan hadden ze hun zelflerende modellen gecontroleerd op selectiebias. Maar dat deed de Belastingdienst allemaal niet, want hun taak was om mensen te controleren, niet machines.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.

Progressieven vertonen meer bias dan conservatieven

Althans, dat bleek uit een sociaal-psychologisch onderzoek van Jarret Crawford en Lee Jussim.

Maar dat mag je dus niet stellen in wetenschappelijke tijdschriften.

Pas toen ze die conclusie wegpoetsten, werd hun artikel geschikt bevonden voor publicatie.

Waarmee de peer reviewers en de redacties van desbetreffende tijdschriften de bevindingen van Crawford en Jussim fraai illustreren.

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.