Quote du Jour | Selectiebias

Iedereen die iets weet van risicoselectie weet dat je alert moet zijn op selectiebias. Cynthia Liem, universitair hoofddocent Kunstmatige Intelligentie aan de TU Delft, reageert op de nieuwste onthulling in de toeslagenaffaire. De Belastingdienst gebruikte een zelflerend algoritme om fraude op te sporen, en dat algoritme selecteerde vooral mensen met een lage inkomen voor controle. Hogere inkomens werden juist ontzien. Volgens de Belastingdienst bleek er ‘een statistisch verband tussen de hoogte van het inkomen en de kans op een (on)juiste aanvraag’. Maar iedereen die claimt te weten iets van risicoselectie te weten, zoals de Belastingdienst, moet dus alert zijn op selectiebias. Volgens Liem wijst de enorme oververtegenwoordiging van lage inkomens op zogeheten selectiebias in het model. Kort gezegd: als het model vermoedt dat bij lagere inkomens meer kans is op fraude, worden vooral die aanvragen gecontroleerd. Dat leidt ertoe dat vooral aanvragen van lage inkomens worden gecorrigeerd. Omdat het model weer getraind wordt met die uitkomsten, wordt er steeds verder ingezoomd op lage inkomens. Hoe die 'feedback loop' uitpakt, legde wiskundige Ionica Smeets twee jaar geleden al goed uit, nadat bekend werd dat de Belastingdienst selecteerde op afkomst. Op basis van een fictief voorbeeld over een ver land waar de huffelpuffers en de ravenklauwen leven concludeerde ze zelf al: zo fictief was haar voorbeeld niet, want je hoeft niet lang te zoeken naar rampzalige voorbeelden van risicoprofielen die vanwege selectiebias leiden tot enorme discrepanties en discriminatie in controles. Als de Belastingdienst dus claimt iets te weten over risicoselectie - anders gebruik je zo'n selectiesysteem immers niet - dan hadden ze geweten van al die niet-fictieve voorbeelden, dan had iedereen die bezig was met zelflerende algoritmen net als Smeets ook gedacht aan het boek Weapons of Math Destruction van Cathy O’ Neill (dat werd gepubliceerd in het jaar dat de Belastingdienst dit risicomodel ging gebruiken: 2016), en dan hadden ze hun zelflerende modellen gecontroleerd op selectiebias. Maar dat deed de Belastingdienst allemaal niet, want hun taak was om mensen te controleren, niet machines.

Lezen: De BVD in de politiek, door Jos van Dijk

Tot het eind van de Koude Oorlog heeft de BVD de CPN in de gaten gehouden. Maar de dienst deed veel meer dan spioneren. Op basis van nieuw archiefmateriaal van de AIVD laat dit boek zien hoe de geheime dienst in de jaren vijftig en zestig het communisme in Nederland probeerde te ondermijnen. De BVD zette tot tweemaal toe personeel en financiële middelen in voor een concurrerende communistische partij. BVD-agenten hielpen actief mee met geld inzamelen voor de verkiezingscampagne. De regering liet deze operaties oogluikend toe. Het parlement wist van niets.

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.

Progressieven vertonen meer bias dan conservatieven

Althans, dat bleek uit een sociaal-psychologisch onderzoek van Jarret Crawford en Lee Jussim.

Maar dat mag je dus niet stellen in wetenschappelijke tijdschriften.

Pas toen ze die conclusie wegpoetsten, werd hun artikel geschikt bevonden voor publicatie.

Waarmee de peer reviewers en de redacties van desbetreffende tijdschriften de bevindingen van Crawford en Jussim fraai illustreren.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.