Een grotere hooiberg alstublieft

ACHTERGROND - Het DNA-onderzoek dat de moordenaar van Marianne Vaatstra onthulde, noopte twee kwaliteitskranten ertoe te pleiten voor een landelijke database met DNA-profielen van alle Nederlanders. Dirk Janssen onderzocht voor Apache of dat een goed idee is.

De moord op Marianne Vaatstra werd pas dertien jaar na dato opgelost omdat het voorheen niet mogelijk was een DNA-screening te doen. In 1999, toen de moord gepleegd werd, was dat volledig handwerk. In 2012 was grootschalig DNA-onderzoek mogelijk en leverde het -zoals bekend- een match op met een lokale boer, Jasper S., die inmiddels bekend heeft.

Het succes van de DNA-screening leidde tot verschillende oproepen tot een landelijke DNA-database, onder andere door NRC-columnist Steven de Jong en Volkskrantredacteur Maarten Keulemans. Want daar kun je boeven mee vangen, was het argument.

Database

Voorstanders van een landelijke database voeren het argument aan dat je uit forensische DNA-analyses geen persoonlijke kenmerken kunt aflezen. Dat klopt.  Dit is geen DNA-analyse die in kaart brengt welke genen iemand heeft en vervolgens concludeert dat het gaat om iemand gaat met zwart haar, bruine ogen, aanleg voor sikkelcelanemie en een haakneus, dus dat het wel een asielzoeker zal zijn.

Het is wat minder geavanceerd dan dat. Forensische DNA-analyse meet de lengte van verschillende stukken DNA (een “locus”) die bij iedereen voorkomen. Omdat de lengte van die stukken per persoon verschilt ontstaat er een persoonsspecifieke “streepjescode”, ook wel een DNA-profiel genoemd. Dat DNA-profiel is praktisch uniek, tenzij je met een eeneiige tweeling te maken hebt. Je kunt er wel in aflezen of iemand familie is, want dan heb je waarschijnlijk een aantal identieke stukken uit een gemeenschappelijke voorouder. Maar verder is het privacy-argument dus niet erg relevant.

Wel relevant is de vraag naar de capaciteit van DNA-onderzoek. In het DNA-onderzoek naar de moordenaar van Marianne Vaatstra had het Nederlands Forensisch instituut zes maanden nodig om 8080 mannen te screenen. Met die capaciteit zou het ongeveer 2000 jaar duren om de volledige Nederlandse bevolking van 17 miljoen in een DNA-database op te nemen. In het Verenigd Koninkrijk zijn ze een dergelijke database gestart in 1995, en die bevat nu DNA-profielen van 6 miljoen mensen.

Het idee van De Jong en Keulemans vergt dus nogal wat werk. Maar misschien is dat het wel waard.

Om die vraag te beantwoorden is het nodig om te weten hoe nauwkeurig DNA-onderzoek is. Want een honderd procent nauwkeurige test bestaat niet. Soms komen onschuldige mensen toch als match uit DNA-onderzoek. Hoe minder dit gebeurt, hoe groter de groep is waaruit je effectief een dader kunt vissen. De nauwkeurigheid van DNA-screening bepaalt of een landelijke database de forensische wetenschap echt helpt, of dat het bij de spreekwoordelijke zoektocht naar een speld alleen zorgt voor een grotere hooiberg.

Hoe nauwkeurig is DNA-onderzoek?

Bijna alle onderzoek naar de nauwkeurigheid van forensische DNA-screening gaat over coincidental matches, dat betekent dat mensen toevallig hetzelfde DNA-profiel hebben. De kans dat de moordenaar toevallig een eeneiige tweelingbroer heeft die daarvan niet op de hoogte is, is verwaarloosbaar klein. De kans dat de onwetende tweelingbroer geen ontlastend bewijs heeft, is miniem. Niet nul, wel miniem. De kans dat mensen met verschillend DNA toch hetzelfde DNA-profiel hebben is ook tamelijk klein. Die kans is bovendien te verkleinen door het aantal gemeten loci te vergroten. De huidige standaard in het forensisch onderzoek (Next Generation Multiplex) meet zestien verschillende loci. Dat maakt de kans op een coincidental matches nagenoeg nul.

Thirsa Kraaijenbrink is DNA-deskundige in het Forensisch Laboratorium voor DNA-onderzoek aan het LUMC in Leiden. De vraag hoe nauwkeurig Forensisch DNA-onderzoek is, vindt ze moeilijk te beantwoorden. ‘De nauwkeurigheid van het onderzoek hangt ook af van de kwaliteit van het sample. Als je DNA uit een vingerafdruk op een mes moet halen is dat kwalitatief minder goed dan wanneer je een flinke druppel bloed hebt.’ Je kunt dan simpelweg minder loci meten, en dat maakt de kans op een coincidental match groter.

Fouten

Naast coincidental matches zijn fouten ook van invloed op de nauwkeurigheid van DNA-screening . Een typfout in de rapportage, een vervuild DNA-sample, een verkeerd DNA-sample, dat soort dingen. Dit soort fouten komen voor, alleen blijkt niemand te weten hoe vaak. Thirsa Kraaijenbrink: ‘De kans dat een laboratorium een fout maakt is niet nul, en verder heel moeilijk in te schatten We doen natuurlijk af en toe steekproeven. Maar als daar uitkomt dat we geen fouten hebben gemaakt, is dat nog geen garantie dat we dat elders ook niet hebben gedaan.’

Een van de weinig forensische wetenschappers die onderzoek doet naar de frequentie van fouten is Dr. Jonathan Koehler van de Northwestern University in Chicago.

‘Er zijn in het forensisch DNA-onderzoek geen goede, recente studies die het risico op false positive errors kwantificeren.  In 1992 zei ons National Research Council Report dat DNA-technieken alleen toegestaan zijn als bewijs wanneer de foutenmarge in het bewijs is opgenomen en onderbouwd is door empirische studies. Die eis hebben ze in 1996 laten varen, waarmee de onderzoeksinstellingen ook het nut niet meer zagen om hun eigen fouten onder de loep te nemen. Ik heb wel dingen geschreven over foutenmarges in de jaren ’90, maar niemand weet hoe het is voor de huidige DNA-technieken.’

En dat vindt Koehler jammer, want omdat de kans op coincidental matches zo klein is, bepaalt vooral de foutenmarge de waarde van het bewijs.

‘De zaak van Marianne Vaatstra doet me denken aan de eerste grootschalige DNA-screening in Engeland,’ zegt Koehler. ‘Een bakker, Colin Pitchfork, betaalde iemand anders om namens hem een DNA-sample af te staan tijdens een grootschalige screening in zijn stadje. Hij werd verlinkt en viel alsnog door de mand toen bleek dat zijn DNA overeenkwam met een sample van het plaats delict. Hij heeft bekend en is gestraft.’ Maar het is dus mogelijk om een DNA database te frustreren.

Het NFI

Het DNA-onderzoek in de zaak Marianne Vaatstra is gedaan door het Nederlands Forensisch Instituut (NFI). Het NFI is ooit door De Telegraaf aan de schandpaal genageld omwille van fouten in DNA-onderzoek. Een journaliste van de krant had op basis van een beroep op de Wet openbaarheid van bestuur (Wob) alle geregistreerde fouten in DNA-onderzoek opgevraagd en kwam tot de ontdekking dat dat er nogal veel waren. Het probleem met de berichtgeving in De Telegraaf was dat dit nu precies alle punten waren waarop het NFI haar methodes had verbeterd. Het zijn precies deze fouten die niet relevant meer zijn voor de nauwkeurigheid van het DNA-onderzoek van het NFI, omdat ze opgespoord zijn en effectief verholpen. Op het verzoek om een interview houdt het NFI de boot af. Eerst omdat hun computernetwerk een storing had en persvoorlichter Joes Henneberke daardoor waarschijnlijk geen interview kon regelen voor de deadline van dit artikel. En toen ze hoorde dat er voor dit artikel geen deadline bestond, bedacht de onderzoeker in kwestie dat dit artikel waarschijnlijk gebaseerd zou zijn op verouderde gegevens. Maar als de rioolpers klaarstaat om het NFI bij het vermoeden van een onregelmatigheid door de stront te sleuren is dat te begrijpen.

Thirsa Kraaijenbrink (dus niet van het NFI) heeft daar gelukkig minder last van. Zij, en met haar het hele FLDO, denkt dat een landelijke database vooral problemen oplevert en weinig oplossingen aandraagt. ‘We hebben hier bijvoorbeeld een zaak gehad waarbij we DNA-profielen van veertien verschillende personen hebben gevonden. Als je die allemaal moet gaan opsporen en verhoren heeft dat niet zo veel zin. Daar zitten mensen bij die een week voor de misdaad over het plaats delict zijn gelopen, of mensen die naast het slachtoffer in de trein hebben gezeten en waarvan een haar op de trui van het slachtoffer is blijven hangen. Het is stukken handiger om eerst potentiële verdachten te zoeken en die vervolgens te screenen op eventuele aanwezigheid op het plaats delict.’

Kraaijenbrink wijst er ook op dat criminaliteit in Nederland niet alleen afkomstig is van Nederlanders. Vooral in de georganiseerde misdaad is “criminaliteitstoerisme” niet ongebruikelijk. Een uit Georgië of Albanië ingevlogen huurmoordenaar zit niet in de Nederlandse database.

Jonathan Koehler uit Chicago is wel een voorzichtig voorstander van dit soort databases. ‘Maar dat is eerder gebaseerd op een gevoel dan op expertise,’ zegt hij er bij. ‘Ik denk dat de voordelen van zo’n database opwegen tegen de risico’s en privacy-bezwaren.’ Maar hij heeft wel een probleem met de manier waarop het debat over dit soort projecten wordt gevoerd. ‘Het probleem met het debat is dat er prima redenen zijn om zo’n database wel of niet te hebben. Maar als de ene kant alleen maar blijft hameren op de voor de hand liggende voordelen (boeven vangen en lijken identificeren). En de andere kant op de net zo voor de hand liggende nadelen blijft rammen (privacy, verlies van aanname van onschuld, risico op discriminatie) komen we niet verder. We moeten het debat voeren over hoe die twee tot elkaar in verhouding staan.’

Voor Thirsa Kraaijenbrink geldt ongeveer hetzelfde. ‘In de niet-wetenschappelijke media lees ik dit soort berichten gewoon niet meer omdat de discussie altijd in hetzelfde kringetje ronddraait. Toen ik hoorde dat de Volkskrant en het NRC er weer over begonnen zuchtte ik wat, “oh jee, daar gaan we weer.”‘

Je hebt zojuist een stuk gelezen dat je niet zo snel in de reguliere media zult vinden. De schrijver van dit stuk is doelbewust op zoek gegaan naar feiten die in de discussie zijn overgeslagen en heeft vervolgens gevonden dat deze feiten, de foutmarges in DNA-onderzoek, onbekend zijn. Als je op zoek gaat naar feiten die anderen niet relevant vinden en vervolgens ontdekt dat die feiten er niet zijn, heb je volgens de regels van de journalistiek geen verhaal.

  1. 1

    Tsja, begripsverwarring ligt op de loer in dit soort hoog-specialistische onderwerpen. Gelukkig is het OM niet helemaal achterlijk: http://bit.ly/T684zd

    Het lijkt me overigens niet waarschijnlijk dat een dergelijke databank er komt. Experts zien over het algemeen de problemen zoals in dit artikel wel. Wat een paar journalisten beweren…ach… Alhoewel, politici praten tegenwoordig eerder de media na, dan dat ze naar experts luisteren…

    edit Sargasso: link vervangen door een bit.ly link. de @ in de link (overigens een karakter dat niet in een url hoort voor te komen) brak ons comment-systeem.

  2. 2

    Ik zou graag een bron hebben van dat we in Nederland inderdaad die Next Generation Multiplex (16 loci) gebruiken. Recentelijk las ik namelijk nog een artikel (helaas link kwijt) dat ze in de VS 13 loci, en hier in Europa slechts 11 gebruiken.

    Eén van de basispunten van dat artikel was dat er bij de kansberekening op “collisions” vanuit gegaan wordt dat de loci onafhankelijk zijn van elkaar, en dat er vaak op basis van het materiaal geen compleet profiel gemaakt kan worden, maar slechts een partieel (dus met minder loci). Daarbij, dat de loci onafhankelijk van elkaar zijn is een aanname die hoogstwaarschijnlijk onjuist is, wat het “verwaarloosbare” aantal false positives opeens een stuk minder onmogelijk maakt. Zo bleken donkere mensen relatief vaak meerdere loci identiek te hebben.

    Qua partiële profielen zijn er in de vs mensen veroordeeld op 9 loci overeenkomst, terwijl later bleek dat de zogenaamde onmogelijke toevallige overeenkomst in realiteit één op 64.000 was.

    Maar goed, ik kan dus een fout artikel gelezen hebben, maar een hele korte google-zoektocht leverde me geen direct bewijs op dat de Next Generation Multiplex werd gebruikt (maar ook niet van het tegendeel).

    Koehler heeft hier overigens een van de belangrijkste punten te pakken:

    En dat vindt Koehler jammer, want omdat de kans op coincidental matches zo klein is, bepaalt vooral de foutenmarge de waarde van het bewijs.

    Ik vind het vreemd dat hij, ondanks deze zin, toch een voorstander is van zo’n database. Het betekent niets minder dat er straks voor elke “echte” dader meerdere onschuldigen worden opgepakt. En voor die mensen zal de bewijslast hoogstwaarschijnlijk omgekeerd zijn: Schuldig tot het tegendeel is bewezen.

  3. 3

    Wat privacy betreft: persoonskenmerken zijn niet zomaar terug te vinden, maar familierelaties zijn in principe wel te achterhalen. Het zou dan dus niet zo moeilijk moeten zijn om een redelijke lijst te maken van kinderen die niet de biologische kinderen van hun ouders (vader) zijn. Dat lijkt mij een privacy-probleem.

    Wat coincidental matches betreft, als ik http://www.wetrecht.nl/betrouwbaarheid-dna-bewijs/ lees dan gaat het om een kans van 1 op 10 miljoen. Dat is enerzijds ‘nagenoeg 0’ maar anderzijds betekent het dat er in ongeveer elke zaak ook een match komt met een niet-betrokken persoon. Of en hoe groot de kracht van ‘ontlastend bewijsmateriaal’ is is niet eenvoudig in te schatten lijkt me. Maar met heel wat strafzaken per jaar wordt bij een algemene screening de kans op fouten (omdat een toevallige match toevallig geen goed alibi had ofzo) een stuk groter.

    Wat betreft het artikel in de Telegraaf, dat gaat waarschijnlijk over dit artikel? Het NFI heeft daar een reactie (pdf) op geplaatst. Maar daarin komt niet alles aan de orde. Hoewel ik best geloof dat de technische afhandeling van DNA tegenwoordig zeer zorgvuldig kan, ben ik niet overtuigd dat er ook in andere opzichten altijd zorgvuldig gehandeld wordt. Bij het veiligstellen bijvoorbeeld, of het terugrapporteren, bij het juist interpreteren van de resultaten.

    En dat die fouten voorkomen, dat hebben de diverse justitiele blunders wel bewezen. Een stuk bijvoorbeeld over het weghouden van ontlastend bewijsmateriaal in de schiedammer parkmoord (pdf). Op dit moment is de zaak van de 6 van Breda in herziening, waar eveneens ontlastend bewijsmateriaal niet als zodanig in de rechtzaal terecht is gekomen.

    Het is gebleken dat als OM/politie de overtuiging hebben een schuldige te hebben gevonden, de kans bestaat dat ontlastend bewijsmateriaal niet op waarde wordt geschat, mogelijk wordt achtergehouden en dat verklaringen onder druk kunnen worden verkregen. Juist bij bewijsmateriaal dat heel overtuigend gevonden wordt, zoals vingerafdrukken en DNA, kan ook een match die per ongeluk ontstaat tot verdenking en fouten leiden. Of die problemen al net zo goed zijn opgelost als de meer technische kanten, kan ik niet beoordelen. Het lijkt mij reden om erg terughoudend te zijn.

  4. 4

    De bron dat Next Generation Multiplex met 16 loci standaard is is Thirsa Kraaijenbrink van het FLDO. Ze heeft het transcript van het interview voorgelegd aan haar baas.

    Maar dat is dus de standaard. Soms dwingt nood (lees: de kwaliteit van een sample) onderzoekers om met minder loci genoegen te nemen.

  5. 5

    Menselijke fouten bij het opstellen van de database, van wat voor aard dan ook, zijn makkelijk te corrigeren door opnieuw DNA af te nemen van de verdachte. Hierdoor is de kans dat een onschuldige veroordeeld wordt door een menselijke fout in het opstellen van de database miniem. Het is natuurlijk wel mogelijk als de fout gemaakt wordt bij het DNA sample wat op de plaats delict gevonden wordt.

    De kans op coincidental matches is dan ook het grootste probleem, zeker als maar een beperkt aantal loci kan worden gebruikt.