Lies, damned lies, and statistics

ACHTERGROND - Journalisten zouden er goed aan doen de rekenmodellen van bijvoorbeeld het CPB niet kritiekloos te slikken. Maar ook relatief eenvoudige economische indicatoren, die doorgaans eveneens in ‘vertrouwenwekkende’ getallen worden uitgedrukt, geven soms een vertekend beeld van de werkelijkheid.

Woensdagochtend besprak columnist Peter de Waard in de papieren versie van de Volkskrant de grote bezitsongelijkheid die volgens hem in Nederland zou bestaan. Ongelijkheid in bezit of inkomen wordt vaak uitgedrukt in de zogenaamde Gini-coëfficiënt. De Italiaanse statisticus (en tevens fascistisch ideoloog) Corrado Gini (1884-1965) ontwikkelde een wiskundige formule die, als alle vermogens of inkomens in een land gelijk zouden zijn, het getal 0 oplevert. Als slechts één persoon alles bezit of verdient, is de uitkomst het getal 1. Kortom: hoe hoger de Gini-coëfficiënt, hoe groter de ongelijkheid.

Volgens De Waard is de Gini-coëfficiënt voor inkomens in Nederland weliswaar een heel bescheiden 0.21, maar is de Gini-coëfficiënt voor bezit maar liefst 0.82, wat op een wel heel erg grote vermogensongelijkheid zou duiden. Zodoende merkt De Waard op dat ‘als Nederland wil nivelleren […] dat beter [zou] kunnen door de vermogens aan te pakken dan de inkomens.’

Zo op het eerste gezicht lijkt er weinig mis met met deze redenering, maar er zitten de nodige haken en ogen aan. Allereerst omdat er tegenwoordig uiteenlopende manieren bestaan om de Gini-coëfficiënt te berekenen. Volgens Eurostat is de Nederlandse Gini-coëfficiënt bijvoorbeeld 0.26, terwijl de Wereldbank en het CIA World Factbook een getal van 0.31 aanhouden. Een Gini-coëfficiënt geeft dus hooguit een indicatie van de daadwerkelijke ongelijkheid. Een nog serieuzer probleem is dat een Gini-coëfficiënt, door zijn formule-achtige totstandkoming, lang niet altijd een juiste indicatie geeft van de complexe werkelijkheid.

Het is bijvoorbeeld opvallend dat een land als Zweden, toch niet echt een bolwerk van het cowboykapitalisme, Gini-coëfficiënten kent die vergelijkbaar zijn met de Nederlandse. In 2000 kende Zweden namelijk een relatief lage Gini-coëfficiënt van 0.31 wanneer het ging over inkomensverschillen, maar, zodra uitsluitend naar bezit werd gekeken, een erg hoge Gini-coëfficiënt van 0.79. Een belangrijke oorzaak van dit verschil, zo constateerden (pdf) onderzoekers, was het uitgebreide collectieve pensioenstelsel dat in Zweden bestaat. Werkenden dragen immers wel ruimhartig bij aan de publieke pensioenpot, maar bezitten formeel gesproken helemaal niets van al dit spaargeld – tot het moment aanbreekt dat er daadwerkelijk met pensioen wordt gegaan.

In Nederland is iets vergelijkbaars aan de hand. Toekomstige pensioenaanspraken worden niet gezien als bezit. Een groot deel van het Nederlandse particuliere vermogen valt dus buiten de statistieken. Daarnaast is het zo dat veel huizenbezitters dankzij hun hypotheekschuld over een negatief vermogen beschikken. Zolang hoofdsom en verschuldigde rente samen meer bedragen dan de woningwaarde is er immers sprake van een schuld die groter is dan het bezit. Bezitters van een aflossingsvrije hypotheek, waarbij de hoofdsom van de lening niet of slechts gedeeltelijk wordt afgelost, beschikken (in de praktijk) per definitie over een negatief vermogen, terwijl ze toch een (vaak heel aardig) dak boven het hoofd hebben. En laat het nu net dit soort hypotheken zijn dat de afgelopen jaren geleden steeds vaker werd afgesloten.

Kortom: de constatering dat in Nederland de Gini-coëfficiënt voor vermogensverdeling maar liefst 0.82 bedraagt, zegt zonder aanvullende informatie eigenlijk niets. Dat wil echter niet zeggen dat de Gini-coëfficiënt voor inkomensverdeling dan wel altijd een accurate weergave van de werkelijkheid biedt. Er bestaan voorbeelden te over van rijke individuen die dankzij allerlei fiscale trucs formeel gesproken over een te verwaarlozen of zelfs negatief inkomen beschikken. Eigenlijk zou een Gini-coëfficiënt die de consumptieverdeling weergeeft dus het beste zijn. Maar ja, daar ontbreken de benodigde gegevens voor. Er is immers (gelukkig maar) geen enkele instantie die precies bijhoudt wie wat koopt.

Zogenaamd harde cijfers en getallen worden maar al te vaak gebruikt om gewenst beleid van overtuigend klinkende argumenten te voorzien. Dit gebeurt niet alleen bij de overheid, maar ook in het bedrijfsleven en de semi-publieke sector. Echter, zolang niet duidelijk is hoe een bepaald getal precies tot stand is gekomen, is voor belanghebbenden een gezonde achterdocht altijd op zijn plaats.

  1. 1

    Ik las laatst dat de gemiddelde miljonair in Nederland een besteedbaar inkomen heeft van 72000. Aangezien het gemiddelde flink vervuild word door het lage aantal miljonairs en een paar miljonairs met inkomens van tientallen miljoenen, kun je misschien wel stellen dat het gros van de miljonairs net boven modaal zit.

  2. 3

    Het punt met rekenmodellen, vooral als je er beleid op gaat baseren, is dat mensen het model gaan gamen. Was een bepaalde variabele eerst nog wel een prima indicator, een paar jaar na invoering van beleid op meetpunten is je meetmodel niet meer onafhankelijk. Dat wordt alleen nog steeds stelselmatig over het hoofd gezien.

    (Hef je belasting op ramen, dan werk je zeker effectief in de hand dat het aantal belastbare ramen omlaag gaat. Reken je scholen af op cito-score, dan is het duidelijk dat ze hoger zullen scoren op de cito-toets. Betaal je ziekenhuizen per verrichting, dan zullen er veel verrichtingen gedaan worden. De achterliggende zaken (herverdeling van rijkdom, verbetering van het onderwijs of zorg) wordt er niet zomaar door bereikt.)