Oproep: help mee om inzicht in stemmingen te krijgen

Hoe stemmen Kamerleden en partijen eigenlijk over onderwerpen die we belangrijk vinden? Is de VVD liberaal? Stemt de PVV nu economisch rechts of links? In hoeverre is de PvdA de laatste vijf jaar van kleur verschoten? Wie is de grootste draaier als het op Europa aankomt?

Dit zijn belangrijke en ogenschijnlijk simpele vragen, maar vreemd genoeg zijn de antwoorden moeilijk te achterhalen. Het stemgedrag van partijen wordt weliswaar bijgehouden in de officiële bekendmakingen, maar je moet een politieke of juridische junkie zijn om er chocola van te maken. Laat staan dat je de vele data kunt analyseren en interpreteren. Politix.nl en Sargasso willen daar iets aan doen en daar hebben we jouw hulp bij nodig.

Wat willen we? 

Politici beloven heel wat, in verkiezingsprogramma’s, in de Tweede Kamer en in de media. Maar wat maken ze ervan waar? Deze vraag is te beantwoorden door stemmingen in de Tweede Kamer te analyseren. Ook is op basis van stemmingen te achterhalen wie nou daadwerkelijk de grootste gedoogpartij is (wie stemt er met wie mee?). In hoeverre zijn partijen van standpunt veranderd door de jaren heen? Stemmingen vormen een belangrijke informatiebron over het doen en laten van onze volksvertegenwoordigers en voeden een feitelijke discussie over politiek.

Meer inzicht hoe Kamerleden stemmen geeft beter inzicht in de prestaties van onze volksvertegenwoordiging. Dat inzicht ligt binnen handbereik, maar we hebben hulp nodig een database met wetsvoorstellen en stemmingen aan te vullen.

Wat hebben we er voor nodig? 

Op Politix.nl zijn alle wetsvoorstellen en amendementen waar sinds januari 2003 over gestemd is in begrijpelijke taal opgeschreven. In de database zit daarnaast ook wie voor en tegen gestemd heeft en er is een boel mooie metadata zoals thema’s waaronder wetsvoorstellen vallen, wie een wetsvoorstel heeft ingediend en wanneer. Op basis van deze database kunnen we eerder genoemde vragen beantwoorden.

De database is helaas wel verouderd. Om bovenstaande verhalen te kunnen maken en om Politix nieuw leven in te blazen, zijn we op zoek naar vrijwilligers om het gat in de data samen met ons op te vullen. Met een flinke ploeg is dat zo gebeurd.

Wie heeft er zin in een middagje data invoeren om zo te helpen een beter inzicht in het doen en laten van onze volksvertegenwoordigers te krijgen? Op zaterdag 28 januari gaan we met een groep hiermee aan de slag.

Locatie: het kantoor van Sargasso in Amsterdam. Je hulp is zeer gewenst. Wij zorgen voor een hapje en een drankje. Ben je van plan te komen? Meld je dan even aan via info at sargasso punt nl.

  1. 1

    Je kunt toch een programmaatje schrijven in PHP (curl) waarmee je de database leegtrekt en de gegevens in je eigen db zet? Hoef je zelf niets in te voeren. Een ervaren php-er schrijft dat in een of twee dagdelen. Heb het zelf eens gedaan met de sociale kaart van het min sz. Kostte alleen wat langer tijd omdat ik niet zo veel ervaring met PHP heb maar ik haalde er wel alle gegevens uit van alle gemeenten in NL.

  2. 2

    Je schrijft een script in PHP dat van de bibliotheek PHP Curl gebruikt maakt. Het script bezoekt de webpagina van Politix, leest per in stemming gebracht voorstel de gegevens in en dumpt ze in de db van Sargasso (die zo is ingericht dat je er later wat mee kunt). Als het script eenmaal loopt gaat de rest vanzelf. En verder is het lachen geblazen.

  3. 3

    We willen de database van Politix niet leegtrekken, maar juist vullen. Dan krijgen wij een kopietje waar we een redactieslag op uit kunnen voeren. In de database moeten wetsvoorstellen (in begrijpelijke taal) en stemmingen ingevoerd worden. Dat gaat helaas niet automatisch.

  4. 4

    @3:

    Laat in die redactieslag dan wel een hele flinke compensatie voor ten eerste ons coalitiestelsel en ten tweede voortschrijdende kennis of inzicht meewegen. Anders is een database als dit alleen maar koren op de molen van het populisme: “Kijk, ze zeggen A maar doen B! Schande!”

    Als echter de coalitiegenoot van een regerende A-zegger een B-zegger is, is het natuurlijk zomaar mogelijk dat de voorheen A-zegger nu B zegt als onderdeel van een uitruil op weer een ander onderwerp. Zo werkt ons politieke systeem.

    Een compensatie hiervoor in de interpretatie van de verzamelde gegevens zou ten eerste een overzicht van al zulke afspraken nodig maken, zowel die uit het coalitieakkoord als degenen die lopende de periode gemaakt worden, ten tweede een methode moeten ontwikkelen ter weging van de relatieve zwaarte van de individuele afspraken, en dan ten derde stemmingen over die (en aanpalende) onderwerpen voor een percentage bepaald door die zwaarte buiten beschouwing moeten laten van de representatie van de gegevens.

    Daarna hebben we alle onderwerpen waarbij de uiteindelijke positie van een partij verandert omdat onderzoek ter voorbereiding van een daadwerkelijke wet bijvoorbeeld uitwijst dat het oorspronkelijke standpunt gebaseerd was op onjuiste aannames, of misschien niet eerder in overweging genomen nadelen op een ander vlak met zich meebrengt, of …

    … of anders gezegd: stop er maar mee. Dit soort naïeve pogingen om de complexe werkelijkheid te vangen in simpele grafiekjes is vooral dienstig aan precies die infantilisering van het politiek discours die we wat mij betreft vooral het laatste decennium toch reeds als ons meest ernstige probleem kunnen beschouwen.

  5. 5

    @3:

    Laat in die redactieslag dan wel een flinke compensatie voor ten eerste ons coalitiestelsel en ten tweede voortschrijdend kennis of inzicht meewegen. Anders is een database als dit alleen maar koren op de molen van het populisme: “Kijk, ze zeggen A maar doen B! Schande!”

    Als echter de coalitiegenoot van een regerende A-zegger een B-zegger is, is het natuurlijk zomaar mogelijk dat de voorheen A-zegger nu B zegt als onderdeel van een uitruil op weer een ander onderwerp. Zo werkt ons politieke systeem.

    Een compensatie hiervoor in de interpretatie van de verzamelde gegevens zou ten eerste een overzicht van al zulke afspraken nodig maken, zowel die uit het coalitieakkoord als degenen die lopende de periode gemaakt worden, ten tweede een methode moeten ontwikkelen ter weging van de relatieve zwaarte van de individuele afspraken, en dan ten derde stemmingen over die (en aanpalende) onderwerpen voor een percentage bepaald door die zwaarte buiten beschouwing moeten laten van de representatie van de gegevens.

    Daarna hebben we alle onderwerpen waarbij de uiteindelijke positie van een partij verandert omdat onderzoek ter voorbereiding van een daadwerkelijke wet bijvoorbeeld uitwijst dat het oorspronkelijke standpunt gebaseerd was op onjuiste aannames, of misschien niet eerder in overweging genomen nadelen op een ander vlak met zich meebrengt, of …

    … of anders gezegd: stop er maar mee. Dit soort naïeve pogingen om de complexe werkelijkheid te vangen in simpele grafiekjes is vooral dienstig aan precies die infantilisering van het politiek discours die we wat mij betreft vooral het laatste decennium toch reeds als ons meest ernstige probleem kunnen beschouwen.

  6. 7

    Goh, en die laatste alinea vind ik nu net de veruit meest ter zake doende.

    Maar #4 mag inderdaad weg; die landde in het spamfilter, waarschijnlijk doordat de naam “Ren” een nieuweling-regel liet aanslaan of zo. Ik repareerde het zelf door de naam te verbeteren en verwachtte dat de spam-queue voldoende ongeautomatiseerd zou zijn om het reeds geplaatst zijn van de reactie wel te laten opvallen.

    Hoe on-topic eigenlijk. Een mens had dat meteen gezien, maar als iets eenmaal is gevangen in de regels van een computer…

  7. 8

    @4 opbeurend… ik ben persoonlijk erg geinteresseerd in wat de partij waar ik op heb gestemd daadwerkelijk heeft gedaan. Dat ze reden hebben om ergens op te stemmen, prima, dat kan. Maar bij sommige onderwerpen ben ik strikter dan bij andere.
    Als je zo bezorgd bent, help dan mee…

  8. 9

    Ik kijk wel beter uit, want vind tot nu toe het hele concept data-journalistiek steeds op dezelfde manier inherent gebrekkig.

    De producten van data-journalistiek leveren een excuus om nadenken te vervangen door kleurige grafiekjes, in die automatische en zeer moeilijk te weerstane associatie met zogenaamd niet mis te verstane objectiviteit die “rauwe data” nu eenmaal oproept bij mensen.

    Ik heb dit commentaar eerder geplaatst, in reactie op een kop van jou

    https://sargasso.nl/archief/2011/01/09/party-positions-the-movie/#comment-468026

    Jouw kop, “PvdA blijkt inderdaad windvaan”. Mijn kop “PvdA blijkt betrouwbare coalitie-partner”. De relatieve zinnigheid van die beider koppen laat ik graag aan iedereen persoonlijk over — waar het mij om gaat is dat de visueel interessante representatie jou ertoe verleidde om de makkelijkste conclusie te formuleren terwijl je de zaken na enig nadenken over de data zelf (en dus niet de representatie) toch echt genuanceerder kunt zien.

    Dat is het effect dat data-journalistiek heeft: het nog verder uitschakelen van een besef van non-objectiviteit en daarmee het promoten van een dom en simplistisch wereldbeeld.

  9. 10

    Rene, maak je niet de fout om slechte datajournalistiek te verwarren met datajournalistiek? De laatste jaren zijn er zulke goede voorbeelden van datajournalistiek. Eigenlijk is de actie van de SP om te kijken hoe de PVV opkomt voor de Henk en Ingrid ook een vorm van datajournalistiek (voor pr, dat wel).

  10. 11

    een genuanceerd standpunt. gek dat je dan zo zwartwit over datajournalistiek oordeelt. het is nieuw. het is moeilijk. ja er worden fouten gemaakt. maar het is niet meer dan normaal dat een informatie intensief bedrijf als journalistiek ook nieuwe bronnen aanboort. dat kun je bij voorbaat mopperend afdoen als onzinnig maar de tijd dat hd in je rookstoel de avondcourant liet vertellen hoe de wereld in elkaar steekt is toch echt voorbij. het is een begin. we leren. en hopelijk kunnen we na verloop van tijd mooie nieuwe inzichten bieden.

  11. 13

    @ Frank:

    Rene, maak je niet de fout om slechte datajournalistiek te verwarren met datajournalistiek?

    Ik denk van niet. Als datajournalistiek de journalistieke methode is die via grafische representatie van data een verhaal poogt te vertellen, dan is mijn bezwaar tegen die methode dat grafische representaties veel te makkelijk verleiden tot gemakzuchtige conclusies, of nu het proces van totstandkoming van het datajournalistieke eindproduct volgens de regelen der datajournalistieke kunst gaat of niet.

    De intellectuele verleiding van een grafiek is de gedachte dat je in slechts één makkelijke stap inzicht in een bepaalde relatie verkrijgt, maar (zeker) in systemen van menselijke interactie zoals de politiek zijn relaties tussen grootheden zelden op slechts één manier te duiden en is het nog steeds gewoon de eigen bias die de gewenste duiding kiest. In datajournalistiek nog wat beter verborgen voor zowel de producent als de consument dan in andere vormen van journalistiek echter: “Je ziet het toch zelf! De data liegt niet!”.

    Windvaan of betrouwbaar? Zoals ik daar ook al zei, volgens mijn bias vooral windvaan maar de wijze waarop een dergelijke representatie mij verleidt om niet eens meer verder te denken, in een comfortabele zelf-voldane illusie van overzicht, vind ik gevaarlijk.

    Dus, nee, ik vind het een inherent probleem van de methode, niet een verschil tussen een goede of slechte toepassing ervan.

  12. 14

    @ Frank, #12:

    Merk op, dat is iets heel anders. Ik heb uiteraard geen bezwaar tegen het baseren van een journalistiek verhaal op data en ben met je eens dat het veel meer dan het momenteel het geval is moet gebeuren.

    Dat is niet wat datajournalistiek is echter. Datajournalistiek is het vertellen van een verhaal aan de hand van grafische representatie van data en het is mijn bezwaar dat een dergelijke presentatie verleidt tot gemakzuchtige conclusies.

  13. 15

    Rene, dank, dat is een heldere onderbouwing.
    Ik werk zelf wel eens met multidimensionale data, en de enige manier om daar menselijkerwijs patat van te maken is om de relaties te plotten in twee of hooguit drie dimensies. Bij dergelijke plots probeer ik altijd de onzekerheidsmarges in de gaten te houden en de hoeveelheid variatie die de betreffende dimensie-assen verklaren. Elke methode komt met zijn beperkingen, maar zonder visualisatie zou ik he-le-maal nergens zijn. En dat geldt denk ik voor heel veel mensen.
    Ik zou graag zien dat datavisualisaties zich meer rekenschap geven van variaties in de data en onzekerheden. En dat journalisten het onderscheid tussen (ogenschijnlijke) correlatie en causatie goed maken. Maar als ze dat niet goed doen dan lijkt het me echt een kwestie van slechte datajournalistiek, toch?
    Ik krijg overigens de indruk dat het Sargasso initiatief iets anders is, maar heb dus wat inleeswerk te doen.

  14. 18

    Rene, hier ga je toch echt de mist in. Waar jij over spreekt is datavisualisatie, geen datajournalistiek.

    Datajournalistiek is nog tamelijk diffuus. Het is een modebegrip binnen de journalistiek. Het is nieuw, dus iedereen wil het, maar niemand kan het nog echt.

    Volgens mij is datajournalistiek geen aparte vorm van journalistiek, maar een hulpmiddel bij onderzoeksjournalistiek. Je kunt het, zoals gezegd, gebruiken om nieuwe informatiebronnen aan te boren, vaak tegen een fractie van de kosten en tijd van ‘ouderwetse’ onderzoeksjournalistiek.

    Wat je vervolgens met die data doet, is een ander verhaal. Ik zie zelf visualisaties vooral als hulpmiddel om trends te ontdekken of complexe zaken inzichtelijk te maken, maar daar moet je niet stoppen, dat is tenminste onze filosofie (andere media doen dat wel). Je moet altijd nog doorgaan en expertise van buiten halen om te kijken of de data daadwerkelijk zeggen wat je denkt dat ze zeggen.

    Dat iedere stap in het productieproces wemelt van de onzekerheden is ons bekend. Bij het verzamelen van data: is de bron betrouwbaar? Zijn de data compleet? Wat is de kwaliteit ervan? Bij het bewerken? Hoe bewerk je het en wat betekent dat voor de integriteit van de data? Kun je verschillende data zomaar samenvoegen? Klopt je verwerkingsmethode? Bij het interpreteren: trek je niet te snelle conclusies? Ook hier, klopt je methode? Bij het visualiseren: is de vorm waarvoor je kiest wel de beste? Is het duidelijk? Komt alle data, ook de outliers, etc. goed tot hun recht? En vervolgens bij het verhalen schrijven: schrijf je niet teveel naar een conclusie toe?

    We werken tamelijk transparant hierin. Als we data niet vertrouwen, maar wel gebruiken, zetten we dat erbij.

    Daarnaast doen we ook simpele datadingetjes, gewoon wat cijfers op een rij zetten, wat meer luchtige verhalen schrijven. We claimen, volgens mij, niets wat we niet kunnen hardmaken.

    Een ander punt, wat meer op metaniveau, als je 100 procent betrouwbaarheid wilt, kun je dit blog en zo’n beetje alle andere media wel opdoeken. Dan gaan we gewoon gezellig met zijn allen voor de open haard zitten en wetenschappelijke artikelen doorlezen. Het blijft journalistiek, verhalen vertellen, met alle tekortkomingen, maar ook alle narratieve kracht die erbij horen.

  15. 19

    @ Dimitri:

    Simpelweg nee, sorry. Datavisualisatie is het enkele proces van het creëren van een grafische representatie van data. Datajournalistiek is, zoals ik zei, het vertellen van het verhaal aan de hand van dergelijke representaties. Dat is de definitie die algemeen wordt gebruikt.

    Wat ik er mee mis vind heb ik nu reeds een paar keer verteld en heeft niets te maken met je afsluitende punt. Het gaat niet over “betrouwbaarheid” an sich. Niet van de data en niet van de representatie ervan, zelfs niet van objectiviteit van de journalist. Het gaat over de inherente eigenschap van tabellen en grafieken te verbergen dat (in niet in ook maar enige mate compleet modeleerbare systemen zoals die aangaande menselijke interactie) een “evident” visueel verband een verband is dat alleen in z’n volle visuele rechtlijnigheid bestaat zodra je alle andere factoren dan degene die je wilde beschouwen reeds van beschouwing hebt uitgesloten.

    Tel daar nog bij op dat in datajournalistiek hetgeen je als journalist wilt beschouwen ook nog eens inherent beperkt wordt door datgene dat ter geautomatiseerde analyse beschikbaar is. Dat er specifiek nooit zoiets onquantificeerbaars als “motivatie” meegenomen kan worden in de analyse en je bent aangekomen bij mijn stelling dat datajournalistiek op inherente wijze een onzinnig (en wat mij betreft soms gevaarlijk) gesimplificeerd wereldbeeld promoot.

    Datajournalistiek zou inderdaad geen aparte vorm van journalistiek horen te zijn. Verzamelen en analyseren van data als regulier hulpmiddel om tot een verhaal te komen, en in die zin geen eind- maar halfproduct. Het expliciete construeren van het verhaal langs de lijnen van de data zal het vaker wel dan niet nog minder relatie met enig objectiveerbare werkelijkheid laten onderhouden dan wanneer een journalist zichzelf de vrijheid geeft om na te denken, in plaats van “de data voor zichzelf te laten spreken”. Een plaatje is duizend onwaarheden waard.

  16. 20

    Ik neig een klein beetje naar Rene’s standpunt, vooral wat dit specifieke onderwerp betreft. Het idee dat je een vraag als

    Is de VVD liberaal?

    met tabellen en grafieken veronderstelt dat jij als journalist al precies weet wat “het liberalisme” inhoudt. Terwijl het interessante punt in de politiek zou moeten zijn: hoe geven wij in deze tijd invulling aan liberalisme/socialisme/christen-democratie/etc.

  17. 21

    Dat klopt, maar je meest ter zake doende deel slaat de plank dusdanig mis dat het beter genegeerd kan worden. Ik ben met #8 eens dat ik liever wél van een partij kan achterhalen wat ze precies gestemd hebben bij welk voorstel. Ik vind dat in tegenstelling tot jou namelijk wel belangrijk. Ik word overigens wel heel benieuwd hoe jij dan je keuze maakt bij verkiezingen, want je wilt gewoon helemaal niet weten wat de partijen van hun verkiezingsbeloftes waar (willen) maken.

    Ik ben als consument volwassen genoeg om te kunnen bedenken dat coalitiepartijen soms water in de wijn moeten doen en van de andere kant wil ik weten wanneer ze dat doen, want sommige van mijn standpunten zijn nogal principieel en daar moet een partij dus in meegaan met mij ongeacht coalitiedeelname, wil ze mijn stem bij de volgende verkiezingen nog krijgen.

  18. 22

    Nee, datajournalistiek is niet hetzelfde als plaatjes maken. Dat is een aparte stap, datavisualisatie.
    Je kan heel goed datajournalistiek bedrijven en geen plaatjes maken.
    Mooi voorbeeld van datajournalistiek is van de journalist van de NYtimes die in de marathondata (alle metingen van de renners van alle tussenstations) ging graven en zag dat de winnaar van de categorie 65plus een heel afwijkend patroon qua tussentijden had. Dat bleek fraude. Hij had de chip aan iemand anders gegeven en ging zelf met de metro en deed het laatste stuk weer mee. De echte winnaar (nummer twee dus volgens de uitslag) was iemand die net kanker had overwonnen.
    Leverde een stevig schandaal op en aanpassing van de regels.
    Dat is ook datajournalistiek.

    Maar het is wel een heel nieuw veld waarin journalisten nieuwe vaardigheden moeten leren en er ook nieuwe kwaliteiten binnen de redacties gehaald moeten worden.
    Maar juist omdat het nog relatief vers is, is het lastig om al een oordeel te vellen.
    Een van mijn producties over een specifiek onderwerp (privacy) en de stemmingen vind je hier:
    https://sargasso.nl/archief/2009/12/02/kstn-privacy-stemgedrag-per-partij/#overzicht

    En voor veel VVD leden was het een eye-opener dat hun “liberale” partij zo’n slecht trackrecord had op dit onderwerp.
    Gewone journalistiek (gericht op losse onderwerpen/incidenten) had dit nooit boven tafel gekregen.

  19. 23

    Zie mijn eerdere reactie over de VVD hierboven.
    En nee, het is geen absoluut oordeel. Maar wel een startpunt van een discussie. Zonder die onderbouwing van wat harde feiten blijft veel van het werkelijke gedrag van politici en partijen onderbelicht.
    En dan kiezen de meeste mensen op basis van aannames ipv de werkelijkheid.
    De partijen zijn prima in staat om uitleg te verstrekken nadat je iets naar boven hebt gehaald wat niet lijkt te stroken met hun standpunten.

  20. 24

    @ JSK/20, ik stel me zo voor dat het type vragen dat je met dit initiatief kunt beschouwen niet is als “Is de VVD liberaal?” maar meer zoiets als: de VVD belooft minder regeldruk, maken ze dat waar?
    @ Rene, even los van de discussie vond ik jouw opmerking over het gezwabber van de PvDA versus de consistente trouw van de PvdA aan coalities erg goed en een voorbeeld van hoe voorzichtig je moet zijn met conclusies en vooral ronkende koppen.
    Overigens loopt de Politix website bij mij na een paar klikmomenten steeds vast. Hebben anderen dat ook?

  21. 25

    Bij mij werkt die site ook niet goed.
    Rene is hier wat te nihilistisch naar mijn smaak. JSK wil een ander narrative, prima. Het manke van z’n opmerking is dat ‘Is de VVD liberaal’ en ‘hoe geven wij in deze tijd invulling aan liberalisme/socialisme/christen-democratie/etc’ niet onafhankelijk zijn, beide bevatten de genoemde partij.
    Ik vind het een mooi initiatief, met als kanttekening dat je je natuurlijk wel moet realiseren dat je hier mee niet de wereld kunt bewijzen. Zeg maar; vinden en vertellen versus je eigen pet-project verkondigen.

  22. 28

    Met data analyse kun je aantonen dat de VVD heel vaak om staatsingrepen vraagt, dus alleen liberaal zijn als het ze financieel goed uit komt.
    De staat moet wegen bouwen van de vvd
    De staat 130 miljoen uitgeven om een deel van de extra vervuiling van 130 km te compenseren