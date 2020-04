DATA - Het RIVM is heel druk bezig met hun centrale rol in de aanpak van de coronacrisis. En hoewel ik het, als leek, niet steeds eens ben met de keuzes die ze maken, ben ik wel blij dat er experts aan het roer staan en we in ieder geval een aanpak hebben die lijkt te werken. Dus ik doe mijn best om niet te hard te “zeuren” over hoe het beter zou kunnen. Maar nu we een andere fase in lijken te gaan, is het wel het moment om kritiek te uiten op een punt waar hun expertise kennelijk niet helemaal up to date is. En dat betreft het delen van data.

Hoewel het RIVM schoksgewijs inmiddels aardig gegroeid is in haar rol om de belangrijkste cijfers enigszins begrijpelijk te publiceren en transparanter te worden, verzaken ze structureel in het werkelijk beschikbaar maken van alle data die ze hebben. Voordat ik in ga op de tekortkomingen eerst even uitleggen waarom het belangrijk is dat alle beschikbare data als open data gepubliceerd wordt door het RIVM.



De rol van het RIVM is het bepalen van de beste aanpak in deze crisis, mijns inziens. Een deel van die aanpak bestaat uit het informeren van de bevolking. Maar ze hebben daar geen monopolie op. En het informeren is ook niet hun grootste expertise. In dit land zijn veel mensen (denk aan journalisten en wetenschappers) prima in staat om aan de hand van de gegevens de ontwikkeling te duiden en waarschijnlijk beter uit te leggen aan een breder publiek wat er gaande is. En daarbij ook kritisch moeten kunnen zijn omdat we immers geen onfeilbare instituten of bestuurders kennen in dit land.

Daarnaast is het juist in tijden van grote onzekerheid van groot belang de maximaal mogelijke transparantie te betrachten om niet de indruk te wekken dat je iets verborgen houdt. Er zouden toch zomaar mensen een complot kunnen gaan vermoeden (oh… wacht…). En door niet alle (ruwe) data ter beschikking te stellen en controle houden op de manier waarop de data gepresenteerd, wordt argwaan in de hand gewerkt.

En wat ook gebeurt, is dat anderen de data gaan verzamelen en mogelijk aanvullen. En omdat dat vaak beter beschikbaar is, gaan weer anderen daar op vertrouwen. Terwijl het RIVM eigenlijk de rol moet hebben van zijn van “single point of truth”. Het moet voor iedereen duidelijk zijn wat de correcte en actuele data is.

Komt nog bij dat het volgen van de aanbevelingen heel erg samenhangt met het vertrouwen dat men heeft in een instituut. En zoals bekend, vertrouwen komt te voet en vertrekt te paard. Het is kwetsbaar.

Ontoegankelijk

Goed, dat gezegd hebbende dan nu de kritiek. Dit is de belangrijkste pagina van het RIVM. Deze wordt dagelijks bijgewerkt en bevat aan het einde een link naar een uitgebreid rapport.

Nu is het fijn dat er wat handige grafiekjes in staan en dat je de data uit die grafieken kunt halen. Maar het is dan weer minder leuk als de opzet van die pagina regelmatig wijzigt en het dus niet mogelijk is om die data geautomatiseerd op te halen. Daar komt bij dat er maar van een deel van de gegevens grafieken gepresenteerd wordt. De rest van de data zit in het rapport. Een PDF bestand. Een PDF bestand… waardoor het praktisch gezien noodzakelijk is om iedere dag een aantal tabellen over te typen in een spreadsheet, met risico op fouten. En eigenlijk ook iedere dag weer vraagt om te kijken waar wat staat en of de data nog steeds dezelfde opzet heeft als de vorige dag. Ik kan u vertellen, ik word er gillend gek van iedere dag.

Een klein voorbeeld: gegevens over het testen wordt in een klein tabelletje bijgewerkt waarbij eigenlijk alleen de laatste 10 dagen staan. De periode daarvoor wordt samengevat in 1 getal. Maar met enige regelmaat blijkt die samenvatting niet meer overeen te komen met de totaaltelling van de cijfers uit die periode ervoor die ze eerder presenteerden. Dat komt omdat aanvulling soms tot ver terug gedaan worden. Maar voor mij is het onmogelijk geworden om te bepalen op welke dagen welke correcties zaten en daarmee onmogelijk geworden om een correcte versie van de data te visualiseren en te presenteren aan de lezers.

Dit is echt niet van deze tijd. En het kan echt anders. Heel veel landen bieden structureel alle data aan, soms zelfs via een Github. Heerlijk!

Aanbevelingen

Om een beetje te helpen de volgende stap in 1 keer goed te zetten hier wat aanbevelingen (geef gerust aanvullingen in de reacties, dan pas ik het lijstje aan):

Maak 1 pagina waarvan de URL niet meer wijzigt waarop alle databestanden gekoppeld staan.

Maak voor ieder databestand 1 unieke naam en link aan die blijft bestaan.

Stel de bestanden in een zo plat mogelijk formaat beschikbaar (bv CSV).

Zorg dat de bestanden de volledige historie bevatten. Dus alle data van alle dagen vanaf het begin van meten.

Actualiseer de bestanden op het moment dat nieuwe data beschikbaar is.

Meldt op de pagina wanneer wat geactualiseerd is.

Zet een aparte pagina op met toelichting van alle gegevens en types die gebruikt worden en alle veronderstellingen, mitsen en maren.

Op volgorde van wenselijkheid:

Alle bevestigde gevallen naar meldingsdatum landelijk.

Alle bevestigde doden naar meldingsdatum landelijk.

Alle gegevens over de uitgevoerde tests per dag, landelijk.

Alle gegevens over ziekenhuisopnames (naar ernst, zoals IC) per dag, landelijk.

Alle gegevens over aantal gevallen en aantal doden naar leeftijdsgroep en geslacht, liefst ook weer per dag.

Al het bovenstaande uitgesplitst naar provincie of gemeente (dan rekenen we het wel om naar provincie).

Alle gegevens over onderliggende aandoeningen bij overledenen. Voor alle leeftijdsgroepen en naar geslacht.

Dit alles met voorbehoud dat sommige details mogelijk niet gerapporteerd kunnen worden i.v.m. de regels rondom privacy.

Het RIVM zou er goed aan doen om op basis van bovenstaande een proces in te richten waarmee alle data structureel en duurzaam ter beschikking ter beschikking wordt gesteld. En dat ze daarbij ook aansluiten bij de rest van de open data trajecten binnen de overheid, zoals data.overheid.nl.

Bij voorbaat dank voor uw inspanning in deze.