We moeten het meer hebben over datasolidariteit

Het debat over het delen van persoonsgegevens gaat al te vaak over privacy, menen Daniel Kapitan en Egge van der Poel. Volgens de twee docenten/adviseurs moeten we het meer hebben over de maatschappelijke waarde van data delen, over datasolidariteit. Privacy domineert nog steeds het debat rondom het delen en hergebruik van persoonsgegevens, zoals blijkt uit de discussie rondom het verstrekken van vaccinatiegegevens door het RIVM aan het CBS. Maar privacy is het probleem niet. Maxim Februari schreef tijdens de eerste lockdown al dat het een ‘gruwelijk misverstand’ is om te denken dat databescherming om privacy van een individu gaat. Het gaat niet om een afweging tussen het private belang van privacy en het maatschappelijke belang van – in het geval van COVID – een draaiende economie en een gezonde bevolking. Betrouwbaar data (her)gebruiken Het echte vraagstuk is dat wij als maatschappij zoeken naar een betrouwbare en eerlijke manier om data te gebruiken en hergebruiken als collectief goed. Op Europees niveau wordt gewerkt aan wetgeving die zulk hergebruik van data mogelijk moet maken. Het feit dat de lopende consultatie duizenden pagina’s aan reacties heeft opgeleverd, geeft de complexiteit van het vraagstuk weer. Wel lijkt er consensus te zijn dat geen enkele organisatie, publiek noch privaat, een te grote vinger in de pap zou moeten hebben. Er moet steeds balance of power blijven om misstanden te voorkomen. Inmiddels zijn er veel initiatieven die dit principe omarmen en experimenteren om tot goede spelregels te komen, zoals bijvoorbeeld MFFBAS voor het delen van energiedata voor het vormgeven en uitvoeren van de energietransitie en de coöperatie DataFryslân voor delen van data in de provincie voor beter beleid en effectievere dienstverlening door Friese maatschappelijke organisaties. Solidair zijn met delen van data Het succes van dergelijke samenwerkingsverbanden staat of valt met de vraag hoe solidair we willen zijn met het delen van data. Zijn we echt bereid om onze persoonlijke data te delen, zodat deze gebruikt kunnen worden voor het oplossen van complexe maatschappelijke vraagstukken? Data worden bruikbaarder door ze te delen en te koppelen aan andere data. Door de gegevens van slimme meterkasten te delen kunnen we ons beter voorbereiden op de energietransitie. Door financiële gegevens te delen kunnen we beter zicht krijgen op frauduleuze en witwaspraktijken. En door vaccinatiegegevens te delen kunnen we beter inzicht krijgen in de groepen die het meest kwetsbaar zijn bij een pandemie. Blauwdruk voor datasolidariteit Er is dringend behoefte aan een helder en praktisch uitvoerbaar kader voor datasolidariteit. In een commentaar in The Lancet stellen Prainsack en collega-auteurs een blauwdruk voor die is gebaseerd op drie pilaren 1) faciliteren van goed hergebruik van data; 2) voorkomen en mitigeren van misbruik; en 3) terugvloeien van winsten naar de publieke sector. De bereidheid om data te delen, de eerste pilaar, wisselt sterk. Bij het gebruiken van diensten van bedrijven als Google, Meta of Microsoft lijken veel mensen het niet zo nauw te nemen met privacy, waarschijnlijk omdat je er meteen iets voor terug krijgt, namelijk gratis toegang tot social media of een e-maildienst. Als het gaat om initiatieven als hiervoor genoemd verschijnen er ineens meer beren op de weg (misschien omdat je bij het beschikbaar stellen van jouw data voor maatschappelijke problemen er niet meteen iets voor terugkrijgt). Privacy wordt dan meestal (en helaas) als eerste argument opgevoerd om data niet te delen, terwijl dit niet een echte belemmering is. Er zijn voldoende juridische mogelijkheden om persoonsgegevens te delen en te hergebruiken – via CBS data delen is legaal, wettelijk geregeld. In het geval van de vaccinatiegegevens stelt de Landsadvocaat in een advies dat er zelfs twee juridische redeneringen zijn waarmee het RIVM de data aan het CBS ter beschikking kan stellen, namelijk binnen de wet op het CBS en op basis van de AVG. Na veel vertraging komen de data uiteindelijk dan toch beschikbaar. Wel is er een gebrek aan bestuurlijke instrumenten om hergebruik van data in goede banen te leiden. De wet- en regelgeving is dusdanig complex dat vaak tegenstrijdige uitspraken worden gedaan door juristen. Om dit probleem te adresseren is recentelijk door de overheid een adviesfunctie verantwoord datagebruik ingericht. Datamisbruik voorkomen of afzwakken Voor de tweede pilaar – het voorkomen en matigen van misbruik van data – kunnen en moeten we veel beter gebruik maken van de technologische mogelijkheden om privacy by design te realiseren. We zijn gewend dat data tijdens opslag zijn versleuteld; denk bijvoorbeeld aan encryptie van de harde schijf van de computer. Ook staan wij er niet meer bij stil dat data tijdens transport altijd zijn versleuteld; we werken steeds meer thuis en loggen via een beveiligde verbinding (VPN) in op de online werkomgeving. Een logische vervolgstap is om berekeningen op versleutelde data te doen. In de praktijk gebeurt dit al met nieuwe privacy enhancing technieken zoals secure multiparty computation (MPC). Hiermee is het mogelijk om berekeningen op data uit te voeren zonder dat je de data kunt inzien. Binnen Europa zijn inmiddels voorbeelden waar MPC wordt toegepast voor het delen van persoonsgegevens en andere gevoelige data, zoals bij het bestrijden van mensenhandel. Hoe gaan we datasolidariteit vormgeven? De juridische grondslagen en technologische mogelijkheden vormen dus geen grote uitdagingen. De echte uitdaging is hoe we als samenleving datasolidariteit gaan vormgeven, met name ook hoe we een balans tussen commerciële activiteiten en publiek gefinancierde activiteiten kunnen vinden (de derde pilaar) en hoe we waarborgen kunnen creëren om onbedoelde effecten zoals discriminatie tegen te gaan. Neem bijvoorbeeld de duizenden MRI-foto’s die ziekenhuizen maken. Als een bedrijf deze data wil gebruiken voor het ontwikkelen van algoritmes, dan zouden winsten daarvan terug moeten vloeien naar het zorgstelsel. Dit gebeurt nu niet of nauwelijks. De kosten voor het aanleggen van hoogwaardige datasets worden collectief gedragen, terwijl de winsten voor commerciële bedrijven zijn. Dat het ook anders kan laat Barcelona zien. De drie pilaren van datasolidariteit vereisen dat we het debat over het delen van persoonsgegevens niet meer laten kapen door discussies over privacy. In plaats daarvan moeten we de dialoog aangaan over de waarde van het delen van data voor het oplossen van maatschappelijke vraagstukken en de randvoorwaarden die daarvoor vervuld moeten worden. Afweging tussen risico en maatschappelijke waarde Hier is een helder en verbindend verhaal nodig, waar in begrijpelijke taal technische mogelijkheden en gezamenlijke belangen worden verenigd. Waar een afweging tussen risico en maatschappelijke waarde wordt gemaakt. Extra toezicht, zoals het voorstel om de rol van algoritmewaakhond bij de Autoriteit Persoonsgegevens (AP) te beleggen, gaat daarbij niet helpen. De AP is vooral gericht op bescherming van persoonsgegevens (de eerste pilaar), waarmee het belang en inhoud van de andere twee pilaren onder druk komt te staan. Wat wel werkt is dat organisaties in het maatschappelijk middenveld, zoals bijvoorbeeld Dutch Hospital Data en Health-RI, die in de zorg data verzamelen en beheren voor zoveel mogelijk hergebruik, hun rol pakken om op een organische en decentrale manier invulling te geven aan datasolidariteit. Wij roepen hen op om een coalitie te vormen met partijen die investeren in privacy enhancing technieken om de patstellingen te doorbreken die nu vaak ontstaan rond data delen voor maatschappelijke vraagstukken. Dit artikel verscheen eerder bij Sociale Vraagstukken. Daniel Kapitan is adviseur, datawetenschapper en docent aan de TU Eindhoven. Egge van der Poel is adviseur en als docent verbonden aan de TIAS Business School. Hij is auteur van het boek Geheelmeesters, 2022.

Foto: Frans Vandewalle (cc)

Volkstelling

Komt allen tezamen, horen wij de engelen zingen. En waar komen wij dan allen tezamen? In de bevolkingsteller van het CBS. Op moment van schrijven (woensdag 23 dec, 21:08 u.) waren wij in Nederland met 17.473.677 mensen tezamen. Toch nog zo’n 0,22% van de wereldbevolking.

Eén van de verhalen over de herkomst van onze Kerstviering is dat Jezus in een stal werd geboren, toen zijn ouders in Bethlehem waren om zich te laten registreren voor een volkstelling.

Nepnieuws is van alle tijden

Let wel: dat is één van de verhalen. Op zijn eigen weblog legt onze collega Jona uit dat alleen al in de Bijbel er minstens twee verschillende versies zijn. De twee auteurs hebben “een manier verzonnen om de geboorte te laten plaatsvinden waar het behoorde te zijn gebeurd”.

U ziet: nepnieuws is van alle tijden. In één van de verhalen wordt de volkstelling  genoemd.

Lukas 2:1: “En het geschiedde in die dagen, dat er een bevel uitging vanwege keizer Augustus, dat het gehele rijk moest worden ingeschreven.” Lukas 2:3: “En ze gingen allen op weg om ingeschreven te worden, ieder naar zijn eigen stad.”

Dit suggereert dat de Romeinen het volk wilde tellen door te verordonneren dat de burgers zich in hun geboorteplaats lieten registreren. Ook dat wordt hier en daar betwijfeld. Registratie zou hebben plaatsgevonden in de woonplaats van de burgers,

Lezen: Het wereldrijk van het Tweestromenland, door Daan Nijssen

In Het wereldrijk van het Tweestromenland beschrijft Daan Nijssen, die op Sargasso de reeks ‘Verloren Oudheid‘ verzorgde, de geschiedenis van Mesopotamië. Rond 670 v.Chr. hadden de Assyriërs een groot deel van wat we nu het Midden-Oosten noemen verenigd in een wereldrijk, met Mesopotamië als kernland. In 612 v.Chr. brachten de Babyloniërs en de Meden deze grootmacht ten val en kwam onder illustere koningen als Nebukadnessar en Nabonidus het Babylonische Rijk tot bloei.

Rechtszaak tegen weigering contant geld door bioscoop

NIEUWS - De Arnhemse privacy-activist Michiel Jonker heeft bij de Rechtbank Gelderland beroep ingediend tegen de weigering van de Autoriteit Persoonsgegevens (AP) om handhavend op te treden tegen de weigering van arthouse-bioscoop Focus Filmtheater in Arnhem om contante betaling te accepteren.

De bioscoop eist pinbetaling bij aankoop van filmkaartjes aan de kassa. Daarmee dwingt de bioscoop bezoekers tot het laten verwerken van hun persoonsgegevens en daarom heeft in augustus 2018 een handhavingsverzoek bij de AP ingediend. De AP heeft het verzoek in november 2019 afgewezen met als argumenten:

Foto: Sargasso achtergrond wereldbol

SyRI is watching you

BRIEF, COLUMN - Iedere keer wordt aangegeven dat er waarborgen in het systeem zitten. Maar iedere keer schuift het gebruik weer een stukje verder op.

Toen het nieuws over SyRI naar buiten kwam, schoot me onmiddellijk de uitspraak1984 wasn’t meant to be an instruction manual” te binnen.

Het koppelen van overheidsdatabases en daarmee op basis van risicoprofielen alle burgers screenen om te zien of er iemand fraude pleegt (of per ongeluk geen snars van de duizenden regels snapt), lijkt namelijk rechtstreeks overgenomen uit dat boek.

Deze zoveelste inbreuk op de privacy van de burger door de overheid bleek zonder stemming door beide Kamers heen te zijn gegaan.

Na de bekendmaking keek ik iedere vijf minuten op de sociale media in afwachting van de rellen op het Binnenhof, het bezetten van de ministeries, de woeste Kamervragen, de grote krantenkoppen, de ziedende deskundigen bij Pauw en RTL Late Night, en nog veel erger.

Het bleef echter opvallend stil. Te stil.

Na een korte opleving van aandacht was het onderwerp in twee dagen alweer verdwenen uit de kranten en van de TV.

Nu, een paar weken later, moet dan ook de conclusie zijn dat de burgers geen flauw benul hebben hoe ernstig het is wat er nu gebeurt.

Foto: copyright ok. Gecheckt 03-03-2022

Meer dan 5000 databases met persoonsgegevens bij overheid

DATA - De overheid heeft meer dan 5000 databases in beheer met daarin persoonsgegevens van Nederlandse burgers. De meeste Nederlanders zitten er in enkele tientallen hooguit. Maar wie een crimineel verleden heeft, gehandicapt is, langdurig ziek, problemen heeft in het onderwijs, uitkeringstrekker is of asielzoeker en veteraan, staat er zo in meer dan honderd. Dit blijkt uit een analyse door Sargasso van de registraties van het College Bescherming Persoonsgegevens (CBP).

Een deel van de registraties is mogelijk verouderd en niet meer in gebruik. Daar staat tegenover dat veel elders bij de overheid bekende databases met persoonsgegevens niet geregistreerd staan bij het CBP.

Vorig jaar startten we een speurtocht om overzicht te krijgen op het aantal persoondatabases bij de overheid. Het bleek een schier onmogelijke klus te zijn. Maar toen we onze hand wisten te leggen op de registraties van het CBP ging het ineens erg hard. De lijst van meer dan 40.000 registraties is vervolgens met de hand gefilterd. Zo kwamen we op ruim 6600 registraties die samen gebruik maken van net iets meer dan 5100 unieke databases.

Bestudering van de lijst leert vervolgens dat het niet zo is dat iedereen in alle 5000 databases zit. Juist het omgekeerd blijkt het geval, als gemiddelde Nederlander zit je vaak in niet meer dan enige tientallen databases van de overheid. Echter, de volgende “labels” zorgen ervoor dat dit kan oplopen tot boven de 100: Crimineel (verleden), langdurig ziek, gehandicapt, problemen met onderwijs, uitkeringstrekker, asielzoeker en veteraan.

Analyse register CBP: tienduizenden databases met (gevoelige) persoonsgegevens

DATA - Analyse register CBP: tienduizenden databases met (gevoelige) persoonsgegevens.
Niet iedereen staat overal in natuurlijk. Maar dat op ten minste 12.000 een database is waar een BSN wordt vastgelegd is best heftig. Al die databases zijn vast niet allemaal even goed beveiligd. Of de eigenaren zijn niet allemaal goedbedoeld en zorgvuldig….
Oh, en de registratie zelf is een puinhoop. Dat geeft ook weinig vertrouwen.

Foto: copyright ok. Gecheckt 06-10-2022

Google is not evil

Het nieuwe privacybeleid van Google gaat morgen in. De Europese Commissie eist opheldering en gebruikers klagen over Big Brother-praktijken. Deze kritiek is echter goedkoop.

Het verbaast me eigenlijk dat Google nog niet eerder alle gebruikersinformatie koppelde. Ik ben een grootgebruiker van Google-diensten: gmail, reader, fusion tables/charts, docs en o ja, zoeken. Ik ben gewoon ingelogd, dus ik ging ervan uit dat alles wat ik met deze diensten doe, automatisch onder mijn account wordt geregistreerd.

Belangrijker is dat ik al deze diensten kan gebruiken omdat ik, net als alle andere Google-klanten, op een andere manier ervoor betaal: met mijn persoonsgegevens. We vinden het blijkbaar volkomen normaal dat allerlei webdiensten ogenschijnlijk gratis zijn. Ik zeg ogenschijnlijk omdat er dus wel degelijk sprake is van een uitruil. Mijn gegevens, voor diensten en surfgemak. Als je nog steeds niet doorhebt dat ‘het internet’ zo bekostigd wordt, dan moet je je toch maar eens laten bijspijkeren. Google is niet per se ‘evil’: de meeste mensen zijn gewoon gierig.

Dat neemt niet weg dat ik niet blij ben met deze uitruil. Ik hou sommige gegevens liever voor mezelf. Mocht er een Google-medewerker meelezen, dan wil ik hierbij een boud voorstel doen. Waarom biedt Google geen betaalde diensten aan? Ik zou er geen enkel probleem mee hebben om tien, twintig euro per maand te betalen voor een account, waarbij ik gebruik kan maken van alle Google-diensten. Voorwaarde is dan wel dat:

Foto: copyright ok. Gecheckt 06-11-2022

Facebook kent geen uitgang

Facebook is een nutsvoorziening in wording, meent internetexpert Danny Mekic. Als het geen bemoeienis van de overheid wil, moet het zijn gebruikers centraal stellen in plaats van zijn adverteerders.

Herkent u de volgende scène? Waar was u gisteravond? Met wie was u daar? Komt deze foto, welke gisteravond op die locatie gemaakt is, u bekend voor en kunt u de mensen op de foto identificeren? Heeft u een partner? Wie is dat? Wat is uw échte en volledige naam? Op welke datum bent u geboren en in welke plaats gebeurde dat? Wie zijn uw ouders, broers en zussen, neefjes en nichtjes? Wat is uw huidige woon- en verblijfplaats?

Dit is geen politieverhoor.  Dagelijks beantwoorden wereldwijd meer dan 800 miljoen mensen deze en andere persoonlijke vragen in ruil voor een hoop reacties, likes en andere vormen van sociale bevestiging op het online sociale netwerk Facebook. Vrijwillig. De internationale profielensite bedient inmiddels een achtste van de wereldbevolking en nestelt zich steeds dieper en heimelijk in de levens van honderden miljoenen mensen, zonder altijd rekening te houden met de privacy van haar gebruikers. Als het Amerikaanse bedrijf daarmee doorgaat, overstijgt het commerciële belang op den duur het publieke belang van de samenleving. Hoe moet de politiek reageren?

AIVD ging in de fout bij het elektronisch binnenharken van persoonsgegevens

Nobody could have predicted:

Dat stelt toezichthouder Commissie van Toezicht betreffende de Inlichtingen- en Veiligheidsdiensten (CTIVD) donderdag. ¨…*

“Deze onrechtmatigheden betreffen met name de motivering van het gebruik van bepaalde bevoegdheden (inzet agenten en hacken) en de verslaglegging van operaties. Daarnaast is het heimelijk binnenhalen van een aantal grotere algemene webfora disproportioneel.”

Lezen: Mohammed, door Marcel Hulspas

Wie was Mohammed? Wat dreef hem? In deze vlot geschreven biografie beschrijft Marcel Hulspas de carrière van de de Profeet Mohammed. Hoe hij uitgroeide van een eenvoudige lokale ‘waarschuwer’ die de Mekkanen opriep om terug te keren tot het ware geloof, tot een man die zichzelf beschouwde als de nieuwste door God gezonden profeet, vergelijkbaar met Mozes, Jesaja en Jezus.

Mohammed moest Mekka verlaten maar slaagde erin een machtige stammencoalitie bijeen te brengen die, geïnspireerd door het geloof in de ene God (en zijn Profeet) westelijk Arabië veroverde. En na zijn dood stroomden de Arabische legers oost- en noordwaarts, en schiepen een nieuw wereldrijk.

Foto: Sargasso achtergrond wereldbol

Databases overheid met persoonsgegevens – 2

Anderhalve week geleden vroeg ik jullie hulp bij het opzoeken van alle databases van de overheid waar persoonsgegevens in staan. De reacties waren al zeer behulpzaam.
Maar nu merk ik dat ik zelf de bottleneck ga worden bij de verwerking. Dus waarom het crowdsourcen niet gewoon doortrekken naar dat stuk?
In google docs heb ik een spreadsheet aangemaakt waarin de gegevens staan. Die kan iedereen bekijken.
Iedereen die een steentje wil bijdragen aan het bewerken moet even een e-mail adres doorgeven aan privacy at sargasso punt nl. We zullen dit mailadres alleen voor de uitnodiging gebruiken, dat beloof ik.

De eerste twee regels van de lijst zijn uitgewerkt om een beeld te geven van hoe het er uit moet komen te zien. Verder heb ik uit de vorige post en reacties al de nodige begrippen en linkjes geplaatst. Leef je uit, maar let wel goed op als je edit. Check of de database niet onder een andere naam reeds is toegevoegd en let vooral op dat je niet dezelfde database gelijktijdig bewerkt met iemand anders (te zien aan de gekleurde randen om de cellen).

De eerste slag gaf al zeker 23 databases. En dan moet meer dan de helft van de gegeven linkjes nog uitgezocht worden. Een goede start voorwaar.
Let er op dat het alleen maar gaat om databases van de overheid (of agentschappen). Dus iets als een AirMiles database of die van de vereniging voor schuldhulpverleningen hoort er niet tussen. Bij twijfel het opmerkingenveld gebruiken.

Lezen: Mohammed, door Marcel Hulspas

Wie was Mohammed? Wat dreef hem? In deze vlot geschreven biografie beschrijft Marcel Hulspas de carrière van de de Profeet Mohammed. Hoe hij uitgroeide van een eenvoudige lokale ‘waarschuwer’ die de Mekkanen opriep om terug te keren tot het ware geloof, tot een man die zichzelf beschouwde als de nieuwste door God gezonden profeet, vergelijkbaar met Mozes, Jesaja en Jezus.

Mohammed moest Mekka verlaten maar slaagde erin een machtige stammencoalitie bijeen te brengen die, geïnspireerd door het geloof in de ene God (en zijn Profeet) westelijk Arabië veroverde. En na zijn dood stroomden de Arabische legers oost- en noordwaarts, en schiepen een nieuw wereldrijk.

Volgende