De theorieloze wetenschap

Zijn hypothesen passé? Volgens schrijver en voormalig hoofdredacteur van het magazine WIRED, Chris Anderson, zal Big Data de wetenschap revolutionair veranderen. Dankzij Big Data hoeven we geen hypothesen meer te stellen en theorieën te onderzoeken, maar laten we computers de correlaties bepalen. Bijvoorbeeld door je boodschappenbonnetjes te koppelen aan de medische gegevens van alle Nederlanders. Hierdoor kunnen we kijken welke aankopen met bepaalde ziekten correleren. Bovendien kunnen supermarkten met deze informatie hun marketing toespitsen op individuele groepen. Wat betekent dit voor disciplines? Kunnen we al onze theorieën overboord gooien en gaan we een nieuw tijdperk tegemoet?

Foto: copyright ok. Gecheckt 09-02-2022

Kort | Het glazen plafond

DATA - De verdeling van (bruto) inkomen uitgesplitst naar mannen en vrouwen laat zien dat er nog heel veel moet gebeuren voor de vrouwen een gelijkwaardige positie hebben. Het glazen plafond zit al bij 40.000 euro per jaar.
brutoinkomenverdeling_475

Er zijn nog veel meer interessante zaken te ontdekken in deze grafieken.

De grafieken zijn tot ons gekomen via een online gezette presentatie van CBS-mensen. Ze maken in de toelichting over hoe big data te visualiseren, gebruik van de ruwe data die ze daar beschikbaar hebben over de inkomens van alle Nederlanders (geanonimiseerd begreep ik).
Dit is uiteraard een goudmijn voor onderzoekers ook buiten het CBS. Hopelijk komt er snel meer uit.

NB: Bovenstaande conclusie is statistisch gezien totaal onverantwoord.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Geef je leven aan PinkRoccade

Als de overheid zelf niet al zoveel mogelijk data wilde verzamelen, dan fluisteren de commerciële adviseurs ze het wel in. Uiteraard zorgen ze er wel voor dat u niet te veel de stuipen op het lijf wordt gejaagd:

Het uitgangspunt van PinkRoccade Local Government is dat de burger baas is en blijft over zijn of haar eigen data. De burger kiest zelf welke data hij/zij deelt met bedrijven en de overheid.

Kijk en huiver over de toekomstvisie van PinkRoccade.

Foto: Lab Science Career (cc)

Big Data in medisch onderzoek

ACHTERGROND - Het grootschalig en ongericht verzamelen van patiëntgegevens maakt nieuw medisch onderzoek steeds gemakkelijker. Maar er zitten ook nadelen aan deze werkwijze.

Als je als patiënt of gezonde vrijwilliger gegevens afstaat voor medisch onderzoek is dat voor patiënten in de toekomst, want na het onderzoek is er niet meteen een therapie. Deze gegevens vertellen echter steeds meer over jou, bijvoorbeeld over de aanleg die je hebt voor een andere ziekte, die zich veel later pas ontwikkelt. Krijg je dat te horen? Zou je dat willen? Wat doen onderzoekers met die gegevens en hoe blijven ze privé? Prof. dr. Frank Miedema (Raad van Bestuur, UMC Utrecht) sprak over de moeilijkheden en mogelijkheden van onze snel groeiende kennis over ziekten en gezondheid.

Vissen naar resultaat

In klassieke wetenschappelijke studies dienen onderzoekers een zorgvuldig gedefinieerd voorstel in, met een heldere onderzoeksvraag die wordt getoetst door de medisch ethische commissie. De commissie kijkt streng naar betrokkenheid van de proefpersonen. Ervaren zij niet te veel druk om mee te doen ‘omdat de dokter het vraagt’? Telkens moet de belasting voor de patiënt opwegen tegen het belang van het onderzoek voor de wetenschap.

Bij modern dataonderzoek gaat echter dit andersom: eerst dien je een aanvraag in om (medische en maar ook andere) gegevens, bloed of weefsel te verzamelen van grote groepen patiënten en gezonde vrijwilligers. Vervolgens formuleren onderzoekers vanuit de verzamelde data telkens nieuwe onderzoeksvragen, waarbij ze de eerder verzamelde kennis meenemen.

Foto: copyright ok. Gecheckt 24-10-2022

Kunst op Zondag | Datavisualisatie

Eén van de sterke kanten van Sargasso zijn de data-artikelen. Feiten en cijfers over zware en lichte kost en artikelen over de betekenis en gebruik van data zelf. Vaak geïllustreerd met tabellen, diagrammen en kaarten. De datavisualisatie op Sargasso is altijd beheerst. Een kleurtje hier, een cirkeltje daar, maar altijd helder en overzichtelijk. Nooit laat een data-redacteur zijn artistieke neigingen domineren over de in beeld te brengen kennis.

Een eenvoudige staafdiagram brengt een rijtje cijfers mooi in beeld, maar dat wordt wel eens te saai gevonden. In het magazine Computable hield Machiel van Tilborg een pleidooi voor een “perfecte symbiose van data scientists en data artists”, omdat “kunstenaars zijn in staat om iconische beelden te creëren die een verhaal vertellen dat blijft hangen”.

John Grimwade, zelf datavormgever en docent ‘information graphics’, meent echter dat datavisualisaties schade kunnen aanrichten, als het beeld dominanter is dan de informatie. “De regel moet zijn: eerst de informatie, dan de kunst”. Zo niet, dan bestaat het risico dat de lezer/kijker door de esthetiek van het plaatje afgeleid wordt van de ethiek van het praatje.

De wetenschapper als kunstenaar

Hans Rosling, arts en hoogleraar internationale gezondheid, wordt als een van de beste datakunstenaars gezien. Met de Gapminder Foundation hoopt hij zijn ideaal te bereiken: een op feiten gebaseerde visie op de wereld.

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.

Opt-out van big data is bijzonder lastig

VERSLAG - Journaliste Janet Vertesi probeerde haar zwangerschap verborgen te houden voor “big data” verzamelaars. Dit experiment van een opt-out van big data bleek nog behoorlijk lastig en gaf haar soms het gevoel een crimineel te zijn.

Eén van haar conclusies: Als je een beetje privacy wil ten opzichte van marketeers en technologie-giganten zoals Google en Facebook, dan moet het niet zo zijn dat je je daarvoor als een halve crimineel moet gaan gedragen om dat te kunnen bereiken.

Foto: Marino González (cc)

‘Big data’ verkopen in de zorg – dat gaat zomaar niet

OPINIE - In Engeland is ophef ontstaan over de verkoop van patiëntgegevens. Andre Krom, Dirk Stemerding en Pascal Messer van het Rathenau Instituut delen die zorg.

Binnenkort kunnen in Engeland allerlei organisaties, waaronder verzekeraars en farmaceuten, ‘geanonimiseerde’ gegevens kopen uit het Engelse elektronisch patiëntendossier (EPD). De belofte: betere zorg tegen lagere kosten. Voorvechters van privacy hebben dit initiatief van de National Health Service (NHS) fel bekritiseerd. Patiënten zijn namelijk alsnog te achterhalen als de ‘geanonimiseerde’ data worden gecombineerd met gegevens die men al van patiënten heeft of die te vinden zijn op internet. Ook kunnen patiënten niet nagaan bij wie hun gegevens terechtkomen. Kortom: de privacy van patiënten is in het geding.

Straks gaat het bovendien niet alleen om gegevens over ziekte, gezondheid en leefgewoonten, maar ook om genetische informatie. In Engeland bestaan concrete plannen om op termijn van iedereen de complete DNA-volgorde in het EPD op te slaan. Omdat het DNA van ieder individu uniek is, kan genetische informatie per definitie niet worden geanonimiseerd. De geruststelling luidt dat de NHS genetische data op individueel niveau niet zal verkopen. De nu gelanceerde plannen voor verkoop van patiëntengegevens roepen wel de vraag op of dit zo blijft.

Netwerk van biobanken

Foto: UrbaneWomenMag (cc)

Daten met data

ANALYSE - Als ik iets over ‘big data’ lees, dan gaat het vaak over business opportunities en enorme winsten die geboekt kunnen worden. Data die worden verzameld door grote bedrijven en overheden en door diezelfde partijen weer slim worden ingezet. Een beetje een ver van mijn bed show dus. Maar juist ook een van de kenmerken van de datarevolutie, of hoe je het ook wilt noemen, is hoe het tot in de vezels van onze menselijke interacties doordringt.

Dat wordt nergens duidelijker dan als we het over relaties hebben. Liefde en relaties, de final frontier van de digitalisering. Iets wat typisch menselijk is, compleet irrationeel, onverklaarbaar en tegen alle natuurwetten in gaat. Iets waar computers niks van begrijpen toch? Niet als het aan Silicon Valley ligt. Het datadenken komt ook de romantiek binnen, in de vorm van dating en rating-sites. Neem Lulu, een online platform waarop vrouwen anoniem hun mannelijke vrienden, exen en flirts kunnen beoordelen en ‘intel’ over de mannen kunnen delen met beschrijvingen zoals #DudecanCook of #SexualPanther. De app vertaalt alle input via een algoritme naar een score, volgens de makers een handige tool waarmee  vrouwen kunnen delen welke mannen de moeite waard zijn. Tegelijkertijd is er kritiek op waarop potentiële partners hier op een Amazon-achtige manier geobjectificeerd en beoordeeld worden.

Doe het veilig met NordVPN

Sargasso heeft privacy hoog in het vaandel staan. Nu we allemaal meer dingen online doen is een goede VPN-service belangrijk om je privacy te beschermen. Volgens techsite CNET is NordVPN de meest betrouwbare en veilige VPN-service. De app is makkelijk in gebruik en je kunt tot zes verbindingen tegelijk tot stand brengen. NordVPN kwam bij een speedtest als pijlsnel uit de bus en is dus ook geschikt als je wil gamen, Netflixen of downloaden.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Foto: Anna Lena Schiller (cc)

Meer mogelijk met big data – de keerzijde

ACHTERGROND - Big data wordt big business. Met big data, analytics en het internet of things wint ook het privacydebat weer aan belang. Het uitgangspunt ‘ik heb niets te verbergen’ is daarbij geen houdbaar argument meer.

‘All the privacy solutions you hear about are on the wrong track.’ In MIT Technology Review zet Evgeny Morozov, auteur van The Net Delusion, perfect uiteen waar het mis gaat in het huidige privacy-debat. Hij begint bij 1967, als Paul Baran, een technicus, de blik vooruit werpt en mijmert over een netwerk van computers dat allerlei alledaagse problemen van mensen zou kunnen oplossen. Je zou met zo’n netwerk bijvoorbeeld precies weten wat er wanneer op televisie is en zelfs berichten krijgen wanneer jouw favoriete televisieserie begint. Baran had een vooruitziende blik.

Internet draagt niet bij aan democratie

De afgelopen twintig jaar is er hard gewerkt aan het internet. Soms komen de ideële doelstellingen daarvan nog voorbij, maar Morozov rekent af met degenen die de (digitale) free flow of information associëren met ‘meer democratie’. Een aanhoudende hallucinatie noemt hij dat. Hij wijst daarbij op de honger naar informatie – en dus data, de grondstof – van zowel bedrijven als overheden, die al langer bestaat dan het internet. Bedrijven willen meer weten omdat ze dan beter kunnen adverteren of verkopen; overheden willen graag ons gedrag in goede banen leiden, zodat we niet te veel kosten en voldoende bijdragen aan het in stand houden van de overheid. Morozov wijst op de software die door de Italiaanse overheid wordt gebruikt om verbanden te vinden tussen de opgegeven inkomsten (via de inkomstenbelasting) en de uitgaven van individuen. Wanneer de Italiaanse overheid de mogelijkheden om data over het uitgavenpatroon van burgers te verzamelen ziet inkrimpen, ligt het voor de hand dat Google en Facebook het volgende loket zijn waar deze informatie verkrijgbaar is.

Foto: Ted Eytan (cc)

Vet verdienen met big data

ANALYSE - In onze digitale economie zijn – naast een goed concept – vijf onderdelen nodig om tot business te komen: gebruiker, device, connectiviteit, software en data. Waar ligt bij toekomstige digitale verdienmodellen het zwaartepunt?

In digitale businessmodellen is het de kunst om de klant (vaak aangeduid met ‘de gebruiker’) zo ver te krijgen dat zijn apparaat online beschikbaar wordt gemaakt, zodat er vervolgens apps of software op geplaatst kunnen worden. Die apps en software gaan data produceren, waarmee de digitale ondernemer waarde genereert. Zie hier een digitale voedselketen.

In plaats van gebruiker, device, connectiviteit, software en data is ook SMAC: Social, Mobile, Analytics en Cloud een veel geziene indeling, maar in die benadering wordt voorbijgegaan aan de economische waarde van communicatie en informatie (in ruwe vorm: data). Businessmodellen beginnen bij de gebruiker, wiens portemonnee natuurlijk het meest interessant is.

De tijd dat we alleen voor software betaalden, is grotendeels voorbij. De tijd dat elektronicabedrijven rijk werden van alleen hardware, lijkt ook voorbij. En wellicht is connectiviteit straks net zo gratis als alle producten en diensten van Google. Kortom, mensen + data, dat is de basis voor veel toekomstige verdienmodellen.

Je kunt natuurlijk ook geld ‘verdienen’ door het niet uit te geven. Angela McIntyre, analist bij Gartner, voorspelt een miljardenbesparing bij de inzet van smart glasses zoals Google Glass, wanneer zo’n device wordt gebruikt door monteurs en veldwerkers in de dienstverlenende sector. Via de bril zou een expert kunnen meekijken met de monteur op locatie om een specifiek probleem op te lossen. Daarmee wordt de bril een interactief, handsfree instructieboek. Ze denkt dat de jaarlijkse besparing in 2017 al kan oplopen tot 1 miljard dollar. Volgens Juniper Research stijgt rond diezelfde tijd (2018) de verkoop van slimme brillen wereldwijd naar 10 miljoen exemplaren. Kortom, iedere bril levert een besparing op van 100 dollar per jaar. Nu maar hopen dat de prijs (nu nog 1.500 dollar voor een Google Glass) snel zakt, want zo’n stukje hardware zal in drie jaar tijd echt in alle opzichten zijn afgeschreven.

Lezen: De BVD in de politiek, door Jos van Dijk

Tot het eind van de Koude Oorlog heeft de BVD de CPN in de gaten gehouden. Maar de dienst deed veel meer dan spioneren. Op basis van nieuw archiefmateriaal van de AIVD laat dit boek zien hoe de geheime dienst in de jaren vijftig en zestig het communisme in Nederland probeerde te ondermijnen. De BVD zette tot tweemaal toe personeel en financiële middelen in voor een concurrerende communistische partij. BVD-agenten hielpen actief mee met geld inzamelen voor de verkiezingscampagne. De regering liet deze operaties oogluikend toe. Het parlement wist van niets.

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.

Foto: Kevin Krejci (cc)

Big data in de zorg

ACHTERGROND - Een MRi-scan maakt steeds meer slices en hartfilmpjes worden tegenwoordig opgeslagen in HD-kwaliteit. De medische apparatuur die bij medische zorg en onderzoek wordt ingezet, maakt steeds vaker deel uit van de IT-infrastructuur, van het applicatielandschap en van de datahuishouding. De zorg wordt steeds meer gedreven door data; ziekenhuizen transformeren naar IT-bedrijven.

Big data wordt nog vaak gezien als een proces waarbij we doelbewust gegevensbronnen combineren om te komen tot nieuwe informatie, zoals bij de Hollandse Brug over de snelweg A6. Er is echter ook een ‘autonome’ groei in het datavolume, die het resultaat is van voortschrijdende technologische ontwikkelingen.

Analistenbureau MarketsandMarkets voorspelt dat de big data-industrie tot 2017 jaarlijks meer dan 54 procent zal groeien. De totale markt voor big data-specifieke infrastructuur (rekenkracht, opslag, netwerken) zal volgens de Wikibon Analyst Group in datzelfde jaar 402 miljard dollar bedragen. IT moet zich ook voorbereiden op een IT-omgeving die meegroeit met de eisen die het werken met big data oplegt: met een goede beschikbaarheid (schaalbare en betrouwbare hardware) en snelheid (nieuwe databasetechnologie, in memory computing, snelle servers met bijvoorbeeld SSD’s). Volgens opslagproducent Seagate zal de wereld in 2020 behoefte hebben aan opslag ter grootte van 6 zettabyte, hetgeen overeenkomt met 6 miljard terabyte.

Foto: true2source (cc)

Niks te verbergen

COLUMN - Wie niets te verbergen heeft, hoeft zich geen zorgen te maken om de uitgebreide spionageactiviteiten van de Verenigde Staten in Europa. Toch? Nou goed. Dus jij hebt niets te verbergen. Heb je je eigen browsergeschiedenis al eens goed bekeken? Of “wis” je die elke dag (ha, ha!)?

Als ik die van mij terugkijk, dan vallen een aantal dingen op. De laatste dagen bezocht ik een aantal keer een zwaar antisemitische anti-immigratiesite vol snuff – foto’s van echte moordslachtoffers. Dat ik dat deed vanwege mijn vorige blog staat er niet bij. Ik bezocht ook YouTube en luisterde naar Ya Buyut Assuweis, Mohammed Hammam’s lied over de Yom Kippoeroorlog. Dat ik dat deed omdat ik als student Arabisch ook al naar deze Egyptenaar luisterde en dus gewoon jeugdherinneringen zat op te halen, staat er niet bij. En oh ja, via een modelbouwsite kwam ik ook nog langs deze video over een man die met een gestolen tank door San Diego denderde.

Nou, tel maar op. Antisemitisme, obsessie met extreem lichamelijk geweld, Arabische oorlog tegen Israël, het stelen van zware wapens. Op basis van twee weekjes browserhistorie verwacht ik nu toch minstens de Italiaanse geheime dienst aan de deur. Want ik woon ook nog eens pal onder de vliegroute naar Tel Aviv.

Doe het veilig met NordVPN

Sargasso heeft privacy hoog in het vaandel staan. Nu we allemaal meer dingen online doen is een goede VPN-service belangrijk om je privacy te beschermen. Volgens techsite CNET is NordVPN de meest betrouwbare en veilige VPN-service. De app is makkelijk in gebruik en je kunt tot zes verbindingen tegelijk tot stand brengen. NordVPN kwam bij een speedtest als pijlsnel uit de bus en is dus ook geschikt als je wil gamen, Netflixen of downloaden.

Vorige Volgende