Eurovision Song Contest 1975-2014: more points for countries close to each other

This week the 60th Eurovision Song Contest is held in Vienna. An event watched by millions all over the world. We've analyzed the last 40 years, from 1975 to 2014, to see if the proximity of countries has any influence on the voting. Our conclusion: yes, it does. What we did was calculating the distance between all the capitals of the countries that participated (or voted) in the last 40 years. Why that period? Because in 1975 the current voting system was introduced. So these years can be compared. Next we calculated how many points a particular country gave to another country and divided that by the times they voted. If they gave no points but could have, a zero was used. And then we plotted these date in a graph. On the horizontal bar the distance between the capitals. On the vertical bar the average points given (in finals and semi-finals).

Door: Foto: Engyles (cc)
Foto: Sargasso achtergrond wereldbol

VVD voor verkiezingen wel erg makkelijk met grafieken veiligheid

ANALYSE, DATA - Op een aantal vlakken daalt de criminaliteit in Nederland. De VVD, die de laatste jaren in de regering zit, ziet zich als de partij die daartoe heeft bijgedragen. En wil dit succes claimen in het kader van de komende verkiezingen. Alleen doen ze dat niet zo handig.

Ze gebruiken bij het bericht een grafiek ter illustratie van hun claim:

vvd_oorsp

En die grafiek veroorzaakte gelijk veel ophef onder de politiekvolgers op Twitter. De y-as begint namelijk niet bij nul, waardoor er een vertekend beeld ontstaat, ten gunste van het geclaimde. Een fout die de VVD wel vaker maakt overigens, willens en wetens dus.

Laten we dus als eerste even de grafieken correct weergeven:

vvd_correct_475

Dat geeft al een ander beeld, veel minder dramatisch.

Maar er is iets wat niet direct zichtbaar is, wat net zo relevant is bij dit verhaal. De VVD heeft namelijk kennelijk bewust gekozen om juist die drie cijfers te gebruiken. De getallen komen uit een rapportage van de politie (pdf). Maar daar staan nog veel meer cijfers in. Laten we even drie andere reeksen kiezen:

vvd_kers_475

Dat ziet er dan toch weer anders uit, minder rooskleurig.

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.

Pentagon tegen medewerkers: verzamelen ≠ verzamelen

War was al peace, freedom was al slavery, en nu dit

Afgelopen maandag heeft de ACLU (American Civil Liberties Union) een via de ‘Freedom of Information Act’ verkregen instructieboekje openbaar gemaakt waarin de DIA (Defense Intelligence Agency) zijn analisten waarschuwt vooral niet te vertrouwen op gangbaar taalgebruik. “[O]ne can be led astray,” zo waarschuwen de instructies, “by relying on the generic or commonly understood definitions of a particular word.” Oldspeak, kortom, is misleidend.

Foto: m.a.r.c. (cc)

PirateBayWatch

ACHTERGROND - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage beschrijft hij hoe onderzoekers die gebruik maken van data over internetverkeer een zorgvuldige afweging moeten maken tussen het belang van hun onderzoek en privacy van hun gebruikers.

In januari 2012 is er een blokkade opgeworpen voor de webpagina van ThePirateBay. Stichting BREIN had toen een overwinning bereikt in haar strijd tegen illegaal downloaden. De providers Ziggo en XS4ALL moesten vanaf dat moment de website blokkeren voor haar klanten. Een aantal maanden later volgde een uitspraak voor de andere grote providers in Nederland en was de website in heel Nederland geblokkeerd.

Het was al vrij snel duidelijk dat er vele manieren waren om de blokkade te omzeilen. Proxies, mirrors en andere methoden schoten als paddenstoelen uit de grond, sneller dan BREIN ertegen kon vechten. Maar hoe bewijs je nu of zo’n blokkade ook daadwerkelijk effectief is?

Door de blokkade zelf en de vele manieren om deze te omzeilen was het niet mogelijk om de effectiviteit ervan direct te meten. Onderzoekers van de Universiteit van Amsterdam bedachten dat het wel mogelijk was om dit indirect te meten. Gebruikers van ThePirateBay halen daar links naar BitTorrent bestanden op, die ze dan gebruiken om gezamenlijk films of series binnen te halen. Om dit gezamenlijk te kunnen doen, worden er IP-adressen uitgewisseld van alle deelnemers. De onderzoekers vingen deze IP adressen op, om zo te kunnen achterhalen waar de downloaders vandaan kwamen.

Foto: Scott Beale (cc)

Ethisch witwassen

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien hoe er bij samenwerkingen tussen onderzoekers en bedrijven een verschil kan zijn in de ethische standaarden waarmee wordt gewerkt.

Facebook is een bedrijf dat leeft op gedeelde data. Mensen worden lid van Facebook om status updates te delen met vrienden, op de hoogte te blijven van wat anderen doen en berichtjes naar elkaar te sturen. Facebook analyseert en filtert de data en probeert op die manier een zo prettig mogelijk beeld te geven van wat er om je heen gebeurt. Door je gedrag kan Facebook leren wie je goede vrienden zijn en wie je vage kennissen. De status-updates van die mensen worden ook op die manier behandeld.

Maar in januari 2012 ging Facebook nog een stapje verder: onderzoekers wilde kijken of het mogelijk was om emoties te beïnvloeden door de filtering van berichten aan te passen. Te kijken of gebruikers ook minder vrolijk werden als er minder vrolijke berichten getoond werden, of juist blijer als er minder verdrietige berichten getoond werden.

Deze studie werd uitgevoerd op Engelssprekende gebruikers, zonder dat deze daarvan op de hoogte waren gebracht, of daar expliciet toestemming voor hadden gegeven. Ook nadat de studie was afgerond en de resultaten geanalyseerd waren werd er niet naar deze proefpersonen gecommuniceerd.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Met de wijsheid van de massa…

…kom je een heel eind:

How is it possible that a group of average citizens doing Google searches in their suburban town homes can outpredict members of the United States intelligence community with access to classified information? […]

But also, if you take a large crowd of different people with access to different information and pool their predictions, you will be in much better shape than if you rely on a single very smart person, or even a small group of very smart people.

“The wisdom of crowds is a very important part of this project, and it’s an important driver of accuracy,” Tetlock said. […]

“There’s a lot of noise, a lot of statistical random variation,” Tetlock said. “But it’s random variation around a signal, a true signal, and when you add all of the random variation on each side of the true signal together, you get closer to the true signal.”

In other words, there are errors on every side of the mark, but there is a truth at the center that people are responding to, and if you average a large number of predictions together, the errors will end up canceling each other out, and you are left with a more accurate guess.

That is the wisdom of the crowd.

Foto: Stefano Corso (cc)

Taxi’s en regenbogen: anonimisering geen gemakkelijke opgave

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien dat het goed anonimiseren van open data geen eenvoudige opgave is.

In 2013 kwam Chris Whong erachter dat de data van alle taxi-ritten in New York City opvraagbaar was via de Amerikaanse variant van een verzoek op de Wet Openbaarheid Bestuur (WOB).

Na het invullen van wat formulieren en een paar dagen wachten ontving hij een USB stick met daarop bijna 20 Gigabyte aan data over de taxi-ritten in New York City in de afgelopen jaren. Elke taxi-rit was beschreven door een regel met daarin onder meer het begin- en eindtijd, vertrekpunt en eindpunt en het aantal passagiers. De prijs en de fooi waren in een apart bestand meegegeven. In de originele data was al deze data gekoppeld aan een taxi. In een poging die identiteit te verhullen, maar toch nuttige data op te leveren was dit versleuteld meegeleverd in de geopenbaarde data.

Chris Whong heeft mooie plaatjes en visualisaties gemaakt met de data die hij kreeg. Populaire plekken waar taxi’s langsrijden, frequentie waarmee taxi’s rijden, de inkomens en fooi verdeling, enzovoort. Hij heeft de data ook beschikbaar gesteld voor anderen, zodat andere “civiele hackers” ermee aan de slag konden.

Foto: Kort - illustratie Sargasso

KORT | Moslimhaat

OPINIE - Vandaag verscheen op Republiek Allochtonië een artikel over moslimhaat. Vooral de volgende zin trok mijn aandacht:

Wat de omvang van het probleem is, weten we niet. Moslimdiscriminatie wordt door discriminatiebureaus niet apart geregistreerd, zoals met antisemitisme bijvoorbeeld wel het geval is.

Dit deed mij behoorlijk denken aan de cijfers over dodelijk politiegeweld in de VS. Of beter gezegd: het opvallende gebrek daaraan:

”There is no national database for this type of information, and that is so crazy,” said [University of South Carolina criminologist Geoff] Alpert. “We’ve been trying for years, but nobody wanted to fund it and the (police) departments didn’t want it. They were concerned with their image and liability. They don’t want to bother with it.”

Want als je de omvang van een probleem niet bijhoudt, hoef je je vanzelfsprekend ook niet te verdedigen tegen verwijten dat je niets onderneemt tegen een veelvoorkomende misstand. En dat komt – in het geval van moslimdiscriminatie – op zijn minst sommige politieke partijen wel goed uit, vermoed ik zo.

Overigens zou het me helemaal niets verbazen als moslimhaat veel vaker voorkomt dan antisemitisme (wat dus wel apart wordt bijgehouden). Maar ja, of dat zo is, weten we dus niet.

Data te koop

Shawn Buckles neemt het heft in eigen handen. In plaats van dat hij ING aan zijn data laat verdienen, biedt hij zelf z’n eigen data te koop aan. De hoogste bieder ontvangt onder andere zijn emails, locatiegeschiedenis, agenda en browse geschiedenis over één jaar vanaf koop. De veiling sluit op 12 april 2014.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Foto: medul.la (cc)

De schone schijn van datavisualisaties

ONDERZOEK - Datavisualisaties zijn een uitdaging voor de kijker en de maker, betogen Daniela van Geenen en Maurits van der Goes van de Utrecht Data School. Ze deden voor het Rathenau Instituut onderzoek naar de manier waarop algoritmes en keuzes bij het verzamelen, analyseren en visualiseren van gegevens bepalen welk verhaal een dataset vertelt.

We vertrouwen blind op datavisualisaties. De productie van datavisualisaties gebeurt immers automatisch door software. Met de uitvinding van de fotografie bijna 200 jaar geleden ontstond het idee van een geautomatiseerde beeldproductie en de droom van een objectieve afbeelding van de werkelijkheid door technologie. Het maken van een foto biedt de mogelijkheid om een onderwerp visueel vast te leggen. Toch kan er hierbij eigenlijk geen sprake zijn van een objectieve afbeelding. De camera vangt slechts een fractie van het beeld, waarbij dit proces onderhevig is aan vervalsing door onder meer de belichting.

Het gebruik van software heeft de mogelijkheden om een afbeelding te manipuleren verveelvoudigd. Met datavisualisaties wordt op een andere manier gepoogd de werkelijkheid af te beelden: verbanden in data worden zichtbaar gemaakt. Zo is het mogelijk om bijvoorbeeld sociale medianetwerken te visualiseren.

Terwijl we inmiddels kritisch zijn over de echtheid van foto’s, stellen we geen kritische vragen bij datavisualisaties. Maken datavisualisaties de droom van objectiviteit dan waar? Of laten we ons verleiden door de schone schijn van automatisering? Ook datavisualisaties zijn geen objectieve afbeeldingen van de werkelijkheid, maar doordat de meeste van ons de automatische productie hiervan als een ondoorgrondelijke black box ervaren, is het moeilijk om kritische vragen te stellen. We zullen laten zien waarom het zo verleidelijk is om in datavisualisaties te vertrouwen, welke rol de maker hierin speelt en wat we als kijker kunnen doen om ons niet te laten verblinden door hun schone schijn.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Vorige Volgende