Thema Data

De race om het warmste jaar sinds 1901

DATA, VISUALISATIE - Het warmste jaar tot nu toe in Nederland (De Bilt) was 2006. Met een gemiddelde temperatuur over het hele jaar gemeten van 11,235 graden Celsius. Een jaar later lukte het 2007 net niet om een nieuw record te zetten. Dat jaar bleef steken op 11,226 graden. Statistisch gezien verwaarloosbaar verschil, maar toch.
Nu ligt echter sinds begin oktober 2014 in de metingen voor op zowel 2006 als 2007.
Omdat Marcel Crok me attendeerde op een zeer fraaie visualisatie van dezelfde “race” in Engeland, leek het me wel aardig om dit ook voor Nederland te doen.

Hieronder ziet u de race. De zwarte lijn is 2014. De rode 2007, die op het laatste moment ingehaald wordt door de paarse lijn van 2006.
Op de x-as ziet u de dagen van het jaar. Het is dus steeds het gemiddelde vanaf 1 januari tot en met die dag in dat jaar.

Deze update is tot en met 19 december 2014. Met enige regelmaat zal ik nieuwe updates plaatsen.
hot_race_20141219_475

Accijnsverhoging 2015 in perspectief

DATA - Jawel, de jaarlijkse uitbarsting van de fervente autorijders is weer daar. De accijns wordt verhoogd! Alweer! Ze moeten ook steeds de automobilist hebben!
Afijn, same old song. Accijns is in Nederland geïndexeerd (net als huur vaak bijvoorbeeld). Dat betekent dat deze min of meer meegroeit met de inflatie. En daarom maar weer dit overzicht van de heffingen (grootste deel is accijns immers) op benzine (Euro95) sinds 1990, voor inflatie gecorrigeerd. Saai toch.
accijns_2015_475

EU begroting voor 2015 in perspectief

DATA - De begroting voor de EU voor 2015 lijkt nog net voor 2015 geaccepteerd te gaan worden. Maar liefst €141,5 miljard!

Maar dat getal zegt weinig zonder context. Daarom hier de cijfers vanaf 2000 op een rijtje. Let daarbij wel op dat er af en toe landen bij komen.

Eerst maar eens de bedragen zelf:

budget_eu_2000_2015v2_475

Ethisch witwassen

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien hoe er bij samenwerkingen tussen onderzoekers en bedrijven een verschil kan zijn in de ethische standaarden waarmee wordt gewerkt.

Facebook is een bedrijf dat leeft op gedeelde data. Mensen worden lid van Facebook om status updates te delen met vrienden, op de hoogte te blijven van wat anderen doen en berichtjes naar elkaar te sturen. Facebook analyseert en filtert de data en probeert op die manier een zo prettig mogelijk beeld te geven van wat er om je heen gebeurt. Door je gedrag kan Facebook leren wie je goede vrienden zijn en wie je vage kennissen. De status-updates van die mensen worden ook op die manier behandeld.

Maar in januari 2012 ging Facebook nog een stapje verder: onderzoekers wilde kijken of het mogelijk was om emoties te beïnvloeden door de filtering van berichten aan te passen. Te kijken of gebruikers ook minder vrolijk werden als er minder vrolijke berichten getoond werden, of juist blijer als er minder verdrietige berichten getoond werden.

Opwarmingsontkenner Labohm verliest weddenschap over… de opwarming

DATA - Eind 2009 ging de bekende opwarmingsontkenner Hans Labohm (eigenlijk econoom) een weddenschap aan met Bart Sengers.

Labohm, heel voorspelbaar, voorspelde dat de jaren 2010 tot en met 2014 kouder zouden zijn dan 2000 tot en met 2009. Maar dan wel in de meetreeks van UAH (onderhouden door een bekende andere ontkenner, Dr. Roy Spencer).

Er zat een zekere logica achter die weddenschap. 2000 tot 2009 waren de warmste tien jaren tot dan gemeten. Dus statistisch gezien was het mogelijk dat de volgende vijf jaar kouder zouden kunnen zijn.

Maar goed, met nog een maand te gaan, is het wel duidelijk dat Labohm zijn weddenschap gaat verliezen. Big Time.

Taxi’s en regenbogen: anonimisering geen gemakkelijke opgave

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien dat het goed anonimiseren van open data geen eenvoudige opgave is.

In 2013 kwam Chris Whong erachter dat de data van alle taxi-ritten in New York City opvraagbaar was via de Amerikaanse variant van een verzoek op de Wet Openbaarheid Bestuur (WOB).

Na het invullen van wat formulieren en een paar dagen wachten ontving hij een USB stick met daarop bijna 20 Gigabyte aan data over de taxi-ritten in New York City in de afgelopen jaren. Elke taxi-rit was beschreven door een regel met daarin onder meer het begin- en eindtijd, vertrekpunt en eindpunt en het aantal passagiers. De prijs en de fooi waren in een apart bestand meegegeven. In de originele data was al deze data gekoppeld aan een taxi. In een poging die identiteit te verhullen, maar toch nuttige data op te leveren was dit versleuteld meegeleverd in de geopenbaarde data.

De lawine van Lucassen

DATA - De discussie over de zogenaamde lawine van jongetjes die Mohamed heten, vroeg om een nadere analyse. Om hoeveel jongetjes gaat het nou eigenlijk en hoe staat dat in verhouding tot de andere namen?

Omdat Mohamed nogal verschillend wordt gespeld, is een eenduidig overzicht niet goed te krijgen. Daarom hebben we de populariteitsgegevens van vijftig varianten van de naam allemaal bij elkaar geschraapt en in één overzicht gezet. Dit is het resultaat:

mohamed_naam_475

Wereldtemperatuur | Update oktober 2014

DATA - Terwijl elders de discussie voortgaat over wat je wel en niet mag zeggen, visualiseren en berekenen over het klimaat, geven wij u hier weer gewoon de maandelijkse update van de trend in de opwarming van de aarde. Let daartoe vooral even op de lijn voor het dertigjaarsgemiddelde.

wereldtemp_201410_475