articletype

Data

De race om het warmste jaar sinds 1901

DATA, VISUALISATIE - Het warmste jaar tot nu toe in Nederland (De Bilt) was 2006. Met een gemiddelde temperatuur over het hele jaar gemeten van 11,235 graden Celsius. Een jaar later lukte het 2007 net niet om een nieuw record te zetten. Dat jaar bleef steken op 11,226 graden. Statistisch gezien verwaarloosbaar verschil, maar toch.
Nu ligt echter sinds begin oktober 2014 in de metingen voor op zowel 2006 als 2007.
Omdat Marcel Crok me attendeerde op een zeer fraaie visualisatie van dezelfde “race” in Engeland, leek het me wel aardig om dit ook voor Nederland te doen.

Hieronder ziet u de race. De zwarte lijn is 2014. De rode 2007, die op het laatste moment ingehaald wordt door de paarse lijn van 2006.
Op de x-as ziet u de dagen van het jaar. Het is dus steeds het gemiddelde vanaf 1 januari tot en met die dag in dat jaar.

Deze update is tot en met 31 december 2014. Met enige regelmaat zal ik nieuwe updates plaatsen.
hot_race_20141231_475

Via twitteraar @ticobas kwam een manier om de kans te berekenen dat 2014 inderdaad de warmste zou worden, op basis van de jaarmetingen tot nu toe. Simpel gezegd, neem de reeks van 2014 tot de laatst bekende dag, vul die aan met de rest van de dagen uit jaar x, bepaald dan het gemiddelde en kijk of je nog boven die van 2006 uit komt. Ja=1, nee=0. En dan tellen en delen door het aantal geturfde jaren.
Dan krijg je voor de hele reeks een kans van 100% dat 2014 het warmst wordt. En als je alleen de laatste dertig jaar als referentie neemt, is de kans nu 100%.

Foto: Toshiyuki IMAI (cc)

Wereldtemperatuur | Update november 2014

DATA - Terwijl mogelijk de wereld en zeker Nederland dit jaar een nieuw record qua warmste jaar sinds start metingen gaan halen, hier weer de gewone maandelijkse update over het klimaat.

wereldtemp_201411_475

Weinig nieuws te melden verder. Alleen dit verhaal over een studie naar het smelten van het ijs rond Antarctica. Zeeijs mag dan groeien, toch smelt de boel sneller dan gedacht.

Het overzicht van de wereldwijde temperatuurafwijkingen is gebaseerd op de metingen van UAH MSU, RSS MSU, GISS, Hadcrut4, NCDC en JMA. We nemen daar maandelijks het gemiddelde van en bepalen ook nog het lopende gemiddelde over alle metingen van 36 maanden (drie jaar) , 132 maanden (elf jaar) en dertig jaar. Let op: het gaat hier om gemiddelde afwijkingen over meerdere reeksen met verschillende referentieperiodes. Getallen bieden dus alleen een indicatie van de trend.

Wat kost een huurwoning per vierkante meter?

DATA - Nadat ik eerder al liet zien wat een koopwoning per vierkante meter moet kosten en wat een vierkante meter bouwgrond moet opbrengen, miste de prijs per vierkante meter huurwoning nog een beetje. Bij deze dus een overzicht van de vraagprijs per maand per vierkante meter woonoppervlak van een huurwoning.

De top twintig duurste plaatsen met meer dan tien objecten in de verhuur ziet er als volgt uit:

top20huur

De top twintig goedkoopste gemeenten om een woning te huren is als volgt:

20goedkoopst
Om tot deze kaart te komen heb ik de gegevens van 9300 woningen van Funda gebruikt waarvoor zowel oppervlak, postcode als prijs per maand eenduidig geautomatiseerd te bepalen waren. Ik hoop binnenkort de prijzen in gemeenten net over de grens ook in de kaart op te nemen.

Voor nu kan ik er vast bijvertellen dat huurwoningen net over de grens in Duitsland tussen de 5,90 euro en de 6,50 euro per vierkante meter per maand moeten kosten. In deze post licht ik een tipje van de sluier hoe je de data uit bovenstaande analyse makkelijk binnen haalt en verwerkt.

Via Woningmarktcijfers

Foto: copyright ok. Gecheckt 06-11-2022

Periodieke veranderingen in temperatuur

DATA - Dat alleen een Siberische winter nog kan voorkomen dat 2014 het warmste jaar wordt sinds 1901, is inmiddels wel duidelijk. Twee andere recente recordjaren (2006 & 2007) en de stijgende wereldtemperaturen laten een duidelijke opwarming zien. Maar is deze opwarming ook gelijk verdeeld?

Om te bepalen wanneer de veranderingen in temperatuur het grootst zijn, hebben we eerst per dag in het jaar het gemiddelde genomen van de eerste 30 jaar van de temperatuurreeks van het KNMI (1901 – 1930). Onderstaande figuur laat voor iedere dag in alle jaren vanaf 1901 zien hoeveel de temperatuur afwijkt van de gemiddelde temperatuur van de periode 1901 – 1930.

Verandering gemiddelde dagtemperatuur (De Bilt)

Wat gelijk opvalt, is dat de opwarming niet gelijk over het jaar is verdeeld. Met name tijdens de lente en de herfst is het een stuk warmer geworden.

Een ander patroon met betrekking tot veranderingen in temperatuur is te zien bij de gemiddelde minimum en maximum temperaturen.

Verandering gemiddelde minimum en maximum temperatuur per jaar (De Bilt)

De 30-jarig voortschrijdende gemiddelden (zwarte lijnen) voor de gemiddelde minimum en maximum temperatuur per jaar (resp. blauw en rood) laten zien dat de gemiddelde minimum temperatuur geleidelijk stijgt, terwijl het voortschrijdend gemiddelde van de maximum temperatuur een flinke dip in de jaren 70 en 80 laat zien. Bovendien is het verschil tussen de oudste en meest recente waarde van het 30-jarig gemiddelde groter bij de minimum temperatuur dan bij de maximum temperatuur.

Accijnsverhoging 2015 in perspectief

DATA - Jawel, de jaarlijkse uitbarsting van de fervente autorijders is weer daar. De accijns wordt verhoogd! Alweer! Ze moeten ook steeds de automobilist hebben!
Afijn, same old song. Accijns is in Nederland geïndexeerd (net als huur vaak bijvoorbeeld). Dat betekent dat deze min of meer meegroeit met de inflatie. En daarom maar weer dit overzicht van de heffingen (grootste deel is accijns immers) op benzine (Euro95) sinds 1990, voor inflatie gecorrigeerd. Saai toch.
accijns_2015_475

Update 14-12-2014: Omdat de BOVAG vond dat het meer over de dieselaccijns ging, hier ook nog een versie daarvoor:
accijns_diesel_2015_475

Foto: De EU-begroting voor 2015 is bijna rond. Hoe moeten we de bedragen waar het om gaat interpreteren?

EU begroting voor 2015 in perspectief

DATA - De begroting voor de EU voor 2015 lijkt nog net voor 2015 geaccepteerd te gaan worden. Maar liefst €141,5 miljard!

Maar dat getal zegt weinig zonder context. Daarom hier de cijfers vanaf 2000 op een rijtje. Let daarbij wel op dat er af en toe landen bij komen.

Eerst maar eens de bedragen zelf:

budget_eu_2000_2015v2_475

Stevige jarenlange stijging die pas nu getemd lijkt te worden. Maar die bedragen moet je eigenlijk relateren aan het GNI (zeg maar het BNP voor de hele EU). En dan ziet het er alweer anders uit:

budget_eu_2000_2015_gni_475

Dat ziet er al veel overzichtelijker uit. Van echt grote groei is geen sprake.

Interessant, gegeven de vele discussies hier, is natuurlijk ook de bijdrage van Nederland in dit verhaal. Eerst maar weer eens in euro’s:

budget_eu_2000_2015_NL_deelv2_475
Zo te zien stevenen we af op een recordbijdrage (puur vanuit de nationale overheid gezien, er gaat nog meer geld naar de EU bijvoorbeeld via landbouw en douane). En er zitten geen compensaties meer in de pijplijn. Die kaarten hebben we uitgespeeld.

Maar opnieuw ook hier wat perspectief. Welk deel van de totale EU-begroting neemt Nederland in de jaren voor haar rekening?

Foto: Scott Beale (cc)

Ethisch witwassen

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien hoe er bij samenwerkingen tussen onderzoekers en bedrijven een verschil kan zijn in de ethische standaarden waarmee wordt gewerkt.

Facebook is een bedrijf dat leeft op gedeelde data. Mensen worden lid van Facebook om status updates te delen met vrienden, op de hoogte te blijven van wat anderen doen en berichtjes naar elkaar te sturen. Facebook analyseert en filtert de data en probeert op die manier een zo prettig mogelijk beeld te geven van wat er om je heen gebeurt. Door je gedrag kan Facebook leren wie je goede vrienden zijn en wie je vage kennissen. De status-updates van die mensen worden ook op die manier behandeld.

Maar in januari 2012 ging Facebook nog een stapje verder: onderzoekers wilde kijken of het mogelijk was om emoties te beïnvloeden door de filtering van berichten aan te passen. Te kijken of gebruikers ook minder vrolijk werden als er minder vrolijke berichten getoond werden, of juist blijer als er minder verdrietige berichten getoond werden.

Deze studie werd uitgevoerd op Engelssprekende gebruikers, zonder dat deze daarvan op de hoogte waren gebracht, of daar expliciet toestemming voor hadden gegeven. Ook nadat de studie was afgerond en de resultaten geanalyseerd waren werd er niet naar deze proefpersonen gecommuniceerd.

Foto: Stefano Corso (cc)

Taxi’s en regenbogen: anonimisering geen gemakkelijke opgave

DATA - Jeroen van der Ham is onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam. Hij schrijft voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat hij zien dat het goed anonimiseren van open data geen eenvoudige opgave is.

In 2013 kwam Chris Whong erachter dat de data van alle taxi-ritten in New York City opvraagbaar was via de Amerikaanse variant van een verzoek op de Wet Openbaarheid Bestuur (WOB).

Na het invullen van wat formulieren en een paar dagen wachten ontving hij een USB stick met daarop bijna 20 Gigabyte aan data over de taxi-ritten in New York City in de afgelopen jaren. Elke taxi-rit was beschreven door een regel met daarin onder meer het begin- en eindtijd, vertrekpunt en eindpunt en het aantal passagiers. De prijs en de fooi waren in een apart bestand meegegeven. In de originele data was al deze data gekoppeld aan een taxi. In een poging die identiteit te verhullen, maar toch nuttige data op te leveren was dit versleuteld meegeleverd in de geopenbaarde data.

Chris Whong heeft mooie plaatjes en visualisaties gemaakt met de data die hij kreeg. Populaire plekken waar taxi’s langsrijden, frequentie waarmee taxi’s rijden, de inkomens en fooi verdeling, enzovoort. Hij heeft de data ook beschikbaar gesteld voor anderen, zodat andere “civiele hackers” ermee aan de slag konden.

Foto: Lucas door Frans Hals http://nl.wikipedia.org/wiki/Evangelie_volgens_Lucas#mediaviewer/File:Frans_Hals_086_WGA_version.jpg

De lawine van Lucassen

DATA - De discussie over de zogenaamde lawine van jongetjes die Mohamed heten, vroeg om een nadere analyse. Om hoeveel jongetjes gaat het nou eigenlijk en hoe staat dat in verhouding tot de andere namen?

Omdat Mohamed nogal verschillend wordt gespeld, is een eenduidig overzicht niet goed te krijgen. Daarom hebben we de populariteitsgegevens van vijftig varianten van de naam allemaal bij elkaar geschraapt en in één overzicht gezet. Dit is het resultaat:

mohamed_naam_475

Dat zegt natuurlijk niets zonder context. Daarom hier dezelfde grafiek van de nummer één van 2013, Sem. U ziet, die komt net iets hoger uit.

Zouden we de namen van Mohamed standaard allemaal samen nemen, dan komt hij in 2013 ongeveer op plaats zeven te staan.

Maar eigenlijk moeten we dan hetzelfde doen voor allerlei andere namen. Marc, Marcus en Mark zijn hetzelfde. John, Johan en Johannes ook. En dan krijg je vervolgens geheid discussie over Peter en Pieter. Daar beginnen we niet aan.

Maar er viel wel gelijk een andere naam op, Lucas/Luuk/Lukas/Luc.

Nieuwsgierig als we zijn, hebben we deze zeer Bijbelse naam ook maar op één hoop gegooid.

lucas_naam_475

Het moge duidelijk zijn, een lawine van Lucassen overspoelt tegenwoordig het onderwijs. Om nog maar niet te spreken van al die andere Bijbelse namen zoals Marcus/Marc/Mark, Johannes/Johan/John, Peter/Pieter, etc…

Foto: Toshiyuki IMAI (cc)

Wereldtemperatuur | Update oktober 2014

DATA - Terwijl elders de discussie voortgaat over wat je wel en niet mag zeggen, visualiseren en berekenen over het klimaat, geven wij u hier weer gewoon de maandelijkse update van de trend in de opwarming van de aarde. Let daartoe vooral even op de lijn voor het dertigjaarsgemiddelde.

wereldtemp_201410_475

Verder gaat het de komende twee maanden natuurlijk over het record dat gebroken lijkt te gaan worden. Zowel in Nederland als wereldwijd wordt 2014 waarschijnlijk het warmste jaar sinds de start van de metingen.

Ook de oceaan doet lekker mee.

Vorige maand lieten we het lopende jaargemiddelde zien van alle land based series. Met september kwam het toen net niet tot een nieuwe hoogste waarde. Met oktober wel. We hebben nu dus een nieuw record voor een aaneengesloten periode van 12 maanden:

lopenjaargemiddelde_475

Omdat het “in” is om lineaire trendlijntjes te gebruiken als “bewijs”, hier ook een lekker foute versie van mijn kant:

lopenjaargemiddelde_trend

Hier kunt u overigens “live” meekijken naar hoe ver de temperatuur momenteel wereldwijd afwijkt.

Het overzicht van de wereldwijde temperatuurafwijkingen is gebaseerd op de metingen van UAH MSU, RSS MSU, GISS, Hadcrut4, NCDC en JMA. We nemen daar maandelijks het gemiddelde van en bepalen ook nog het lopende gemiddelde over alle metingen van 36 maanden (drie jaar) , 132 maanden (elf jaar) en dertig jaar. Let op: het gaat hier om gemiddelde afwijkingen over meerdere reeksen met verschillende referentieperiodes. Getallen bieden dus alleen een indicatie van de trend.

Foto: copyright ok. Gecheckt 09-02-2022

Kort | Het glazen plafond

DATA - De verdeling van (bruto) inkomen uitgesplitst naar mannen en vrouwen laat zien dat er nog heel veel moet gebeuren voor de vrouwen een gelijkwaardige positie hebben. Het glazen plafond zit al bij 40.000 euro per jaar.
brutoinkomenverdeling_475

Er zijn nog veel meer interessante zaken te ontdekken in deze grafieken.

De grafieken zijn tot ons gekomen via een online gezette presentatie van CBS-mensen. Ze maken in de toelichting over hoe big data te visualiseren, gebruik van de ruwe data die ze daar beschikbaar hebben over de inkomens van alle Nederlanders (geanonimiseerd begreep ik).
Dit is uiteraard een goudmijn voor onderzoekers ook buiten het CBS. Hopelijk komt er snel meer uit.

NB: Bovenstaande conclusie is statistisch gezien totaal onverantwoord.

Vorige Volgende