articletype

Data

De loop der wetten in de VS gevisualiseerd

DATA - Wie schiet welke wetsvoorstellen in, langs welke organen gaan die allemaal en hoeveel worden er uiteindelijk wet in de VS? Dat kan je op de site LegEx allemaal zien en naspelen. Met behulp van een indrukwekkende interactieve visualisatie zijn zowel individuele wetten als de grote stromen te volgen.
Als je een tijdje bezig bent, krijg je wel een sterk gevoel van bezigheidstherapie waarmee de senaat en het congress zich daar onledig houden.

Via

Langjarig overzicht verkeersdoden Nederland

DATA - Gisteren was in het nieuws dat er in 2013 fors minder dodelijke slachtoffers waren bij ongelukken in het verkeer.
We hebben even de cijfers vanaf 1950 erbij gezocht om dit in langjarig perspectief te plaatsen.

Allereerst het absolute aantal verkeersdoden per jaar in Nederland:

verkeersdoden_1950_2013_475

En dan het aantal verkeersdoden gedeeld door het bevolkingsaantal in dat jaar. Dat kan je zien als de kans dat een persoon in een jaar een dodelijk verkeersongeluk krijgt:

verkeersdoden_kans_1950_2013_475

Anders uitgedrukt waren er vorig jaar iets meer dan 3 doden per 100.000 inwoners.

Hier de data (csv, puntkomma als scheidingsteken)

Heatmap lettercombinaties uit taalgebruik reaguurders (m/v)

DATA - Ergens op het internet maakte iemand een heatmap van lettercombinaties op basis van een Engelse woordenlijst. Een tweet in Nederland hierover leverde per omgaande een bak met data om een soortgelijk iets te doen.

Alleen dan net anders.

Want het gaat in dit geval niet om een woordenboek, woordenlijst of iets anders gestructureerds. Het gaat om het taalgebruik op twee nogal omvangrijke fora. Eentje waarvan vast staat dat meer dan driekwart van de reaguurders vrouw is en eentje waar zeker driekwart man is.

Zou dat nog wat leuke inzichten opleveren?

We hebben het in drie stukken opgedeeld. Allereerst alle tweelettercombinaties op basis van alle unieke woorden die we konden vinden. Daarna op basis van alle tekst (minus dingen met accenten en zo). En tot slot even de unieke letters voor de verschillende varianten.

Laten we beginnen met de 2grammen voor de unieke woorden op respectievelijk het vrouwenforum en het mannenforum. Verticaal de eerste letter, waarbij ^ staat voor blanco (dus dan tweede letter gelijk beginletter woord). En horizontaal de tweede letter, waarbij $ staat voor blanco, oftewel einde woord.
v_uniek_475
m_uniek_475

Let op, de heat map is gemaakt op basis van logaritme van de getallen. Anders was er te groot verschil tussen de hoogfrequente combinaties en de weinig voorkomende.

Stijging asielzoekers 2013 in langjarig perspectief

DATA - Vandaag publiceerde de IND de cijfers over het aantal asielzoekers in 2013. Een ‘forse toename‘ wordt gemeld.

Van 2012 naar 2013 is er sprake van een toename van 30%. Dat is inderdaad fors te noemen. En dat brengt 2013 ook op een niveau dat we in Nederland niet meer gekend hebben sinds 2002.

Maar voor het juiste perspectief is het goed om ook de periode ervoor zichtbaar te maken. Hier de jaarcijfers vanaf 1998:

asiel_1998_2013jr_475

Let op, dit zijn alleen asielaanvragen.

Foto: Tax Credits (cc)

Ongelijkheid in Nederland breder probleem

DATA - Pakkende kop in de Volkskrant vandaag: “Rijkste 1 procent bezit bijna een kwart van alle vermogen”. Maar de focus op alleen de rijkste 1% verhult de bredere trend.

Het is namelijk niet zo dat vooral de allerrijkste een steeds groter deel van de koek hebben. Nee, eigenlijk zit de breuk tussen de bovenste 30% en de rest. De bovenlaag wordt rijker, de rest armer. Hoewel in de middenklasse het effect wat minder sterk is.

Laten we dit illustreren aan de hand van het aandeel in het totale vermogen van Nederland (uitgezonderd pensioenen) van respectievelijk de rijkste 10% en rijkste 30%.
vermogen_2006_2012_475

Natuurlijk zorgt het weglaten van de pensioenpot voor een vertekend beeld. Die pot is namelijk net zo groot als de rest van het vermogen. Echter, een pensioen kan je niet vrij in direct besteedbaar geld omzetten. En een pensioen gaat niet mee in de erfenis naar de kinderen.

Het is dus wel degelijk van belang om te zien dat de trend voor de bovenkant van Nederland gunstiger is dan voor de rest.

De Volkskrant gaf in haar analyse aan dat een van de oorzaken ligt in de opbouw van het vermogen. Huizenprijzen daalden, daar heeft iedereen last van. Maar aandelen en andere beleggingen, welke vooral bij de rijken zitten, stijgen weer.

Wereldtemperatuur | Update februari 2014

DATA - Februari mocht dan in Nederland buitengewoon warm zijn geweest, wereldwijd kwam het niet verder dan de veertiende plaats voor de laatste 36 jaar.

Overigens kende februari 2014 geen dagrecords qua maximumtemperatuur in Nederland. Afgelopen maart daarentegen, had er maar liefst vijf.

Maar goed, wereldwijd een dip dus ten opzichte van januari.

wereldtemp_201402_475

De grote vraag die nu leeft onder veel volgers van dit onderwerp is: komt er een stevige El Niño dit jaar of niet? De meest recente voorspelling wijst wel in die richting:

figure4

Verder nog wat losse nieuwtjes uit de klimaatwereld: een aantal onderzoekers maakt zich zorgen over de mogelijke veranderingen in de diepere oceaanstromen. De bufferwerking voor zowel energie (warmteopslag in de diepe oceaan) als CO2-opvang zou daarmee kunnen verzwakken. Dit zou direct effect hebben op de opwarming van de lucht in de rest van de wereld.

Amerikaanse wetenschappers luidden een paar weken geleden de noodklok. Waarom ze dat deden vlak voor het verschijnen van het rapport van werkgroep II van het IPCC (over impact opwarming) is niet duidelijk.

Als toetje een studie over het ijsverlies van de gletsjers op Antarctica. Dat zegt dus weinig over het ijsoppervlakte aldaar, maar wel over het ijsvolume.

Foto: Maar de media-aandacht blijft achter.

Criminaliteit daalt voor negende jaar op rij

DATA - In negen jaar tijd is de geregistreerde criminaliteit per 1000 inwoners in Nederland met twintig procent gedaald. Ook in 2013 daalde de criminaliteit door. Helaas daalde ook het percentage opgeloste misdrijven.

En net als vorig jaar levert deze structurele daling geen grote krantenkoppen op. De aandacht ging uit naar kleine stukjes van de data, zoals over woninginbraken.

Hier de meest recente data van het CBS in drie duidelijke grafieken:

crimi_05_13_per1000_475

crimi_05_13_aant_475

crimi_05_13_oplos2_475

De trend m.b.t. het slachtofferschap vertoont dezelfde dalende lijn, alleen iets minder consequent.

Hebben we eens een keer structureel goed nieuws, is er nauwelijks aandacht voor…

Foto: Kort - illustratie Sargasso

KORT | Datajournalistiek is ook niet meer wat het geweest is

DATA - Fittie in columnistenland USA.

Nate Silver, die zijn reputatie vestigde door de uitkomst van de Amerikaanse presidentsverkiezingen in zowel 2008 als 2012 een heel stuk accurater te voorspellen dan welke gevestigde politieke analist dan ook, heeft het aan de stok met econoom en New York Times-columnist Paul Krugman.

Silver lanceerde onlangs een eigen nieuwssite, FiveThirtyEight, onder de aegis van de Amerikaanse sportgigant ESPN. De initiële reacties (I, II, III) waren al niet onverdeeld gunstig, maar toen Paul Krugman eveneens met stevige kritiek kwam aanzetten, was de boot natuurlijk aan. De kern van Krugmans bezwaren:

But I’d argue that many of the critics are getting the problem wrong. It’s not the reliance on data; numbers can be good, and can even be revelatory. But data never tell a story on their own. They need to be viewed through the lens of some kind of model, and it’s very important to do your best to get a good model. And that usually means turning to experts in whatever field you’re addressing.

Unfortunately, Silver seems to have taken the wrong lesson from his election-forecasting success. In that case, he pitted his statistical approach against campaign-narrative pundits, who turned out to know approximately nothing. What he seems to have concluded is that there are no experts anywhere, that a smart data analyst can and should ignore all that.

Geraamde kosten JSF dalen!

DATA - Na ruim 16 jaren van steeds verder oplopende kosten per te leveren JSF (F-35), waar Nederland ook een stuk of 30 wil hebben, geeft het laatste rapport van de Amerikaanse interne accountant aan dat die kosten nu dalen. Niet veel, maar toch het vermelden waard. We gaan van $161.000.000 naar $159.000.000 per stuk.

Dat de software van het vliegtuig nog niet getest is, nemen we maar even voor lief.

jsf_f35_2013_475

Aantal meldingen antisemitische incidenten CIDI sinds 2000

DATA - Vandaag was de jaarlijkse rapportage van het CIDI van het aantal antisemitische incidenten in het nieuws. Met enige regelmaat hebben we de cijfers van het CIDI getoond over een langere periode dan de meestal genoemde twee laatste jaren. Hoogste tijd om dat weer te doen.

Het moge duidelijk zijn dat er sprake is van een stevige stijging. CIDI maakt zich zorgen of mogelijk lage meld bereidheid. Dat blijft natuurlijk lastig te verifiëren als daar niet expliciet onderzoek naar gedaan wordt.
Hier de wel gemelde cijfers sinds 2000:
cidi2014_475

Foto: Toshiyuki IMAI (cc)

Wereldtemperatuur | Update januari 2014

DATA - Het hing er in januari maar helemaal vanaf waar je op de aardkloot verbleef of je de opwarming een hoax zou vinden of juist niet. Het weer was zo extreem dat het gemengde reacties opriep.

Maar wij doen hier niet aan het weer. Wij doen hier aan het saai maandelijks volgen van de onderliggende trend met betrekking tot het klimaat. En daar gaan we dus ook in 2014 gewoon mee door.

De cijfers van met name Hadcrut lieten even op zich wachten. Vandaar nu pas de update over de maand januari:
wereldtemp_201401_475

Voor wie er zin in heeft, is het mogelijk om de trends nu op lokaal niveau te bekijken middels Google Earth. Dan natuurlijk van alleen de Crutem4 dataset.

Terwijl het zeeniveau rustig doorstijgt, geeft een nieuw rapport aan dat dit uiteindelijk zeker 1 op de 20 wereldburgers direct gaat raken. En uiteraard neemt de waterschade ook snel toe. Verviervoudiging in 2050 alleen al voor Europa.

En elders een bericht over de toenemende kans op extreme hitte.
Het plaatje halverwege inspireerde me overigens de data uit een eerdere post van mij in een gelijke opzet te presenteren:
records_nl_50_00_475
De verhouding voor het lopende decennium zal vast iets anders zijn. Al was het maar omdat we nu al meer kouderecords hebben dan in het hele vorige decennium.

Vorige Volgende