Een handleiding om een kaart te maken met Fusion Tables

Foto: Sargasso achtergrond wereldbol

DATA - Datajournalistiek betekent op zoek gaan naar patronen, opvallendheden en verklaringen in data. En journalistiek beschrijft en duidt de wereld om ons heen. Trends in ons eigen land, in Europa en in de wereld worden veelvuldig beschreven in de media, waarbij meestal wel een kaartje over ’t een of ’t ander wordt gepubliceerd. Rond verkiezingen bijvoorbeeld de verdeling van stemmen per partij over ons land, in de huidige eurocrisis de werkloosheidcijfers van alle Europese landen, of de hoeveelheid olie die landen in de wereld bezitten.

Voor Sargasso heb ik een tijdje geleden zitten prutsen met een heatmap van Nederlandse gemeenten. Het onderwerp van dat moment: de (vooral gedaalde) huizenprijzen van Nederlandse gemeenten die het Kadaster net gepubliceerd had. Ik wilde de procentuele verandering van de huizenprijzen ten opzichte van een jaar geleden in een kaart weergeven, waarop direct te zien was in welke gemeenten de huizenprijzen flink gedaald waren en waar het nog wel prima toeven was. Fusion Tables was mijn vriend. Dacht ik. Laat ik het zo zeggen: ik had veel aan een handleiding gehad. Bij deze dus.

Het idee van Fusion Tables is dat je twee tabellen kunt samenvoegen op basis van een overeenkomstige kolom. In het geval van het plotten van data op een kaart is dat handig, omdat je dan een ingewikkelde basistabel kunt gebruiken waarin gegevens over de vormen van in dit geval gemeenten staan (in KML of shapefile), kunt samenvoegen met een eenvoudige tabel met twee kolommen: een met de namen van de gemeenten en een met de data die je in de kaart wil hebben, in dit geval de huizenprijzen. De basistabel verandert niet, dus voor een volgende keer hoef je alleen maar weer een lijst met gemeenten met daarachter de data die van belang zijn te hebben.

1. Allereerst moet je een tabel met de vormen van gemeenten in Fusion Tables krijgen. Dat kan door een KML bestand met shapes te uploaden, of door een shapefile om te zetten. Omdat het CBS shapefiles van gemeenten, wijken en buurten aanbiedt, volg ik hier die laatste route. Download hier de shapefiles en zet ze met dit programma om naar een Fusion Table. Je hebt nu een tabel die er zo uitziet:

2. Nu moet je ook de tweede tabel maken, die met je eigen data die je op de kaart wil projecteren. Dat kan door een spreadheet van google docs om te zetten of wederom door een bestand te uploaden (klik in je overzicht van docs op ‘create’). Je kunt geen excelbestand direct uploaden als table, alleen csv-, tsv- of txt-bestanden. Als je wel een excelbestand hebt, kun je er het beste eerst een normale spreadsheet van maken en die spreadsheet weer omzetten naar een table (omslachtig, maar het werkt wel).

Voor nu gebruik ik twee tabellen: deze met de vormen van gemeenten en deze met de huizenprijzen.

3. Open de table met de huizenprijzen. Als je in het menu op ‘merge’ klikt krijg je een venstertje met ‘merge with another table’. In het vakje ‘merge with’ in dit venstertje kun je de link van de table met de vormen van gemeenten plakken. (Ook mogelijk: als je even in het vakje blijft staan verschijnt er een lijstje met tabellen, hier staan de gemeentenvormen als het goed is ook bij.) Je  moet nu zorgen dat links en rechts het bolletje voor de overeenkomende kolom geselecteerd is (‘gemeente’ en ‘GM_NAAM’ in dit geval). Vul tenslotte een naam voor de nieuwe, samengevoegde, tabel in onderaan en klik op ‘merge tables’.

4. Je krijgt nu een tabel waar links de kolommen uit je tabel met data staan en daarnaast de tabel waarmee hij samengevoegd is, de tabel met gemeentevormen:

5. Klik nu in het menu op ‘visualize’ en dan op ‘map’ (niet op ‘intensity map’!). Je krijgt dan een kaart die al enigszins lijkt op wat je wil hebben: je ziet de vormen van gemeenten ingekleurd met rood. Maar het is nog niet helemaal wat je wil hebben. Vlak boven de kaart zie je een aantal linkjes. Klik op ‘configure info window’ en vink hier de onderdelen aan waarvan je wil dat ze zichtbaar zijn als je met je muis op een gemeente staat. Je kunt eventueel ook nog andere teksten toevoegen in het tekstveld, wat je wil. Save dat, en klik daarna op ‘configure styles’.

In het venstertje dat dan verschijnt kun je de kleuren regelen. Klik onder polygonen op fill colors. De instellingen staan automatisch op fixed, maar voor de kaart die ik wil maken is een bucket (kleuren voor verschillende categorieën) of gradient (overlopende kleuren) nodig. Kies een van die twee en vul naar smaak in hoe je de kleuren wil hebben, je kunt gerust wat proberen. Belangrijk is wel dat je bij ‘column’ de kolom kiest waar je relevante data in zitten, ‘procentverandering’ in dit geval. Nadat je dit hebt ingesteld klik je weer op save, et voila:

Dan om jullie flink wat van mijn eigen frustratie te besparen nog een paar open deurtjes die ik pas na een tijdje zoeken in wist te trappen:

– In Fusion Tables gebruiken ze de Engelse notatie van getallen (duh, denk je, het is Google. Dat dacht ik uiteindelijk ook. Uiteindelijk.). De punt als komma en de komma als punt dus. (103,450.05 bijvoorbeeld in plaats van 103.450,05). Je kolom wordt niet goed gelezen als je dit vergeet, waardoor je er geen kaart op kan baseren.

– De lijst met gemeenten van het CBS en (in dit geval) het Kadaster komen niet overeen. De meest recente kaart van het CBS is namelijk uit 2010, en het Kadaster gebruikt de lijst met gemeenten uit 2011. Het CBS loopt dus altijd een jaartje achter, en in een jaar kan er blijkbaar veel veranderen in gemeenteland. Afijn, het is nou eenmaal zo. Check dus een aantal recent gefuseerde gemeenten en zet de waarden bij de gefuseerde gemeenten bij de aparte gemeenten (die moet je even zelf toevoegen). En ohja, veel bronnen schrijven Friese gemeentenamen ook verschillend, check ook die even op consistentie anders zit je met een paar gaten.

Reacties (3)

#1 Gert-Jan

Wat een tof programma! Dit kan ik in de toekomst wel eens nodig hebben. Bedankt!

  • Volgende discussie