“Excel is een onmisbaar martelwerktuig voor datajournalisten”

Reacties (11)

#1 weerbarst

spreadsheets++

  • Volgende discussie
#2 Weerman

Excel is liev

  • Volgende discussie
  • Vorige discussie
#3 L.Brusselman

Excel op Wiki opgezocht,de uitleg alleen al vind ik een marteling om door te komen.
http://en.wikipedia.org/wiki/Microsoft_Excel

  • Volgende discussie
  • Vorige discussie
#4 Spam

Spreadsheets en/of statistiekpakketten, ok. Maar Excel? Met een OpenOffice variant, SPSS, Matlab of Mathematica moet het ook kunnen hoor. En als je een beetje kan programmeren kan je je CSV-bestanden door iedere denkbare programmeertaal draaien.

  • Volgende discussie
  • Vorige discussie
#5 gronk

Ik wacht met grote vreze op de dag dat Steeph Access ontdekt.. the horrors…

  • Volgende discussie
  • Vorige discussie
#5.1 Steeph - Reactie op #5

De uitspraak is echt onderbouwd hoor. En het is niet dat ik onbekend ben met beschikbare tools/databases (Oracle 4 tm 11, Ingress, MySQL, diverse BI-tools, Open Office alles, SPSS, etc….)
Uiteindelijk blijk ik toch driekwart van de dingen gewoon in Excel te doen.

#5.2 about: - Reactie op #5.1

… en ik doe altijd driekwart van de dingen gewoon uit mijn hoofd, liefst op het oog, zonder te meten en zo. Wat bewijst dat nu?

  • Volgende reactie op #5.1
#5.3 Bismarck - Reactie op #5.1

Dat geeft toch maar weer aardig aan hoe ontzettend data-journalisme in haar kinderschoenen staat.

  • Vorige reactie op #5.1
#6 DrBanner

=VLOOKUP(A2,INDIRECT(CONCATENATE($E4,$C$1,$C$2),4,FALSE))

  • Volgende discussie
  • Vorige discussie
#6.1 Steeph - Reactie op #6

syntax error, not enough arguments….
:-)

#7 lapis

Tja. Misschien snap ik datajournalistiek nog niet helemaal, maar mag ik vragen hoe wetenschappelijk verantwoord dit allemaal is?

“Ja, vooraf vragen formuleren is heel belangrijk. (…) In mijn ervaring komt het slechts 1 op de 10 keer voor dat je per ongeluk iets ontdekt waar je van te voren geen vraag over had bedacht.”

Wat is je criterium voor ‘ontdekken’? Als je een dataset die maar genoeg kolommen bevat analyseert is de ‘kans’ dat je ‘iets’ ziet (zoals sterke correlatie tussen de kolommen) wat eigenlijk gewoon een statistisch verantwoorde afwijking is behoorlijk groot. Ik bedoel, je zegt het goed: eerst moet je een nulhypothese opstellen inde vorm van een vraag en dan ga je kijken of je die kunt verwerpen. Maar de reden waarom je dat doet is niet omdat je dan met kleine kans iets zult zien, maar omdat wanneer je dan iets ziet, dit met (te) grote kans onzin zal zijn.

Misschien goed om xkcd hier bij te betrekken.

  • Volgende discussie
  • Vorige discussie