Thema Data

Populariteit Trump lager dan al zijn voorgangers sinds WOII

DATA - FiveThirtyEight heeft de populariteitsscores van Trump vergeleken met die van zijn voorgangers vanaf de Tweede Wereldoorlog. De conclusie is niet echt verrassend: hij is impopulairder dan al zijn voorgangers sinds de Tweede Wereldoorlog op hetzelfde moment waren en uberhaupt zelfs impopulairder dan veel van zijn voorgangers ooit waren.

Hoe de media de angst voor terrorisme aanwakkeren

DATA - Alle aandacht voor terrorisme in de media is niet echt in verhouding en wakkert alleen maar de angst voor terrorisme aan:

A very large portion of the news we consume is about terrorism in America and Europe. That coverage has consequences on how people live their lives.

In the wake of the San Bernardino terrorist attacks, one women (who did not yet have kids) told the New York Times she planned to home school her future children for fear of mass shootings. Another man recounted that he now watches movies at home instead of in public theaters. Another stated she now steers clear of crowded public areas.

We hear about terrorists attacks in the media and then adjust our lives based on how we process that information.  But is the amount of media coverage dedicated to terrorism in the West in anyway commensurate with the actual risk of terrorism we face?

In this article, let’s see how an American newspaper (The New York Times) covers terrorism, and show that this selective coverage can give us a distorted sense of the world using actual data. The aim of this analysis is to show how news media — especially social media — cover/distributes a non-representative set of events based on what is relevant/engaging to their audience. Readers and viewers then use this selective data to infer what the entire reality is.

Media is data for human decisions, and selective media is selective data. Selective data can lead to bad inferences and bad decisions, as was the case with the explosion of the Space Shuttle Challenger. Selective facts can actually be worse than no facts or fake news, as it can give us a false sense of confidence.

Wereldtemperatuur | Update december 2016

DATA - Het is u vast niet ontgaan, 2016 is het warmste jaar wereldwijd sinds 1850. En dit keer is er geen enkele dataset die dat tegenspreekt, ook niet die van de dubieuze satellietreconstructies. Maar goed, dat was al een paar keer bewezen inmiddels.

Dus hier, zonder feestje, weer ons maandelijkse overzicht met in alle langjarige reeksen weer records. Eentonig, maar hopelijk een aanmoediging om toch vooral nog actiever te worden in het verminderen van uitstoot van broeikasgassen. Bijvoorbeeld door op de juiste partij te stemmen.

Eerste grote klimaatreeks: 2016 wereldwijd warmste jaar sinds start meting 1891

DATA - Eerste grote klimaatreeks: 2016 wereldwijd warmste jaar sinds start meting 1891. Vanuit Japan de eerste volledige set (landmetingen) over 2016. Daaruit blijkt dat 2016 het record gebroken heeft, maar met een kleine marge.

Overigens geven zelfs de twee controversiële reeksen gebaseerd op satellietmetingen ook een record voor 2016 aan.

Top 2000: een analyse

DATA - Even voor middernacht op oudejaarsavond schalde Bohemian Rhapsody van Queen als nummer 1 van de Top 2000 de ether in. In deze gastbijdrage analyseert Arjan van der Meij de Top 2000.

Ik heb er al eens eerder over geschreven en vorige jaar wat getweet. Maar ik kan het niet laten. Een paar dezelfde dingen als de voorgaande jaren en wat nieuwe dingen. Gewoon, op grond van de data die beschikbaar is. Ik gebruik de lijst die staat op wikipedia. Ik heb eerst geprobeerd de lijst van de Top 2000 zelf te mergen. Die verschilt echter met vorig jaar soms. Zo staat er in de oude lijst bijvoorbeeld wel eens: “Prince” en in de nieuwe “Prince and the Revolution”. En mijn Excel snapt dan niet dat dat hetzelfde is. Uiteindelijk heb ik deze lijst gebruikt. De analyse gaat over de data van 2016 behalve als dat niet zo is. Dan wordt dat aangegeven. Voel je vrij om ook aan de slag te gaan!

Wereldtemperatuur | update november 2016

DATA - Onze maandelijkse klimaatupdate dit maal ruim op tijd. Zelfs nog voor de Kerst. Ter overweging. Met nog 1 maand te gaan stevent 2016 af op weer een record. En op de Noordpool wordt het tijdens de Kerst waarschijnlijk warmer dan ooit gemeten sinds 1958. Die bontmuts kan de Kerstman beter afzetten dan.

Wereldtemperatuur | Update oktober 2016

DATA - Terwijl Al Gore een gesprek had met Donald Trump, de nieuwe president van de VS, kwamen eindelijk de laatste klimaatcijfers over oktober binnen. En hoewel El Nino over is en de maandrecords dus even achterwege blijven, breken alle langjarige reeksen nog steeds records.
Hier is de grafiek voor deze maand.

wereldtemp_201610_475

Normering eindexamens wellicht te soepel

DATA - Eind oktober 2013 kwam het ministerie van OC&W met het juichende bericht dat in 2013 meer leerlingen – en bovendien met hogere cijfers – waren geslaagd voor eindexamens in het voortgezet onderwijs dan in voorgaande jaren. Deze verbetering vond met name plaats in het havo en het vwo. Een nadere analyse van de door het Cito gepubliceerde data leert dat in ieder geval voor het vwo deze claim boterzacht is.

Staatssecretaris Dekker reageerde destijds als volgt:

De Belangrijkste conclusie is dat het hoger leggen van de lat een positief effect heeft. De cijfers bij een aantal kernvakken zijn flink verbeterd, en ondanks de aangescherpte eisen zijn de slaagpercentages juist omhooggegaan. Leerlingen en scholen hebben hard gewerkt en daardoor een goed resultaat behaald. Dat verdient een groot compliment!

Afgezien van het feit dat hij hiermee suggereert dat leerlingen en leraren in voorgaande jaren niet hard genoeg hebben gewerkt om een goed resultaat te behalen, is het nog maar de vraag of de conclusie van het ministerie klopt.

Strengere eisen eindexamens

Toenmalig staatssecretaris Van Bijsterveldt besloot in 2008 om de zak/slaagregeling voor het voortgezet onderwijs aan te scherpen. Met ingang van het examenjaar 2012 werd de regel ingevoerd dat leerlingen gemiddeld over alle vakken van het centraal eindexamen minimaal een 5,5 moesten halen. In 2013 werd dit gevolgd door de eis dat een leerling voor de kernvakken Nederlands, Engels of Wiskunde niet meer dan één vijf mag hebben.

Ervan uitgaande dat de leerlingen even slim blijven en de examens even moeilijk, zouden deze fors strengere eisen moeten leiden tot een lager slagingspercentage. Het is dan ook verrassend dat het slagingspercentage juist is gestegen. Als verklaring geeft het Ministerie van Onderwijs dat de leerlingen vaardiger zijn geworden. Onderstaande grafiek laat zien dat na 2012 het gemiddelde examencijfer een sprong heeft gemaakt en structureel ongeveer 0,2 punt hoger ligt dan in de voorafgaande jaren.

Ontwikkeling gemiddeld cijfer eindexamens

Allesbepalende rol voor de N-term

In de brief aan de kamer gaat de staatssecretaris expliciet in op de mogelijkheid dat de verrassend goede cijfers het gevolg zijn van een (te) soepele beoordelingsnorm. Deze mogelijkheid wijst hij echter van de hand door te verwijzen naar een bijlage waarin de normeringsystematiek van de eindexamens wordt beschreven:

Het College voor Examens (CvE) heeft de opdracht om de prestatie-eisen die aan leerlingen worden gesteld constant te houden. Het uitgangspunt bij de normering van het centraal examen is dat de vaardigheid die een leerling moet tonen om een voldoende te scoren door de jaren heen gelijk is. Als er sprake is van een dalend of stijgend gemiddeld cijfer, correspondeert dit met een dalende of stijgende vaardigheid van de betreffende leerlingen.

Om die constante prestatie-eisen te waarborgen, worden de scores voor de eindexamens gecorrigeerd met de normeringsterm (N-term). Deze normeringsterm is een ijkvariabele die zo wordt vastgesteld dat het examen vergelijkbare eisen stelt als in voorgaande jaren. In principe varieert deze N-term tussen 0 en 2. In het kort komt het erop neer dat hoe meer vragen van een examen goed werden beantwoord, hoe lager de N-term behoort te zijn (en omgekeerd). De N-term wordt elk jaar apart voor elk vak van elk schooltype vastgesteld. Globaal worden de cijfers volgens de volgende formule berekend:

Cijfer = 9 x (punten / maximaal aantal punten) + N

De vaststelling van deze N-termen is een delicaat proces: leerlingen in het ene jaar mogen niet worden bevoordeeld ten opzichte van leerlingen in andere jaren. Onderstaande grafiek laat per jaar de gemiddelde N-term zien ten opzichte van de verhouding goed beantwoorde vragen (p-waarde) voor de jaren 2005 tot en met 2016.

P-waarde versus N-term eindexamens 2005 - 2016

De jaren 2013 t/m 2016 staan meer in de rechterbovenhoek dan de overige jaren. Een en ander wordt nog duidelijker als je trendlijnen toevoegt voor de jaren t/m 2012 en de jaren vanaf 2013.

P-waarde versus N-term eindexamens 2005 - 2016; inclusief trendlijnen

Duidelijk is te zien dat de trendlijn voor de periode vanaf 2013 naar rechts/rechtsboven is verschoven. Dit betekent dat in de jaren vanaf 2013 voor eenzelfde percentage goed beantwoorde vragen een naar verhouding hogere N-term is vastgesteld dan in voorgaande jaren. Dit effect is ongeveer 0,25 punt, hetgeen ongeveer overeenkomt met de stijging van het gemiddelde cijfer. Logisch gevolg is dat de cijfers in 2013 en daarna hoger liggen dan in de jaren daarvoor. Eenzelfde patroon is te zien bij alleen de kernvakken (Nederlands, Engels, wiskunde A & wiskunde B).

P-waarde versus N-term eindexamens 2005 - 2016: kernvakken met trendlijnen

Om te bepalen of er sprake is van toeval of niet, is het ten eerste noodzakelijk om te kijken naar de procedure waarmee de N-term wordt vastgesteld en vervolgens naar de mogelijke oorzaken van deze afwijking.

De procedure om tot vaststelling van de N-term te komen bestaat uit drie stappen. Eerst maakt het CITO een technisch normeringsadvies. Dit technisch advies baseert het CITO onder meer op een analyse van de toets als geheel, de individuele vragen van de toets en eventueel de gegevens van een pre-test of een post-test.

Vervolgens gaat dit technisch advies naar de vaksecties van het College van Examens. Indien de vaksecties dit wenselijk achten, kunnen zij dit technisch advies aanpassen. Tijdnood of onduidelijkheden in de vraagstelling kunnen hier bijvoorbeeld aanleiding toe geven. Op basis van de uitkomsten van de eerste twee stappen stellen uiteindelijk de voorzitter, de directeur en de sectormanagers van het College van Examens de N-termen vast.

Mogelijke oorzaken

De grote vraag is nu hoe het komt dat de N-term in de jaren vanaf 2013 zo hoog is vastgesteld. Hiervoor zijn een aantal mogelijke verklaringen aan te voeren.

Het zou kunnen zijn dat de lichting die in 2013 examen deed slimmer was dan voorgaande lichtingen. Hoewel volgens het Flynn-effect het IQ in de loop der jaren stijgt, is het niet aannemelijk dat dit de verklaring is voor de plotselinge stijging in de eindexamencijfers. Statistisch gezien, is het onwaarschijnlijk dat leerlingen van het ene op het andere jaar intelligenter zijn geworden.

Iets waarschijnlijker is het dat leerlingen vaardiger zijn geworden. Een toename in vaardigheid kan een gevolg zijn van beter onderwijs, gerichtere voorbereiding op de eindexamens of meer selectie doordat zwakke leerlingen eerder afstromen naar lagere schooltypen. Hoewel het onwaarschijnlijk is dat het onderwijs in één jaar significant verbetert, is het niet onaannemelijk dat door de strengere normen harder is geoefend voor de eindexamens.

Onderstaande grafiek laten de verdeling zien van eindexamenkandidaten over verschillende schooltypen gedurende de periode 2004-2016. Opvallend is dat na een jarenlange daling vanaf 2012 het vmbo naar verhouding weer meer eindexamenleerlingen heeft. Bij het havo vlakt de stijging van het aandeel af terwijl het aandeel van het vwo afneemt. De afname van het aandeel van het vwo kan verschillende oorzaken hebben. Strengere selectie aan de poort en een hogere afstroom naar het havo kunnen mogelijke de afname van het aandeel van het vwo verklaren. In beide gevallen leidt dit ertoe dat het gemiddelde niveau van de vwo-leerlingen hoger wordt.

Verdeling kandidaten eindexamens 2004 - 2016

Het uiteindelijke plaatje

Zoals de staatssecretaris terecht opmerkt hoort een dalende of stijgende vaardigheid te corresponderen met een dalend of stijgend gemiddeld cijfer. Hoewel het aannemelijk is dat de gemiddelde leerling vaardiger is, is dat niet direct een reden om de leerlingen een extra cadeautje te geven in de vorm van een hogere N-term en dus een hoger cijfer.

Het lijkt er in ieder geval erg sterk op dat voor de jaren vanaf 2013 de N-term te soepel is vastgesteld. Aangezien een kleine aanpassing grote gevolgen kan hebben, is het slagingspercentage in de afgelopen jaren eigenlijk te hoog geweest. Vele vwo leerlingen hebben dan ook mogelijk hun diploma te danken aan de soepele normering die de afgelopen jaren is gebruikt. De conclusie van het ministerie van OC&W dat het aanscherpen van de eisen leidt tot betere prestaties kan dus hoogstwaarschijnlijk de prullenbak in.

Gebruikte data