Nate Silver en Shaheen de Kameel

COLUMN - In Amerikaanse sporten honkbal en basketbal wordt statistiek uitermate serieus genomen. Statistische analyses bepalen strategieën, selecties en voorspellingen van analisten en de American Statistical Association heeft een eigen afdeling en tijdschrift voor sportstatistieken. Voetbal daarentegen wordt door velen beschouwd als te complex om samen te vatten in getallen, en voorspellers hebben vaak een twijfelachtig statistisch talent, zoals Paul de Octopus vier jaar geleden en zijn huidige opvolgers Kevin de WKavia en Shaheen de Kameel.

Voor het WK in Brazilië hebben de welwillende amateurs echter concurrentie van voorspellers met serieuzere statistische cv’s, zoals de onderzoeksafdelingen van PriceWaterhouseCoopers (PwC) en Goldman Sachs, en Nate Silver, het genie van de Amerikaanse electorale statistiek.

PwC concentreert zich in hun rapport met WK voorspellingen op het uitrekenen van simpele historische correlaties. Het rapport laat zien dat WK-success samenhangt met het aantal professionele voetbalspelers in een land, het aantal toeschouwers bij professionele voetbalmatches, het thuisvoordeel en de vorm van het team, gemeten door de pre-WK prestaties. Op basis van huidige stand van deze weinig verrassende variabelen produceren de accountants een voorspelling van de kracht van elk team, waarbij Brazilië als beste uit de bus komt.

Goldman Sachs produceert regressies die het aantal doelpunten van elk team in elke match proberen te voorspellen uit soortgelijke achtergrondvariabelen. In een volgende stap gebruiken de kansverdelingen van deze voorspelde doelpunten om voor ieder team de kans op WK winst uit te rekenen. Ook hier komt Brazilië als favoriet uit de bus, met bijna 50% kans om de cup mee naar huis te nemen. Ondertussen rekenen de bankiers ook nog even uit of winst op het WK goed is voor de plaatselijke beurskoers (ja, maar slechts voor een paar weken).

Nate Silver, bekend als de man achter de griezelig accurate voorspellingen van de Amerikaanse presidentsverkiezingen, presenteert een ambitieuzer model voor het WK. Het is gebaseerd op de zogenaamde “Soccer Power Index”, dat een de sterkte van een team berekent uit de scores van zowel individuele spelers als de prestaties van het team als geheel. Nate Silver laat ook zien hoe zijn scores verschillen van die van internationale ranglijsten als die van de FIFA of ELO. De voorspellingen worden continue geüpdatet tijdens het WK, en ook deze methodologie plaatste Brazilië met grote afstand bovenaan.

Terwijl Brazilië dus voor het begin van het WK de huizenhoge favoriet is bij de statistici, stond Nederland als kanshebber bij PwC op de zestiende plaats, bij Goldman op de vijfde plaats en bij Nate Silver op de elfde. Na de monsteroverwinning op Spanje is Nederland bij Silver meteen opgeklommen tot de vierde plaats, met 7% kans op de eindoverwinning. Dat komt omdat Silver’s model dit aanvankelijk als zeer onwaarschijnlijk had ingeschat. Statistisch talent of niet, Shaheen de Kameel wist wel beter.

  1. 1

    Hebben ze die statistiekje in opdracht geproduceerd, of is de rekening ten laste van het reclamebudget ;-)
    Buiten het “Journal of Quantitative Analysis in Sports” om is het natuurlijk redelijk misplaatst om je daarmee bezig te houden.

  2. 3

    ELO is goed voor individuele sporters maar bagger voor teams vanwege het hoge verloop (resultaten van 10 jaar geleden zeggen niets). De FIFA ranking wordt verstoord door het feit dat landen meer oefen- en kwalificatiewedstrijden spelen dan toernooiwedstrijden (al helemaal voor de minder goede teams, de meerderheid).

    Die statistische modellen zijn wel interessante oefeningen om chaotische, grotendeels op toeval beruste competitieve systemen te modelleren (dat is denk ik ook waarom een bank uberhaupt een statisticus daarvoor zou betalen).