DATA - door Merlijn Staps.
Er gaat letterlijk geen dag voorbij zonder dat er ergens in Nederland een treinstoring is. Wanneer de treinen weer gaan rijden krijg je van de NS vaak niet te horen. Statistieken kunnen je wel helpen.
Wie regelmatig met de trein reist heeft het allemaal al eens meegemaakt. Seinstoring. Wisselstoring. Aanrijding met een persoon. Herstelwerkzaamheden. Hoewel 90% van de treinen op tijd rijdt, onthouden we vooral die keren dat het misgaat. Zoals die keer dat je uren op een station door moest brengen omdat er geen treinen rijden en een belangrijke afspraak miste.
Veel van de frustratie gaat hem zitten in gebrekkige communicatie. Wanneer er weer treinen gaan rijden, blijft meestal lang onduidelijk. Wel krijg je meestal snel de storingsoorzaak te horen. Vertelt dat je iets over hoe lang je nog moet wachten? Is een storing veroorzaakt door een defecte trein bijvoorbeeld sneller opgelost dan een seinstoring?
De website RijdenDeTreinen.nl houdt real-time alle verstoringen op het Nederlandse spoorwegnet bij. Dit zijn niet de “gewone” vertragingen van een trein die 5 of 10 minuten te laat is, maar grotere storingen waarbij het treinverkeer op een bepaald traject langer ontregeld is. Van de gemiddeld iets meer dan 10 dagelijkse storingen wordt bijgehouden waar ze door zijn veroorzaakt, hoe lang ze duren, en welke trajecten betrokken zijn.
Ik dook in deze dataset (met vanaf 2011 al meer dan 18,000 storingen) om te kijken waar al die verstoringen vandaan komen. En om te kijken wat dat zegt over hoe lang zo’n storing dan gaat duren.
1 op de 3 storingen komt door een defecte trein
In totaal werden er 3728 storingen gemeld in 2017. Dat zijn er iets meer dan 10 per dag. Vooral defecte treinen (1313x) veroorzaken vaak een storing. Maar ook seinstoringen (314x), wisselstoringen (302x) en aanrijdingen met een persoon (248x) komen bijna dagelijks voor.
Relatief weinig storingen worden veroorzaakt door volledig externe factoren, zoals een aanrijding, blikseminslag of een boom op het spoor. Problemen met materieel of infrastructuur zijn de grootste boosdoeners.
De invloed van de weersomstandigheden valt ook mee. Het weer is er wel voor verantwoordelijk als het héle spoorwegnet in de problemen komt. Op drie dagen in 2017 werden meer dan 30 storingen gemeld, en dat had telkens met noodweer te maken: 22 juni (hittegolf; blikseminslagen) en 11 en 12 december (zware sneeuwval; code rood).
Welke storingen worden snel opgelost?
Als er zich een storing op je traject voordoet, wil je natuurlijk vooral weten hoe lang die nog gaat duren. Een gemiddelde storing duurt twee uur, maar de variatie is enorm. Zo’n 30% van de storingen is binnen een halfuur al opgelost, terwijl 1 op de 10 storingen ook langer dan 4 uur duurt.
Wat zijn nu de vervelendste meest vertragende storingen? De volgende grafiek geeft aan hoe snel verschillende soorten storingen worden opgelost. (Alleen storingsoorzaken die minstens 100 keer voorkwamen in 2017 zijn meegenomen.)
Als een storing wordt veroorzaakt door een persoon op het spoor is dat een geluk bij een ongeluk, want deze storing wordt razendsnel het snelst opgelost. In 89% van de gevallen binnen een uur. Het horrorscenario is een defecte bovenleiding. Wordt dat omgeroepen, kun je beter omreizen of ander vervoer regelen. Gemiddeld (!) duurt het oplossen meer dan drie uur.
Wat in de grafiek opvalt is dat niet alleen de tijdsduur verschilt per oorzaak, maar ook de vorm van de grafiek. De meeste grafieken hebben dezelfde vorm die hoort bij een exponentiële afname (je ziet een zelfde curve bijvoorbeeld bij verval van radioactief materiaal). Hier wil dit zeggen dat de kans dat de storing wordt opgelost, op ieder moment gelijk is. Of je nou pas een halfuur of al twee uur staat te wachten, de kans dat de storing de komende vijf minuten wordt opgelost is onveranderd. De vreemde eend in de bijt is de curve bij “aanrijding met een persoon”. Het is altijd een paar uur wachten voordat zo’n storing verholpen is.
Conclusie
Treinstoringen hebben veel verschillende oorzaken, maar defecte apparatuur (kapotte seinen, wissels of treinen) nemen verreweg de meeste storingsuren voor hun rekening. Van initiatieven om het aantal spoorlopers terug te brengen hoeven dus geen wonderen verwacht te worden, want voor elke storing veroorzaakt door een persoon op het spoor worden er 10 veroorzaakt door een defecte trein.
Hoewel er veel onzekerheid is, zorgt de ene oorzaak voor een stuk langere storingen dan de andere. De volgende keer dat je op een station strandt, kun je de grafiek hierboven erbij pakken – dan weet je (gemiddeld) wat je te wachten staat.
Data in beeld
Dit blog verscheen eerder op Studium Generale Utrecht en is de laatste aflevering van de serie “Data in beeld” waarin stagiair Merlijn Staps gebruik maakt van data om populaire ideeën tegen het licht te houden. Wat kunnen we leren van statistieken? En bevestigen de cijfers onze intuïtie of juist niet? De andere blogs van de serie kun je hier teruglezen.
Reacties (13)
dat is niet zo gek.
@1: precies. En dat is ook een mooie illustratie dat je er met alleen leuke grafiekjes en doorsnedes er niet bent, en dat @0 dan dus ook niet veel meer doet dan open deuren intrappen.
Da’s geen verwijt naar @0, maar eerder een probleem wat je altijd hebt met dit soort data-analyses. Natuurlijk ga je vinden dat amsterdam en utrecht drukke stations zijn. Iedere treinreiziger kan je dat vertellen.
Je zult ook ‘inhoudelijke kennis’ (van buiten het systeem) moeten hebben voor je dit soort data beter kunt plaatsen. En dat is IMO ook de reden waarom een AI-achtige aanpak ook niet gaat werken om ‘patronen’ in de data te zien; je wilt achterliggende oorzakelijke verbanden kunnen vinden.
Typisch voor zo’n data-aanpak is bijvoorbeeld ‘om 7 uur in de lente gebeuren de meeste ongelukken, vooral met even treinnummers, dus laat vooral oneven treinen vertrekken’. Terwijl de eigenlijke reden is ‘om 7 uur in de lente staat de zon net pal boven de horizon waardoor machinisten verblind raken en de seinen niet meer zien’. Maar zoiets zul je niet vinden omdat een ‘machine learning’ algoritme geen kennis heeft van de buitenwereld.
@: “Een gemiddelde storing duurt twee uur, maar de variatie is enorm” Dat wetende is het weinig informatief als alleen de aantallen storingen zijn weergegeven.
@: “statistieken kunnen je wel helpen.” mits het deze goed bruikbaar zijn en dat kan ook zonder ‘machine learning’.
Het aantal verstoringen in de treinenloop is wellicht afhankelijk van de totale lengte van het spoorwegnet.
In 2006 lag er 2797 km. spoorweg in Nederland.
In 2016 was dat 3058 km.: 9% meer dan in 2006. (bron)
Zal het spoorwegnet in Nederland blijven groeien? Of zitten we inmiddels op peak-spoorwegen?
@4: Niet alleen het aantal kilometer rails, ook de drukte qua aantal treinen. Dat zijn er inmiddels zoveel dat ze die ook niet zo 1-2-3 kwijt kunnen: Bij de jongste staking besloten de machinisten van Arriva om veiligheidsredenen door te rijden, want ’Even’ naar het rangeerterrein rijden, is er niet bij.
Die onduidelijkheid heeft toch niet per definitie met gebrekkige communicatie te maken? Uit de grafiekjes blijkt al dat er geen vaste tijdsduur te geven is waarin een bepaalde oorzaak op te lossen is. Als de oorzaak bekend is, hoeft dus nog niet bekend te zij hoe lang het gaat duren. En als de NS zelf nog niet weet hoe lang het gaat duren, kunnen ze dat ook niet aan hun reizigers vertellen.
Ze zouden er natuurlijk voor kunnen kiezen om op de gok in indicatie te geven. Maar dat zou soms wel eens frustrerender uit kunnen vallen dan melden dat het nog niet bekend is. En in zulke gevallen zou ongetwijfeld het verwijt volgen dat de NS slecht communiceert.
Het aantal treinen dat niet (op tijd) rijdt is één ding. Het aantal reizigers dat niet op tijd aankomt lijkt mij een belangrijker maatstaf voor de kwaliteit van de dienstverlening. De NS zijn er niet voor het laten rijden van treinen, maar voor het vervoer van reizigers. Ze moeten uiteindelijk dus ook daarop worden beoordeeld.
In bovenstaande statistieken mis ik het tijdstip waarop de vertraging optreedt. Ik heb de indruk dat er in de spits meer problemen zijn dan op het midden van de dag. Met als gevolg dat grotere aantal mensen niet op tijd op hun bestemming kunnen komen.
@5: [ Niet alleen het aantal kilometer rails ]
Precies! Want in de jaren ’30 en ’40 lag er al meer dan 3.000 km rails, toen waren er ook tientallen lokale sporen die vrijwel allemaal zijn doodgeconcurreerd door bussen en vrachtwagens.
Daarnaast zijn reizigerskilometers weer een ander verhaal.
Als je wel eens Amsterdam Centraal in- of uitrijdt, of liever “wandelt”, over die kilometerslange vijfsporige rails met “duizenden” wissels, dan snap je ook waarom destijds de stoomtrein naar Hilversum sneller was dan de elektrische van vandaag.
@8: De sporen met Amsterdam CS worden tegen hoge kosten (gebruikelijk bij de NS) verbeterd door het aantal perrons van 15 naar 9 te verminderen. Station Zuid met 4 perronsporen sluit aan op de spoorverdubbeling tot 4 sporen, een investering die dus nooit volledig benut kan worden.
Bij spoorinvestering is effektiviteit onbelangrijk. Zo is de spoorverdubbeling tusen Utrecht en Amsterdam _ zo’n 20 km – geschikt gemaakt voor een snelheid van 300 km. Met zo’n snelheid wordt zelden of nooit gehaald.
We kopen ook nog altijd auto’s die veel harder dan 130 kmh kunnen…
@10: Ook bij het klimaatakkoord mobiliteit is het verband tussen snelheid en CO2 uitstoot (maar ook lawaai en vervuiling) niet ontdekt. Uitziende naar de techniek tot schone mobiliteit schuiven ze dit (ook) onder het tapijt, wel zo gemakkelijk.
Er staan een paar vreemde dingen in het artikel. Zo staat er eerste dat aanrijdingen met een persoon bijna dagelijks voorkomen, en direct daarna staat dat er relatief weinig verstoringen door “volledig externe factoren, zoals een aanrijding […]” komen. Wat is het nu?
Ik denk ook dat de analyse veel te dun is om te concluderen dat het weer geen significante invloed heeft. Je weet immers niet wat de oorzaak is van de storing van een trein, wissel of sein? Als je dat niet analyseert, dan zie ik niet hoe je tot de conclusie kan komen dat het niet het weer kan zijn. Het weer komt op zichzelf ook helemaal niet voor, maar kennelijk is er een correlatie gemaakt met extreme weersomstandigheden en de momenten waarop een storing optrad?
Ik vraag me af of dat ook impact zou kunnen hebben op de duur van storingen. Zo ging bijvoorbeeld in januari, toen het zo stormde, uiteindelijk het hele spoorverkeer plat. Ik kan me voorstellen dat (maar ik heb niet onderzocht of) bepaalde types verstoringen vaak voorkomen door dit soort externe omstandigheden (beschadigde bovenleidingen door omgewaaide bomen, bijvoorbeeld). Probleem is dat je in een dergelijk geval niet maar één hebt, maar er een grote kans is dat je op diverse plaatsen tegelijk zulke problemen krijgt doordat het noodweer niet tot maar één plaats beperkt blijft. Dat heeft dan natuurlijk ook direct impact op de benodigde tijd om e.e.a. te herstellen…
@12: Ik zie de tegenspraak niet. Een aanrijding per dag is blijkens de data relatief weinig. Er waren in 2017 bijna 8 keer zoveel storingen met een technische reden.