Statistiek poolgebiedschatting rommelig

Eergisteren is een nieuwe schatting van de winbare olie- en gasvoorraden op het poolgebied uitgekomen. Volgens de United States Geological Survey (USGS) zijn er 90 miljard vaten olie, 44 miljard vaten natural gas liquids en 1670 biljoen kubieke voet aardgas te vinden in het gebied. Goed voor 4 jaar aan mondiale aardolieconsumptie (90 + 44) en 16 jaar aan aardgasconsumptie. Vooral West-Siberië, Oost-Groenland, de Oost-Barentszee en het arctische deel van Alaska zouden goed bevoorraad zijn.

Het lijken gedegen cijfers van een instituut dat al meer dan 100 jaar bestaat, maar ze zijn te optimistisch. Dat komt door de statistische methodiek die de USGS hanteert. Gebaseerd op geologische schattingen wordt de kans van 5%, 10%, 15%, 20%,.. tot 95% uitgerekend voor het vinden van een te verwachten hoeveelheid olie en gas. Met als aanname dat de kansberekening perfect correleert met de aanwezig geachte voorraden, wat in zichzelf geen sterke aanname is. Vervolgens komt vanwege die aanname de echte misstap, het gemiddelde van al deze berekeningen wordt genomen als de waarde van het te vinden olie- en gaspotentieel. Je kan er dan vanuit gaan dat je schatting te optimistisch uitvalt, omdat je alle grote waardes met kleine kans gelijk afweegt tegen kleine waardes met hoge kans.Neem bijvoorbeeld het Thetis Basin van Oost Groenland, daar acht de USGS dat er 95% tot 50% kans is dat er geen aardgas gevonden wordt, en 5% kans dat er 12 biljoen kubieke voet gas wordt gevonden (klik figuur links voor detail). De uitkomst van de gemiddelde waarde voor Thetis is 3,2 biljoen kubieke voet aardgas, welke onderdeel uitmaakt van de 1670 biljoen kubieke voet. Nog een voorbeeld, om bij Groenland te blijven het Noordwest Groenland Rifted Margin gebied, naar verwachting is er 95% kans op het vinden van geen olie, 50% kans op het vinden van 260 miljoen vaten en 5% kans op het vinden van 11 miljard vaten. Gemiddelde uitkomst genomen als potentieel is 2,75 miljard vaten.

Vanwege deze onbetrouwbaarheid kan beter gekeken worden naar commerciële studies uit de olie-industrie zelf. De beste tot nog toe is – Future of the Arctic – van Fugro Robertson en WoodMackenzie. Zij maken in tegenstelling tot de USGS gebruik van echte boordata voor zover beschikbaar. Hun conclusie: er zijn 43 miljard vaten olie en 684 biljoen kubieke voet aardgas te vinden in het Arctische gebied. Verplicht leesvoer voor overheden die een claim willen maken op de arctische fossiele voorraden. Voor zover nodig, want het overgrote deel van de olie- en gas ligt in de territoriale wateren van de Verenigde Staten, Denemarken en Rusland.

  1. 2

    Weer als de kippen (no pun @ #1) om je eigen thema (en boek) te pluggen. Voorspelbaar.

    Anyway, de verwachtingswaarde van een stochastische variabele is het gemiddelde van de mogelijke realisaties gewogen met hun respectievelijke kansen. Natuurlijk kan je lage waarden zwaarder laten wegen dan hoge waarden (als uiting van een soort risco aversie/concave nutsfunctie aanname), maar daar moet je een betere reden voor hebben dan wat hier boven staat.

    Misschien is USGS niet te optimistisch maar jij te pessimistisch, hmmm?

  2. 3

    Titel Statistiek poolgebiedschatting rommelig slaat trouwens ook nergens op.

    Het is geen statistisch bezwaar dat je maakt, het is een waardeoordeel dat je geeft.

  3. 7

    Met de fossiele brandstoffen rond de noordpool die binnenkort beschikbaar komen om de zuidpool ook te ontdooien ga ik daar maar een een vlag planten.

  4. 11

    @JSK

    >De verwachtingswaarde van een stochastische variabele is het gemiddelde van de mogelijke realisaties gewogen met hun respectievelijke kansen.<

    Dat klopt maar dat kun je niet op iedere situatie toepassen. In deze is er een zeer scheve verdeling, geen normale verdeling waardoor de toepassing weinig betrouwbare grond heeft. Je zou een analogie kunnen trekken met de staatsloterij, stel je hebt 5% kans dat je 12 miljoen wint, 50% kans dat je niks wint en 95% kans dat je niks wint. Ga jij bij het kopen van een staatslot dan uit van de verwachtingswaarde dat je 3,2 miljoen gaat winnen?

  5. 12

    Jemig, wat een rook en spiegels. Malle economen die denken dat hun theorietjes de wereld te kunnen redden. Bah.

  6. 13

    Rembrandt, je noemt twee keer een kans dat je niets wint, dus je maakt waarschijnlijk een schrijffout. En, hoe bereken je de verwachtingswaarde van de winst op een staatslot uit jouw voorbeeld eigenlijk? En welke waarde moet volgens jou normaal verdeeld zijn?

  7. 14

    Zo op het plaatje afgaand, lijkt het erop dat een verdeling beschreven wordt, waarvan de mediaan, minimum 5% en maximum 5% van de verdeling gegeven worden.

    Bv. Als we naar het eerste gebied kijken, dan wordt er met 95% zekerheid minimaal 0, met 50% zekerheid minimaal 1989 en met 5% zekerheid minimaal 11793 AU gevonden (whatever that may be).

    Nou ben ik geen wiskundige, dus ik ben niet zo goed in oppervlakteberekening, maar als de verdeling driehoekig (met rechte hoek) zou zijn, zou het oppervlak gelijk zijn aan de basis/2 maal de hoogte. Dan zou je dus de maximale schatting (daar kun je de 5% wel min of meer gelijk aan stellen) kunnen delen door 2 (de basis is per definitie 1).

    Nu is er waarschijnlijk geen sprake van een driehoekige verdeling, dus kom je op minder uit (dat kun je ook wel zien, omdat de mediane kans onder het gemiddelde van minimum en maximum 5% ligt), maar aan de hand van de mediaan kan je wel een aardige oppervlaktevoorspelling doen (als je wel wiskundige was). Zo op het oog komt een deling door 3 (ipv 2 bij de perfecte driehoek) vrij redelijk over.

    Ter illustratie even een amateurplaatje (kan het niet direct tevoorschijn toveren, ik ben ook maar een hrml-amateur) van het eerdere voorbeeld. De onderste lijn (door het paars heen) stelt de waarschijnlijke verdeling voor, de bovenste rode een driehoek, de lijn ertussen (kun je op zich negeren) is de polygoon van de gegeven punten.

    Het gaat er in deze om of het oppervlak tussen de bovenste en onderste lijn de helft is van dat onder de onderste lijn of meer.

  8. 15

    Precies, Bismarck.

    Uit de tabel kun je de verwachtingswaarde niet berekenen, omdat er simpelweg een groot aantal data punten niet in staan. Daarom is de conclusie van het stukje dat de verwachtingswaarde niet zou kloppen ook niet correct.

    Of terwijl, om het loterij voorbeeld te nemen: misschien is er wel een kans van 40% dat je 5 miljoen wint.

  9. 16

    Als je de x- en de y-as verwisselt, is Bismarcks plaatje min of meer de grafiek van de kansdichtheid P(x), die een functie is van het aantal vaten x en loopt van P(0) = 1 tot P(oneindig) = 0. De verwachtingswaarde van het aantal vaten is dan gelijk aan het oppervlak onder de grafiek van het product van de kansdichtheid en het aantal vaten x., oftewel de integraal van P(x)xdx. Zie ook hier.