Statistiek is voor iedereen

Statistiek en het brein

20101023Winst.jpg
Winst
Nu zullen veel mensen de haren te bergen reizen, dat je durft te schrijven dat statistiek voor iedereen is. Het vreemde is echter dat ons brein in veel gevallen op basis van statistische technieken beslissingen neemt. Zo is onze opportunistische aard als mens alleen mogelijk in een systeem dat statistiek gebruikt om beslissingen te nemen. Opportunisme is namelijk gebaseerd op de verwachting dat iets winst zal opleveren. Als dat niet zo was, dan zouden we ons baseren op de keiharde cijfers van de verhouding tussen succes en mislukking en bij een groter aantal mislukkingen ervoor kiezen om iets anders te gaan doen.

Statistiek in het dagelijkse leven

De meeste mensen hebben niets met statistiek, behalve dan misschien de cijfers die ze voor en na iedere verkiezing te horen krijgen. De meeste mensen willen gewoon lekker hun leven leiden zonder zich druk te maken over kansen, waarschijnlijkheden, correlaties , gemiddelden, varianties, significantie, betrouwbaarheid, etcetera, enzovoort.

20101023dobbelstenen.jpg
Dobbelstenen

Toch zijn ze vaak wel bezig met statistiek. Zo doen ze vaak mee aan kansspellen als de lotto of de staatsloterij. Ze gaan stemmen in de hoop dat hun partij de grootste wordt en in de regering zal komen. Ze gaan iedere dag de weg op naar hun werk en verwachten zonder problemen aan te komen, gebaseerd op het feit dat ze alle dagen daarvoor geen problemen hadden. Ze kopen ook verzekeringen voor ziekte, inboedel, opstal, vakantie en auto in de hoop er nooit gebruik van te hoeven maken, maar in de wetenschap dat als hun iets overkomt de verzekering betaalt. Dat zijn allemaal statistische activiteiten.

Maar echte statistiek in de zin van wat geef ik gemiddeld per maand uit aan eten en uitgaan, daar hebben mensen niets mee op. Ware het niet dat hun brein een statistiek machine is, die gewoon werkt volgens het principe van de meeste stemmen gelden. Beslissingen in ons brein worden namelijk genomen op basis van het aantal neuronen dat hetzelfde idee draagt.

Statistiek

Het punt met statistiek is echter dat het twee poten kent en daarom wordt het ook wat ingewikkeld voor het gewone leven. Zo heb je beschrijvende statistiek, die gebaseerd is op het verzamelen van gegevens om er vervolgens bepaalde formules op toe te passen om zo aan gemiddeldes, modi, medianen, varianties te komen. De andere poot van de statistiek is gebaseerd op de principes achter kansberekening en wordt ook wel verklarende statistiek genoemd.

Beschrijvende statistiek

20101023verkiezingen.jpg
Verkiezingen

Voorbeelden van beschrijvende statistieken zijn de uitslagen van de tweede kamer verkiezingen en de verkiezingen van de leden van de Ondernemingsraad. Ook het benoemen van het aantal verkeersongelukken en het aantal nieuwe bedrijven in 2010 valt onder de beschrijvende statistiek. Op basis van deze statistieken kun je bijvoorbeeld gaan berekenen hoe groot het gemiddelde aantal VVD stemmers over de afgelopen tien jaar is geweest. Of wat het gemiddelde aantal nieuwe bedrijven per jaar is. Vervolgens kan de Kamer van Koophandel dan bijvoorbeeld beslissen op basis van een stijgende lijn in het aantal nieuwe bedrijven om een extra medewerker in te zetten voor het inschrijven van nieuwe bedrijven.

Een ander onderdeel van de beschrijvende statistiek is de variantie. De variantie geeft aan hoeveel de jaarlijkse gegevens over nieuwe bedrijven afwijken van het gemiddelde. Op basis van de variantie kun je dan zien hoe groot de afwijkingen zijn tussen de verschillende jaren. Want hoe kleiner de variantie, hoe kleiner de verschillen tussen de jaren. Zo kun je met behulp van de variantie bijvoorbeeld aangeven of de maand augustus in 2010 een maand was met een temperatuur die normaal was voor augustus of niet.

Verklarende statistiek

De verklarende statistiek werkt niet zoveel anders dan de beschrijvende, het verschil is echter dat de verklarende statistiek de regels van de kansberekening toepast op de beschrijvende statistiek. Zo stelt de verklarende statistiek bijvoorbeeld dat de kans dat de trekking van een lot beïnvloed wordt door de trekking van vorige week of vorig jaar nul is, iedere trekking is onafhankelijk. Dat betekent dat het niet zoveel zin heeft om bij te houden hoevaak een bepaald lot getrokken wordt, behalve als je verwacht dat er iets niet klopt.

20101023weer.jpg
Weer

Voor het weer geldt deze onafhankelijk weer niet. Dus het weer in augustus 2010 is van invloed op het weer in augustus 2011. Hoe groot die invloed is, is dan weer niet bekend. Daardoor kun je ook niet zeggen dat je met het weer in de maand augustus in 2010 het weer in augustus 2011 kan voorspellen. Dat zou wel kunnen als duidelijk was hoe het weer in beide maanden van elkaar afhingen. De enige zekerheid die we in Nederland hebben voor de maand augustus is dat hij warmer zal zijn dan de maand januari.

Waar het bij verklarende statistiek echter om gaat is niet het kunnen voorspellen van effecten, maar zoals het begrip al zegt verklaren. Hoe kan het dat de trekkingen in een loterij niet onafhankelijk van elkaar zijn? Hoe kan het dat de weersverwachting maar drie dagen tot een week vooruit gegeven kan worden? Heeft dit medicijn invloed op deze vorm van kanker. Werkt deze opleidingsvorm beter bij jongens dan bij meisjes. Werkt psychotherapie beter dan antidepressiva bij depressiviteit.

Conclusie

20101023voetbal.jpg
Voetbal

Er zijn dus twee vormen van statistiek. De beschrijvende vorm die probeert vast te leggen in cijfers wat er iedere dag gebeurt. Een voorbeeld is de rangschikking in de voetbalcompetitie, de ploeg op de eerste plek heeft de minste wedstrijden verloren en de ploeg op de laatste plaats heeft de meeste wedstrijden verloren. Terwijl de verklarende statistiek probeert te bepalen welke factoren er nu de oorzaak van zijn dat de ene ploeg op de eerste plek staat in de competitie, terwijl de andere laatste is.

Extra

Afbeeldingen

Door Normyo:

Links