Statistieken zijn geen leugens

Een citaat

Zwart-wit foto van DisraeliHoewel het citaat toegeschreven wordt aan de Engelse politicus Disraeli, uit de negentiende eeuw, is dat niet zeker. Maar Benjamin Disraeli zou gezegd hebben dat je drie soorten leugens hebt: leugens, grove leugens en statistieken. Voor de meeste mensen geldt deze uitspraak als een zekere vorm van waarheid, waarbij het woord ‘zekere’ op twee manieren uitgelegd wordt. Namelijk ‘zekere’ in de vorm van het absolute weten dat statistieken leugens zijn. Maar zekere duidt in deze zin ook op het feit dat er meerdere waarheden zijn en de uitspraak van Disraeli geeft een van die waarheden over statistieken aan. Maar zijn statistieken echt leugens.

Statistieken wat zijn het

Het woord statistiek komt van het Latijnse statisticum collegium, wat les over staatszaken betekent. Het woord statistiek is dus afgeleid van het Latijnse woord staatszaken. Tegenwoordig gebruiken we het woord statistiek om een verzameling van cijfers over een bepaalde situatie aan te duiden. Vandaar dat er zoiets bestaat als een Centraal Bureau voor de Statistiek (CBS), dat over allerlei situaties in Nederland gegevens/cijfers verzameld. Dan krijg je dus statistiek over het aantal mannen en vrouwen in Nederland. Ook het geboorte- of sterftecijfer is een statistiek. Het aantal bedrijven en de aantallen werknemers in een bepaalde beroepsgroep of het aantal werklozen of uitkeringstrekkers zijn statistieken. Wat al deze cijfertjes doen is beschrijven hoeveel er van iets is. Dus zelfs de inhoudsaanduiding op een pak melk of een zak rijst is een statistiek, het zegt namelijk iets over hoeveel melk of rijst ik vasthoud als ik het pak melk of rijst beetpak. Maar ook de score aan het eind van een voetbalwedstrijd is een statistiek, ik weet namelijk hoeveel doelpunten er zijn gescored en wie ze gemaakt heeft.

Voorbeeld

Statistieken zijn dus een beschrijving van een situatie in cijfers. Bijvoorbeeld het aantal Nederlanders dat er in 2010 en 2011 bij kwam:

Nederland

2010

2011

Verschil

geboortes

184.397

180.060

- 4.337

sterftes

136.058

135.741

- 317

Verschil

48.239

45.709

- 2.530

immigratie

154.432

162.962

8.530

emigratie

121.351

133.194

1.843

Verschil

33.081

29.768

- 3.313

Toename

81.320

75.477

- 5.843

Maar wat staat er nu eigenlijk in de tabel.

Uitleg tabel

In bovenstaande tabel staat eigenlijk dat het aantal Nederlanders in 2010 groeide met 81.320 mensen en in 2011 met 75.477. Maar de groei in 2011 was kleiner dan in 2010, er kwamen in 2011 namelijk 5.843 minder mensen bij dan in 2010. Er zijn aan het eind van 2011 dus meer Nederlanders dan aan het begin, ook al was de groei in 2011 kleiner dan in 2010 kleiner.

Percentages

Omdat dit soort cijfers voor mensen vaak vrij abstract zijn, wordt binnen de statistiek vaak gewerkt met percentages. De groei van het aantal Nederlanders nam dus af met 7,2% tussen 2010 en 2011. Terwijl de natuurlijke groei van het aantal Nederlanders tussen 2010 en 2011 afnam met 5,2% en de kunstmatige groei van het aantal Nederlanders, door immigratie en emigratie tussen 2010 en 2011 afnam met 10%.

Liegen

Nu ontstaat er echter een mogelijkheid om te liegen, tenminste als ik de cijfers verkeerd begrijp. Ik zou bijvoorbeeld kunnen lezen dat er 10% minder Nederlanders zijn door emigratie. Of ik kan lezen dat er meer Nederlanders zijn blijven leven, want er zijn 5,2% minder Nederlanders overleden. Terwijl dat dus niet klopt. Er zijn alleen maar minder mensen in 2011 bijgekomen dan in 2010, maar aan het eind van 2011 waren er weer meer Nederlanders dan in 2010, namelijk 75.477 Nederlanders. Dat was een toename van 5‰ ten opzichte van de 16.574.989 Nederlanders aan het eind van 2010.

Statistiek en leugens

Maar hoe kan het eigenlijk dat statistieken leugens worden. Het eerste antwoord zit hem in het feit dat mensen moeite hebben met de getallen die in statistieken gebruikt worden. Statistieken gaan zelden over aantallen als vijf of tien of achttien. De aantallen waarover in statistieken gesproken worden beginnen meestal bij de honderd en Kaartje van Nederland met bevolkingsdichtheid in 2006lopen door tot de miljarden. Zo zijn er ruim 7 miljard wereldburgers op dit moment. Maar wat wil dat nu eigenlijk zeggen. Als je het omrekent naar het aantal zitplaatsen van het stadion de Kuip in Rotterdam (51.137), dan heb je 136.887 stadions van het formaat de Kuip nodig om alle mensen een zitplaats te geven. Waarn je toch nog ruim negenduizend mensen buiten moet laten staan.

Het tweede antwoord is echter dat statistieken cijfermatige antwoorden zijn op vragen die mensen hebben. Natuurlijk is het moeilijk liegen over het aantal wereldburgers of het aantal Nederlanders op 31 december 2011 om twaalf uur ‘s nachts. Maar als ik zeg dat er het afgelopen jaar maar tien mensen zijn overleden aan een verkeersongeluk, dan is dat een leugen. Behalve natuurlijk als ik verkeersongeluk zo definieer dat er maar tien mensen in het jaar voldoen aan de definitie. Mijn definitie kan er dus voor zorgen dat ik in de ogen van anderen lieg met statistieken.

De definitie

Waar het dus op neerkomt is dat statistiek bepaald wordt door de definitie van de begrippen die in de vraag gebruikt worden. Als ik wil weten hoeveel Nederlanders er in Nederland woonden op 31 december 2011, dan moet ik definiëren wat ik bedoel met Nederlanders. Is dat iedereen met een Nederlands paspoort of is dat iedereen ingeschreven in de Gemeentelijke Basis Administratie (GBA) of is het iedereen die vanaf 1 januari 2011 tot en met 31 december 2011 in Nederland woont. Dus ook alle illegalen en alle gastarbeiders uit andere landen van de Europese Unie. Verder moet ik ook bepalen wat Nederland is. Houdt Nederland op bij de grens met Duitsland, België en de Noordzee. Of zijn de bewoners van booreilanden in de Noordzee ook Nederlanders. Maar moet ik misschien niet alle Nederlanders die wel ingeschreven staan in de GBA, maar niet in Nederland wonen en werken er vanaf trekken.

Statistieken worden dus bepaald door de definitie die je hanteert en zolang die definitie niet helder is, bega ik eigenlijk een leugen als ik beweer dat er zestien en een half miljoen Nederlanders waren aan het eind van 2011. Want een halve waarheid is tenslotte niet de waarheid, maar wel een hele leugen als ik niet weet waar die halve waarheid op gebaseerd is.

Statistieken zijn geen leugens

Toch kun je niet echt beweren dat statistieken leugen zijn. Het zijn misschien cijfermatige antwoorden op vragen die mensen hebben. Maar het zijn wel nuttige antwoorden. Zo is het bijvoorbeeld heel nuttig om te weten hoeveel vrachtwagens en auto’s een brug kan hebben voordat je hem opent voor gebruik. Je wilt tenslotte niet dat als er een file ontstaat op de brug, de brug instort onder het gewicht van het verkeer op de brug. Overdekte brug met gewichtsaanduiding 4 tonVandaar dat er bij sommige bruggen een bordje staat hoe zwaar een vrachtwagen mag zijn.

Verder is het goed om te weten dat er maar 51.137 mensen in het stadion De Kuip kunnen zitten. Op die manier weet je dat je niet meer kaartjes moet drukken dan 51.137 en wat je kosten zijn voor het drukken over een heel voetbalseizoen. Verder weet je dat je ontsnappingsroutes moet maken die binnen vijf minuten ruim vijftigduizend mensen aankunnen, zonder dat er meer doden vallen door de paniek dan door het gevaar dat die mensen bedreigt. Je weet ook hoeveel bewakers, beveiligers en hulpverleners je nodig hebt in het geval van een calamiteit. Maar je weet bijvoorbeeld ook hoeveel toiletten je nodig hebt en hoeveel schoonmakers.

Moment opname

Statistieken zijn dus geen leugens in de zin van wat wij mensen een leugen noemen, namelijk een verdraaiing van de waarheid of de presentatie van een fantasie als de waarheid. Statistieken zijn moment opnames die het mogelijk maken om plannen te maken om de wereld veiliger te maken. Want als er morgen een bouwmateriaal wordt uitgevonden dat per gram eigen gewicht tienduizend kilo kan dragen, dan kun je bruggen bouwen die oneindige gewichten kunnen dragen. Waardoor je geen bordjes op hoeft te hangen die bepalen welke vrachtwagens wel of niet gebruik mogen maken van de brug die je bouwt met zulk super bouwmateriaal. Want het bouwmateriaal is zo veilig, dat je geen veiligheidsmarges hoeft in te bouwen om gebruikers te beschermen.

Hulpmiddelen

Statistieken zijn dus geen leugens, maar hulpmiddelen om antwoorden te geven op vragen die mensen hebben. Daarom zijn statistieken ook altijd maar moment opnames, want ze beantwoorden vragen van mensen. Maar door hun antwoord veranderen statistieken de vragen die mensen hebben. Als ik namelijk weet hoeveel Nederlanders er zijn op 1 januari 2011, dan kan ik plannen maken om te zorgen dat er in 2011 genoeg faciliteiten zijn voor al die Nederlanders, of ze nu wel of niet in de Gemeentelijke Basis Administratie staan. Het gevolg van het creëren van die faciliteiten is echter dat ik de gezondheid van de Nederlanders verhoog, waardoor ik aan het eind van 2011 weer meer Nederlanders heb. Er zijn er tenslotte meer blijven leven en waarschijnlijk zijn er minder weggegaan, omdat de kwaliteit van leven in Nederland op niveau is gehouden of verbeterd.

Statistieken zijn moment opnamen

Symbolische bespreking van een staafdiagramAan de Engelse Premier uit de negentiende eeuw, Benjamin Disraeli is een uitspraak over statistiek toegedacht:

Je hebt drie soorten leugens: leugens, grove leugens en statistieken.

Als je begrijpt dat statistieken niets anders zijn dan pogingen van mensen om in de vorm van cijfers vragen die ze hebben te beantwoorden, dan begrijp je dat het geen leugens zijn. Statistieken zijn dan niets anders dan cijfermatige moment opnames die bij moeten dragen aan het formuleren van plannen om de veiligheid te verhogen of om genoeg faciliteiten te realiseren. Het gevolg van die antwoorden is wel dat de vragen steeds veranderen. Want waar je eerst begint met de vraag:

Hoeveel Nederlanders zijn er?

Verandert die vraag door ieder antwoord dat de statistiek geeft. Want ik moet niet alleen weten hoeveel Nederlanders er zijn, maar ook wat ik bedoel met Nederlanders en op welke datum. Vervolgens zal ik willen weten waar die Nederlanders waar in Nederland wonen. Want een Nederlander in Amsterdam die rond loopt op de Dam heeft andere wensen dan een Nederlander die in het stadion De Kuip in Rotterdam een voetbal wedstrijd bekijkt.

Afbeeldingen