Maten van samenhang

Maten

In de statistiek zijn er eigenlijk twee belangrijke maten om de samenhang tussen twee variabelen te bepalen. De ene maat is de covariantie, de andere de correlatie. Hoewel de meeste mensen de correlatie een eenvoudig te begrijpen samenhang vinden, is dat voor de covariantie een stuk minder. De correlatie is ook een stuk eenvoudiger om te begrijpen, omdat ons brein een vergelijkbaar mechanisme gebruikt.
Index


Samenhang

Hoewel mensen voor de samenhang tussen twee gebeurtenissen geen berekening uitvoeren, maken we wel iedere dag gebruik van het principe van samenhang. Zo leren we al heel vroeg in ons leven dat er een samenhang bestaat tussen honger en moeten eten. We leren zelfs dat er een samenhang is tussen huilen als je moet eten en gevoed worden. Dus wat doen we op een bepaald moment na een paar keer huilen van de honger en vervolgens een gevuld gevoel krijgen, huilen als we iets anders willen. Correlaties vormen is dus de normaalste zaak voor het menselijk brein. Zo leggen we ook al heel vroeg in ons leven het verband tussen ons gevoel van veiligheid en de aanwezigheid van onze ouders. Eigenlijk gaan we zo ons hele leven door met het leggen van verbanden tussen twee variabelen.

Glas water
Als het echter over covariantie gaat dan lijkt het vaak dat we helemaal niets op hebben met deze maat voor samenhang in de statistiek. De formule is dan ook behoorlijk ingewikkeld als we hem voor het eerst zien. Het vreemde is echter dat de meeste mensen heel erg bekend zijn met de covariantie. We maken er zelfs iedere dag gebruik van, bijvoorbeeld als we de kraan opendraaien om onze handen te wassen of om water te drinken. In de loop der jaren hebben we geleerd dat de kraan veel opendraaien een sterke waterstraal geeft en de kraan een beetje opendraaien een zachte straal. Tijdens het vullen van een glas met water maken we er zelfs gebruik van om het glas zo vol mogelijk te krijgen. Waarbij we de kraan eerst goed ver opendraaien, zonder dat het gaat spetteren en als het glas vol begint te raken dan draaien we de kraan dicht. Dat is in de statistiek de covariantie. De toename van de waardes van de ene variabele laten een toename of afname van de waardes van een andere variabele zien. Dus ook de covariantie geeft ons inzicht in de samenhang tussen twee variabelen.


Index


Correlatie en covariantie

Maar waarom vinden we de correlatie eenvoudiger om te begrijpen dan de covariantie. Om te beginnen zal dat wel te maken hebben met het feit dat we daar veel meer ervaring mee hebben. Correlatie is tenslotte gewoon een waarde tussen -1 er is een negatieve relatie en 1 er is een positieve relatie tussen de variabelen. Als ik huil krijg ik te eten. Als ik heb gepoept dan wordt mijn luier verschoond. Als ik moe ben ga ik slapen. Als ik lach dan lachen andere mensen naar me. Als ik verdriet toon, word ik getroost. Zo gaat het maar door. Bij al deze zaken merken we dat er een bijna één op één relatie bestaat tussen wat we doen en wat we ervaren. Vandaar dat we er ook geen enkel probleem mee hebben om te begrijpen wat bedoeld wordt met correlatie. Ook al is de formule misschien wat onhandig:

Cor(A,B) = Cov(A,B) / St.dev(A) * St.dev(B)

De covariantie zit ook gewoon iets ingewikkelder in elkaar voor ons gevoel. Onze ervaring met de covariantie ontwikkelen we eigenlijk pas als we zelf instaat beginnen te zijn iets te doen. Zo leren we allemaal op een bepaald moment dat je de kraan niet wild open moet draaien als je een glas met water wilt vullen, want dan spettert het water over je heen en word je behoorlijk nat. We leren dat hoe harder je fietst hoe harder de wind waait die je voelt. We leren dat hoe langer je door de regen fietst hoe natter je wordt. We leren dat hoe meer je studeert hoe hoger je cijfer zal zijn. Maar dat is veel ongrijpbaarder dan de correlatie. Er is duidelijk geen één op één relatie. Het is niet zo dat als je twintig uur meer studeert, je een cijfer hoger dan een tien kunt halen. Het is niet zo dat als je de kraan maar open blijft draaien het water steeds harder gaat stromen. Het is niet zo dat naarmate je harder en harder fietst de wind harder en harder waait. Op een bepaald moment voel je eigenlijk geen toename meer en lijkt er geen verband meer te zijn tussen wat je doet en wat je realiseert. De covariantie geeft dan ook niet overduidelijk aan hoe groot de relatie is tussen twee variabelen, alleen maar dat die relatie er is en of die negatief of positief is. De formule voor de covariantie is dan ook gebaseerd op de mate waarin beide variabelen in dezelfde richting bewegen. Dus voor iedere graad dat ik de kraan opendraai gaat het water een cm per minuut sneller stromen tot het maximum dat mogelijk is met de dikte van de waterleidingen en de kraan. In formule ziet dat er alsvolgt uit:

Cov(A,B) = Som(1 tot n) (Ai - Agem)*(Bi - Bgem) / n-1

Index

Bruikbaarheid

Een belangrijk punt bij de correlatie en covariantie is echter niet het feit dat we gevoelsmatig al bekend zijn met beide begrippen. Het belangrijke punt is dat het maten van samenhang zijn voor variabelen die een lineaire groei kennen. Voor variabelen met een kwadratische of anders dan lineaire groei heb je andere maten nodig. Verder moet je zowel met de correlatie als de covariantie uitkijken dat je te snel conclusies trekt over de samenhang. Zo kan het heel goed dat twee variabelen lijken samen te hangen, terwijl ze in werkelijkheid beide beïnvloed worden door een derde onbekende variabele. Zo zou je kunnen denken dat bruin worden samenhangt met de temperatuur van de buitenlucht, terwijl in werkelijkheid bruin worden en temperatuur bepaald worden door de hoeveelheid zonlicht die de aarde van de zon ontvangt. Hoe sterk de samenhang dus ook mag lijken te zijn, je moet er altijd rekening mee houden dat ze niet bestaat. De correlatie en covariantie zijn dus handige maten om te bepalen of er een samenhang is, maar ze zijn geen definitief bewijs voor die samenhang, zoals deze cartoon van Dilbert duidelijk maakt.


Index


Extra

Afbeelding

  • Glas water door Normyo

Index van koppen

Maten
Samenhang
Correlatie en covariantie
Bruikbaarheid
Extra
Afbeelding
Links

Links