Regressie naar het gemiddelde
Regressie naar het gemiddelde treedt op wanneer bijzonder goede of slechte prestaties gevolgd worden door meer gemiddelde prestaties. Dergelijke effecten zijn eenvoudig te verklaren op basis van de wetten van het toeval. Toch worden deze wetten maar al te vaak vergeten en verzint men causale verklaringen. Zinloze en overbodige theorieën zijn het gevolg.
Regressie naar het gemiddelde
In het uitgebreide verhaal van mensen die patronen zien daar waar slechts toeval heerst, speelt het fenomeen "regressie naar het gemiddelde" een belangrijke rol. Een fraai voorbeeld wordt gegeven door de psycholoog en Nobelprijswinnaar Daniel Kahneman. Een Israëlische vlieginstructeur vertelde hem dat straffen van slecht gedrag beter werkt dan het belonen van goed gedrag. Hij had namelijk gemerkt dat wanneer een cadet na een goed optreden beloond werd hij de volgende keer vaak minder presteerde. Maar wanneer hij een cadet strafte na een slecht optreden, dan presteerde hij vaak beter. De instructeur legde een causaal verband tussen zijn beoordeling en het daaropvolgend gedrag van de cadet. Straffen was beter dan belonen, was zijn theorie.
Maar of dat causaal verband ook daadwerkelijk aanwezig was, mag ernstig betwijfeld worden. De opeenvolging van goede en slechte prestaties van de cadet is precies wat op basis van toeval verwacht mag worden. De redelijke aanname is dat de cadet een bepaald vaardigheidsniveau heeft en dat hij op sommige momenten beter presteert en op andere momenten wat minder. De kans dat iemand op (of dicht bij) zijn gemiddelde vaardigheidsniveau presteert is groter dan de kans dat iemand uitzonderlijk goed of slecht presteert. Na een zeer goede prestatie is de kans dan ook groter dat de volgende prestatie minder zal zijn. Evenzo, na een zeer slechte prestatie is de kans vrij groot dat de volgende prestatie beter is. De beloning of de straf die de instructeur gaf, is daarom niet relevant. Dat de instructeur toch meende dat zijn gedrag wel effect had, leidde tot een foute analyse van zijn instructiestrategie, om nog maar niet te spreken van de gevolgen van zijn praktische stellingname dat straffen beter werkt dan belonen. Wanneer dat idee post vat in de geest van een docent dan kan menig student alvast zijn borst natmaken.
De dobbelsteen
Het regressie effect kan goed uitgelegd worden aan de hand van een dobbelsteen. Het herhaalde malen opgooien van een dobbelsteen leidt tot een volstrekt willekeurige reeks van getallen die lopen van 1 tot 6. Bij elke gooi is er precies een kans van 1/6 dat een van die getallen gegooid wordt. Natuurlijk wordt af en toe ook een 6 gegooid. Een 6 staat hier symbool voor een uitzonderlijke goede prestatie. De kans dat de volgende keer weer een 6 gegooid wordt, is precies 1/6. Maar de kans dat de volgende keer een getal lager dan 6 op de steen verschijnt is 5/6. Er is dus een vijf keer zo grote kans op een volgende slechtere prestatie dan op een gelijke goede prestatie. En wordt een 5 gegooid dan is de kans dat de volgende keer een gelijke of betere prestatie volgt (een 5 of 6 dus) gelijk aan 2/6=1/3. Maar de kans dat de prestatie minder is (dus dat er een 1, 2, 3 of 4 gegooid wordt) is 4/6=2/3. De kans op een mindere prestatie is nu twee maal zo groot. Met andere woorden, na elke hoge of lage score is de kans groter dat de volgende keer de score dichter bij het gemiddelde ligt. Dit verklaart ook de naam: regressie naar het gemiddelde.
Dit alles is louter een kwestie van toeval. Het is zeker niet zo dat er wetten zijn die zorgen dat na een hoge score er een lage moet volgen. Op elke gooi van de dobbelsteen is er precies een kans van 1 op 6 op een van de getallen 1 tot en met 6. En dat is alles wat er toe doet.
De gambler's fallacy
Op het eerste gezicht kan het lijken alsof de regressie naar het gemiddelde de gambler's fallacy rechtvaardigt. Deze fallacy treedt nogal eens op bij gokkers. Wanneer, bijvoorbeeld, aan de roulettetafel er een paar keer hetzelfde getal is verschenen heeft menigeen de neiging een volgende keer niet op dat getal in te zetten. De redenering is dat de kans op herhaling van hetzelfde cijfer kleiner is dan de kans op een ander cijfer. Dat is uiteraard onjuist. Het kenmerk van toeval, en ook van de roulettetafel, is dat er geen systeem zit in de reeks van opeenvolgende getallen. De kans dat een volgende keer precies hetzelfde cijfer valt, is precies even hoog als voor elk ander cijfer. Door een mogelijkheid te negeren, benadeelt de gokker zich zelfs. Bij de regressie naar het gemiddelde is er ook geen sprake van een regelmatigheid in de opeenvolging van de getallen (of de prestaties van een cadet). De regressie naar het gemiddelde is een echt effect. De gambler's fallacy is een statistische denkfout.
Voorbeelden
Geneeskunde
In de geneeskunde wordt veel gemeten. Dat kan variëren van bloeddruk, hartslag en gewicht tot aan bepalingen van het cholesterolgehalte in het bloed. Aangenomen mag worden dat al deze waarden in een bepaalde periode rond een gemiddelde schommelen. Deze waarden kunnen door een veelheid van factoren van dat gemiddelde afwijken. Op basis van de regressie naar het gemiddelde mag verwacht worden dat grote afwijkingen gevolgd worden door minder grote afwijkingen. Na het eten van een ijsje, bijvoorbeeld, waar in de regel veel zout in zit, zal de de bloeddruk kunnen stijgen, maar bij een volgende meting zal dit effect weer verdwenen zijn. Bovendien zijn de metingen lang niet altijd vrij van "ruis" en ook dat zal leiden tot een regressie naar het gemiddelde. Het is dus zaak om metingen te herhalen om een redelijk betrouwbare schatting te krijgen van de gemiddelde (echte) waarden en niet te snel te reageren op een enkele meting.
Misschien ernstiger is een situatie waarin een bepaalde behandeling uitgetest wordt. Patiënten met een hoge bloeddruk kunnen behandeld worden met een experimenteel medicijn om te zien of de bloeddruk na een tijdje daalt. Maar juist omdat het om een groep gaat met bloeddruk waarden die aanzienlijk hoger zijn dan gemiddeld mag op basis van een regressie naar het gemiddelde verwacht worden dat ze bij een volgende meting een lagere bloeddruk hebben. Dan bestaat het risico dat er effecten aan het medicijn worden toegewezen die het helemaal niet heeft. Dat is bepaald geen wenselijke situatie.
Erfelijke eigenschappen
Een groot aantal van onze eigenschappen worden bepaald door onze genen. Maar het is nooit zo dat de genen die eigenschappen volledig bepalen. De omgeving en toeval spelen ook hier een rol. Een kind is nooit precies het gemiddelde van zijn ouders. Juist omdat toeval (of omgevingsfactoren) een rol spelen, speelt de regressie naar het gemiddelde ook een rol in de overerving van eigenschappen. Dit geldt voor zaken als lengte, gewicht, gezondheid, intelligentie en dergelijke meer.
Nemen we lengte als voorbeeld. De lengte van een kind is afhankelijk van de genen die het van de ouders gekregen heeft en daarnaast van een reeks toevallige factoren. Verwacht mag worden dat de kinderen van extreem lange ouders juist iets minder lang zijn dan hun ouders. De redenering is dat het toeval de extreme lengte van de ouders bepaald heeft en dat deze toevallige factoren minder extreem doorwerken bij de kinderen. Precies dezelfde redenering geldt voor bijzonder kleine ouders. Hun kinderen zullen vaak wat langer zijn dan ze zelf zijn.
Beoordelingen van publicaties
De kwaliteit van wetenschappelijke publicaties worden normaal gesproken beoordeeld door collega's. De beste publicaties worden geaccepteerd voor publicatie in een wetenschappelijk tijdschrift. Maar beoordelingen zijn nooit perfect en toevallige factoren spelen zonder enige twijfel hun rol. Op basis van de regressie naar het gemiddelde mag verwacht worden dat de echte kwaliteit van de als best beoordeelde publicaties in feite wat lager ligt dan de beoordelingen suggereren. Omgekeerd, de als slechtst beoordeelde publicaties zullen, met een grote waarschijnlijkheid, in werkelijkheid beter zijn dan de oordelen suggereren. Hoe ernstig dit effect is, is niet bekend, omdat herhaalde beoordelingen van publicaties nauwelijks voorkomen.
Slotwoord
Overal waar men kan spreken van waarden of scores die over een bepaalde tijd schommelen rond een gemiddelde en waar de metingen beïnvloed worden door toevallige factoren en door ruis, daar ligt de regressie naar het gemiddelde op de loer. Het miskennen van dit verschijnsel kan leiden tot overbodige verklaringen en theorieën.
Lees verder