De statistische term alpha, wat is het?

De statistische term alpha, wat is het? Statistiek gaat altijd over kansen. Je zegt nooit iets met 100% zekerheid maar je bent aan het kijken in hoeverre je iets aannemelijk kan maken. Over het algemeen kijk je in de statistiek hoe groot de kans is dat je een bepaald effect in je steekproef vindt, terwijl dat effect in de populatie niet bestaat. Omdat dit over kansen gaat bestaat er altijd de kans dat dit fout gaat. Deze kans neem je voor lief en je kan er een getal aan vastplakken. Dit is je alpha (α).

Testen van hypothesen

Gaan we statistisch toetsen dan beginnen we altijd te veronderstellen dat er geen effect is. Dit heet de nul-hypothese of H0 (er is geen effect in de populatie). Vervolgens ga je kijken hoe aannemelijk je het kan maken dat het effect wel bestaat, verwoord in je alternatieve hypothese of H1.

Stel je meet twee groepen atleten op hun tijd op de 100 meter. Je vindt een bepaald verschil tussen deze groepen, laten we zeggen gemiddeld 1.0 seconde. Je H0 is dat er geen effect is in je populatie, er is geen verschil tussen de groepen, dus het gevonden verschil van 1.0 seconde berust op toeval. Je statistische toets probeert het tegenovergestelde te bewijzen, de H1: er wel een effect in je populatie, het gevonden verschil van 1.0 seconde berust daarop en de groepen verschillen structureel van elkaar. Dit kan je statistisch toetsen.

Uit elke statistische test komt een p-waarde rollen. Dit is een getal tussen 0 en 1 en staat gelijk aan de kans dat je het huidige effect vindt, terwijl er geen effect in de populatie is. Vind je een p-waarde van 0.20, dan is de kans dat je de huidige waarnemingen vindt wanneer er geen effect is (dus wanneer H0 klopt), 20%. 20% is dan nog best een grote kans en daarom zal bij een p-waarde van 0.20 de H1 niet snel worden aangenomen. Stel, je vindt een p-waarde van 0.01, dan is de kans op het waargenomen effect, indien H0 waar is, dus slechts 1%. In zo’n geval kan je H1 vaak aannemen.

Waar de grens ligt van het wel of niet aannemen van H1 bij een gevonden p-waarde verschilt per vakgebied. In medische wetenschappen kunnen fouten grote gevolgen hebben en ze mogen dus eigenlijk niet voorkomen. Een p-waarde van 0.01 kan dan nog te veel zijn. In de sociale wetenschappen ligt dat anders, hier is een p-waarde van 0.01 vaak genoeg ondersteuning van je hypothese. De grens die je hanteert is je waarde van alpha, vaak is deze 0.1, 0.05 of 0.01.

Type 1 en type 2 fouten

Het blijft kansberekening, dus er is altijd een kans dat het misgaat. Stel dat je H1 aan mag nemen op basis van je p-waarde en je alpha, terwijl er geen effect is in de populatie maar je hebt per toeval een steekproef die wel extreem scoort. Deze kans is altijd aanwezig en is gelijk aan alpha. Als je een alpha van 0.05 hanteert accepteer je dus ook dat er een 5% kans is op het gevonden effect terwijl H0 juist is, en je dus ten onrechte H1 aanneemt. Dit heet een type 1 fout. Alpha is dus de kans die je accepteert op het maken van een type 1 fout. Vanwege de kans op deze fout is alpha dus heel klein als onderzoek zeer nauwkeurig moet zijn en wat groter als het om minder nauwkeurig onderzoek gaat. Een type 2 fout is het tegenovergestelde: de H0 wordt niet verworpen terwijl er wel een effect in de populatie is. Je statistische test is er echter niet in geslaagd om dit effect zichtbaar te maken en de kans op deze fout is dan ook afhankelijk van het onderscheidend vermogen van je test. Het onderscheidend vermogen van je toets heet ook wel de power, hier geldt hoe hoger de power, hoe kleiner de kans op een type 2 fout. De kans op een type 2 fout noemen we beta (β) en de power bepalen we dan ook met de formule: power = 1-β.

Hypothesen testen met alpha

We beslissen over een alpha en we vinden een bepaalde p-waarde. Hoe dan de hypothesen getest worden illustreren we in de volgende afbeelding. We gaan kijken waar het gevonden gemiddelde ligt in de normaalverdeing van de populatie. We zouden het gevonden gemiddelde hier ook kunnen weergeven als een gemiddelde met een symmetrische normaal verdeling (met eigen gemiddelde, SD en spreiding) er omheen, maar voor de overzichtelijkheid staat alleen het gemiddelde afgebeeld. In de linker afbeelding zien we dat de groene streep (het steekproef gemiddelde) in het witte gebied ligt (het H0 gebied). In dit geval is dus de H0 waar. In de rechter afbeelding ligt het steekproef gemiddelde in het rode gebied (H1 gebied). Nu is dus H1 waar.

Twee manieren van hypothesen toetsen. Twee manieren van hypothesen toetsen.
De groene lijn weerspiegelt het steekproef gemiddelde wat in de linker afbeelding in het H0 gebied ligt en in de rechter in het H1 gebied. De verschillende verdelingen van het rode H1 gebied liggen aan het verschil tussen één- en tweezijdig toetsen. Bij tweezijdig toetsen liggen de 5% waarnemingen verdeeld over de 2 staarten van de normaal verdeling. Het H1 gebied is nu dus kleiner en het is dan lastiger een significant resultaat te vinden.

Een of tweezijdig toetsen

Hoe groot het rode gebied is hangt af van alpha. Bij een alfa van 0.05 ligt 5% van de waarnemingen in het rode H1 gebied. Maar zoals te zien in de afbeelding kan dat gebied verspreid liggen over de uiteinden van de normaal verdeling, of aan één kant geclusterd. En zoals in het voorbeeld is dit nu precies het verschil tussen een significant effect en een niet significant effect. Dit ligt aan de manier van toetsing. Als we de hypothese stellen: gemiddelde 1 is groter dan gemiddelde 2, dan is het vrij onzinnig om onze aandacht te richten op het rode gebied links, dat staat immers voor de stelling ‘gemiddelde 1 is kleiner dan gemiddelde 2’. Nu zijn we gericht op zoek naar het effect rechts en kijken we dus alleen naar het rechter uiteinde. Omdat we een alpha van 5% hanteren kijken we nu dus naar de 5% van de waarnemingen aan dit uiteinde: we toetsen eenzijdig. Zouden we tweezijdig toetsen (met de hypothese: gemiddelde 1 is niet gelijk aan gemiddelde twee, zonder dat we de richting weten), dan moeten we de 5% van alpha verdelen over beide staarten. De twee H1 gebieden zijn dan dus kleiner en de gevonden p-waarde moet dus ook kleiner zijn om significant genoemd te mogen worden.

Eenzijdig toetsen gebeurt vooral binnen t-testen waarbij twee groepen worden vergeleken en er dan een duidelijke verwachting speelt. In de resultaten van de t-toets kan men dan werken met een gehalveerde p-waarde, of een verdubbelde alpha. Veel andere toetsen, waaronder de ANOVA toetsen altijd tweezijdig en kan er geen richting worden meegegeven.
© 2013 - 2024 Steven2389, het auteursrecht van dit artikel ligt bij de infoteur. Zonder toestemming is vermenigvuldiging verboden. Per 2021 gaat InfoNu verder als archief, artikelen worden nog maar beperkt geactualiseerd.
Gerelateerde artikelen
Verklarende statistiekVerklarende statistiekIn marketing en marktonderzoek spelen statistieken een belangrijke rol. Er is de beschrijvende statistiek, maar ook de v…
Basisbegrippen uit de statistiekBasisbegrippen uit de statistiekOm de weg te kunnen vinden in de wonderlijke wereld der statistiek is het belangrijk om een paar basis begrippen helder…
Verschillen tussen twee datasets: de t-testVerschillen tussen twee datasets: de t-testDe t-test is een statistische test waarmee het verschil kan worden aangetoond tussen twee verschillende sets aan data. D…
Bloed en BloedgroepenBloed en BloedgroepenHet menselijk bloed is in 4 groepen ingedeeld: A, B, AB, en O. Elke letter refereert aan een antigen, of proteïne, aan h…
De veelzijdigheid van de rubberplant GuayuleDe veelzijdigheid van de rubberplant GuayuleDe van oorsprong Amerikaanse plant kent vele goede eigenschappen zoals plantaardige oliën en kunnen worden omgezet in ru…
Bronnen en referenties
  • Discovering Statistics using SPSS, Second Edition, Andy Field 2005
Steven2389 (36 artikelen)
Gepubliceerd: 26-02-2013
Rubriek: Wetenschap
Subrubriek: Diversen
Bronnen en referenties: 1
Per 2021 gaat InfoNu verder als archief. Het grote aanbod van artikelen blijft beschikbaar maar er worden geen nieuwe artikelen meer gepubliceerd en nog maar beperkt geactualiseerd, daardoor kunnen artikelen op bepaalde punten verouderd zijn. Reacties plaatsen bij artikelen is niet meer mogelijk.