InfoNu.nl > Wetenschap > Diversen > De statistische term alpha, wat is het?

De statistische term alpha, wat is het?

De statistische term alpha, wat is het? Statistiek gaat altijd over kansen. Je zegt nooit iets met 100% zekerheid maar je bent aan het kijken in hoeverre je iets aannemelijk kan maken. Over het algemeen kijk je in de statistiek hoe groot de kans is dat je een bepaald effect in je steekproef vindt, terwijl dat effect in de populatie niet bestaat. Omdat dit over kansen gaat bestaat er altijd de kans dat dit fout gaat. Deze kans neem je voor lief en je kan er een getal aan vastplakken. Dit is je alpha (α).

Testen van hypothesen

Gaan we statistisch toetsen dan beginnen we altijd te veronderstellen dat er geen effect is. Dit heet de nul-hypothese of H0 (er is geen effect in de populatie). Vervolgens ga je kijken hoe aannemelijk je het kan maken dat het effect wel bestaat, verwoord in je alternatieve hypothese of H1.

Stel je meet twee groepen atleten op hun tijd op de 100 meter. Je vindt een bepaald verschil tussen deze groepen, laten we zeggen gemiddeld 1.0 seconde. Je H0 is dat er geen effect is in je populatie, er is geen verschil tussen de groepen, dus het gevonden verschil van 1.0 seconde berust op toeval. Je statistische toets probeert het tegenovergestelde te bewijzen, de H1: er wel een effect in je populatie, het gevonden verschil van 1.0 seconde berust daarop en de groepen verschillen structureel van elkaar. Dit kan je statistisch toetsen.

Uit elke statistische test komt een p-waarde rollen. Dit is een getal tussen 0 en 1 en staat gelijk aan de kans dat je het huidige effect vindt, terwijl er geen effect in de populatie is. Met andere woorden dit is de kans dat je H1 aanneemt terwijl H0 eigenlijk waar is. Vind je een p-waarde van 0.20, dan is de kans dus 20% dat er helemaal geen effect in de populatie speelt. 20% is dan nog best een grote kans en daarom zal bij een p-waarde van 0.20 de H1 niet snel worden aangenomen. Stel, je vindt een p-waarde van 0.01, nu is de kans dat H0 waar is dus slechts 1%. In zo’n geval kan je H1 vaak aannemen. Waar de grens ligt van het wel of niet aannemen van H1 bij een gevonden p-waarde verschilt per vakgebied. In medische wetenschappen kunnen fouten grote gevolgen hebben en ze mogen dus eigenlijk niet voorkomen. Een kans van 1% op de verkeerde beslissing kan dan nog te veel zijn. In de sociale wetenschappen ligt dat anders, als je met 99% zekerheid iets over een populatie kan zeggen is dat vaak al heel erg nauwkeurig. De grens die je hanteert is je waarde van alpha, vaak is deze 0.1, 0.05 of 0.01.

Type 1 en type 2 fouten

Het blijft kansberekening, dus er is altijd een kans dat het misgaat. Stel dat je H1 aan mag nemen op basis van je p-waarde en je alpha, terwijl er geen effect is in de populatie maar je hebt per toeval een steekproef die wel extreem scoort. Deze kans is altijd aanwezig en is gelijk aan alpha. Als je een alpha van 0.05 hanteert accepteer je dus ook dat er een 5% kans is dat je een H1 aanneemt terwijl die niet waar is. Dit heet een type 1 fout. Alpha is dus de kans die je accepteert op het maken van een type 1 fout. Vanwege de kans op deze fout is alpha dus heel klein als onderzoek zeer nauwkeurig moet zijn en wat groter als het om minder nauwkeurig onderzoek gaat. Een type 2 fout is het tegenovergestelde: de H0 wordt niet verworpen terwijl er wel een effect in de populatie is. Je statistische test is er echter niet in geslaagd om dit effect zichtbaar te maken en de kans op deze fout is dan ook afhankelijk van het onderscheidend vermogen van je test. Het onderscheidend vermogen van je toets heet ook wel de power, hier geldt hoe hoger de power, hoe kleiner de kans op een type 2 fout. De kans op een type 2 fout noemen we beta (β) en de power bepalen we dan ook met de formule: power = 1-β.

Hypothesen testen met alpha

We beslissen over een alpha en we vinden een bepaalde p-waarde. Hoe dan de hypothesen getest worden illustreren we in de volgende afbeelding. We gaan kijken waar het gevonden gemiddelde ligt in de normaalverdeing van de populatie. We zouden het gevonden gemiddelde hier ook kunnen weergeven als een gemiddelde met een symmetrische normaal verdeling (met eigen gemiddelde, SD en spreiding) er omheen, maar voor de overzichtelijkheid staat alleen het gemiddelde afgebeeld. In de linker afbeelding zien we dat de groene streep (het steekproef gemiddelde) in het witte gebied ligt (het H0 gebied). In dit geval is dus de H0 waar. In de rechter afbeelding ligt het steekproef gemiddelde in het rode gebied (H1 gebied). Nu is dus H1 waar.

De groene lijn weerspiegelt het steekproef gemiddelde wat in de linker afbeelding in het H0 gebied ligt en in de rechter in het H1 gebied. De verschillende verdelingen van het rode H1 gebied liggen aan het verschil tussen één- en tweezijdig toetsen. Bij tweezijdig toetsen liggen de 5% waarnemingen verdeeld over de 2 staarten van de normaal verdeling. Het H1 gebied is nu dus kleiner en het is dan lastiger een significant resultaat te vinden.

Een of tweezijdig toetsen

Hoe groot het rode gebied is hangt af van alpha. Bij een alfa van 0.05 ligt 5% van de waarnemingen in het rode H1 gebied. Maar zoals te zien in de afbeelding kan dat gebied verspreid liggen over de uiteinden van de normaal verdeling, of aan één kant geclusterd. En zoals in het voorbeeld is dit nu precies het verschil tussen een significant effect en een niet significant effect. Dit ligt aan de manier van toetsing. Als we de hypothese stellen: gemiddelde 1 is groter dan gemiddelde 2, dan is het vrij onzinnig om onze aandacht te richten op het rode gebied links, dat staat immers voor de stelling ‘gemiddelde 1 is kleiner dan gemiddelde 2’. Nu zijn we gericht op zoek naar het effect rechts en kijken we dus alleen naar het rechter uiteinde. Omdat we een alpha van 5% hanteren kijken we nu dus naar de 5% van de waarnemingen aan dit uiteinde: we toetsen eenzijdig. Zouden we tweezijdig toetsen (met de hypothese: gemiddelde 1 is niet gelijk aan gemiddelde twee, zonder dat we de richting weten), dan moeten we de 5% van alpha verdelen over beide staarten. De twee H1 gebieden zijn dan dus kleiner en de gevonden p-waarde moet dus ook kleiner zijn om significant genoemd te mogen worden.

Eenzijdig toetsen gebeurt vooral binnen t-testen waarbij twee groepen worden vergeleken en er dan een duidelijke verwachting speelt. In de resultaten van de t-toets kan men dan werken met een gehalveerde p-waarde, of een verdubbelde alpha. Veel andere toetsen, waaronder de ANOVA toetsen altijd tweezijdig en kan er geen richting worden meegegeven.
© 2013 - 2017 Steven2389, het auteursrecht van dit artikel ligt bij de infoteur. Zonder toestemming van de infoteur is vermenigvuldiging verboden.
Gerelateerde artikelen
Verklarende statistiekVerklarende statistiekIn marketing en marktonderzoek spelen statistieken een belangrijke rol. Er is de beschrijvende statistiek, maar ook de v…
Basisbegrippen uit de statistiekBasisbegrippen uit de statistiekOm de weg te kunnen vinden in de wonderlijke wereld der statistiek is het belangrijk om een paar basis begrippen helder…
Verschillen tussen twee datasets: de t-testVerschillen tussen twee datasets: de t-testDe t-test is een statistische test waarmee het verschil kan worden aangetoond tussen twee verschillende sets aan data. D…
De invloed van sociaal-economische status op schoolprestatieDe invloed van sociaal-economische status op schoolprestatieDe sociaal-economische status van ouders heeft invloed op de leerprestaties van een kind. Onderzoek heeft aangetoond dat…
De elektrische wagen, een greep uit het aanbodAls we de reclamejongens mogen geloven lijkt het alsof er geen andere optie voor de toekomst is dan elektrische wagens.…
Bronnen en referenties
  • Discovering Statistics using SPSS, Second Edition, Andy Field 2005

Reageer op het artikel "De statistische term alpha, wat is het?"

Plaats als eerste een reactie, vraag of opmerking bij dit artikel. Reacties moeten voldoen aan de huisregels van InfoNu.
Meld mij aan voor de tweewekelijkse InfoNu nieuwsbrief
Infoteur: Steven2389
Rubriek: Wetenschap
Subrubriek: Diversen
Bronnen en referenties: 1
Schrijf mee!