Statistiek: Chi-kwadraat voor samenhang

Met de chi-kwadraat toets (spreekt uit als ‘gie-kwadraat’) voor samenhang kan berekend worden of er een samenhang is tussen twee variabelen en zijn meetwaarden. De voorwaarden voor de chi-kwadraat toets staan beschreven in het artikel ‘chi-kwadraat toets’. Maar hoe pas je de formule toe voor de chi-kwadraat toets voor samenhang en wanneer is dit significant?

De theorie: Hoe berekent je de chi-kwadraat voor samenhang?

Net zoals de chi-kwadraat voor verdelingen gebruik je de algemene formule: Dit is de som van de werkelijke waarde (W) min de verwachte waarde (V) gekwadrateerd gedeeld door de verwachte waarde (V). Door deze waarde te vergelijken met de kritieke waarde, die je in de tabel kunt vinden, weet je of een verschil significant is – de gevonden chi-kwadraat ligt dan hoger dan de kritieke waarde. Een significant verschil betekent dat er meer aan de hand is dan toeval, bijvoorbeeld dat het kleur haar invloed heeft op het merk shampoo dat vrouwen kiezen.

Het aantal vrijheidsgraden, de alfa en de continuïteitscorrectie

Vrijheidsgraden, ook wel degrees of freedom of df genoemd, bepaalt samen met de alfa de kritieke waarde. Bij de chi-kwadraat voor samenhang wordt het aantal vrijheidsgraden bepaald door de tabel: df = (kolommen – 1) x (rijen – 1). De alfa mag, net zoals bij de chi-kwadraat voor verdelingen, zelf gekozen worden. Vaak wordt er gekozen voor 1% of 5%.
Vaak is er bij samenhang sprake van een tweezijdige toets. Echter is een eenzijdige toets wel mogelijk, maar alleen als de df=1. Dit is dus alleen mogelijk als de tabel een 2x2 formaat heeft. Hier moet dan ook een continuïteitscorrectie worden uitgevoerd. Dit betekent dat als de werkelijke waarde onder de verwachte waarde ligt er een halve punt (0,5) bij op komt en als de werkelijke waarde boven de verwachte waarde ligt er een halve punt (0,5) vanaf gaat.

Hoe wordt de verwachte waarde berekent bij de chi-kwadraat toets voor samenhang?

Aangezien de meetwaarden vaak relatief (procentueel) gezien vaak niet eerlijk verdeeld zijn over de steekproef, gaat de berekening van de verwachte waarde op de volgende manier. Eerst worden het kolomtotaal vermenigvuldigd met het rij-totaal. Dit wordt gedeeld door n (het totaal aantal onderzoeksobjecten). Door deze methode toe te passen, wordt er rekening gehouden met het feit dat onderzoeksobjecten niet gelijk verdeeld zijn over de streekproef.

Praktijk: hoe pas je de formule toe bij de chi-kwadraat voor samenhang? Een voorbeeld

Aangezien de continuïteitscorrectie al is uitgelegd in het artikel ‘chi-kwadraat voor verdelingen’ zal deze hier niet aan bod komen. Bovendien kan deze alleen maar voorkomen bij df=1 en dat komt bij de chi-kwadraat voor verdelingen minder voor.

Een onderzoeker wil kijken of rood, blond en zwart harige dames verschillen in hun voorkeur voor shampoo. Daarvoor ondervraagd hij 150 dames. Zijn resultaten zijn als volgt:

Werkelijke waarde
Werkelijke waardenMerk XMerk YTotaal
Rood haar171330
Blond haar286290
Zwart haar151530
Totaal6090150

Hoe bereken je nu de verwachte waarde? Je vermenigvuldigt het totaal van de rij met het totaal van de kolom en deelt dat door n. Dit gaat op de volgende manier:

Verwachte waarde
Verwachte waardenMerk XMerk YTotaal
Rood haar(30x60)/150=12(30x90)/150=1830
Blond haar365490
Zwart haar121830
Totaal6090150

Het aantal vrijheidsgraden is hier (3-1)x(2-1) = 2 x 1 = 2. Er hoeft hier daarom geen continuïteitscorrectie plaats te vinden.

Vervolgens bereken je van elke waarde afzonderlijk: W min V, dat kwadrateren en vervolgens gedeeld door V.

W-V kwadrateren / V
Merk XMerk Y
Rood haar(17-12)kwadraat/12=2,08(13-18)kwadraat/18=1,39
Blond haar1,781,19
Zwart haar0,751,19

Alle uitkomsten tel je bij elkaar op: 2,08 + 1,78 + 0,75 + 1,39 + 1,19 + 0,5 = 7,69

Dit getal vergelijk je met de kritieke waarde. Daarvoor heb je het aantal vrijheidsgraden (in dit geval 2), een alfa en de kennis of het een- of tweezijdig getoetst wordt nodig. In deze tabel kun je dan de kritieke waarde vinden. In dit geval wordt er tweezijdig getoetst (bij de chi-kwadraat kan alleen eenzijdig getoetst worden als de vrijheidsgraden 1 is).

In dit geval is de kritieke waarde bij een alfa van 5% (willekeurig gekozen) 5,99. Aangezien onze chi-kwadraat van 7,69 hierboven ligt, is er dus een significant verschil. Het kleur haar zou dus invloed hebben op het merk shampoo dat gekozen wordt.

Lees verder

© 2013 - 2024 Marilyn, het auteursrecht van dit artikel ligt bij de infoteur. Zonder toestemming is vermenigvuldiging verboden. Per 2021 gaat InfoNu verder als archief, artikelen worden nog maar beperkt geactualiseerd.
Gerelateerde artikelen
De Chi-kwadraat toetsDe Chi-kwadraat toetsMet de Chikwadraattoets kun je bepalen of er een verband bestaat tussen twee variabelen. Deze toets is gebaseerd op een…
Bivariate en multivariate analyse in de statistiekBivariate en multivariate analyse in de statistiekOm het verband tussen 2 of meerdere variabelen te bepalen, gebruikt men in de statistiek de bivariate en multivariate an…
Hoeveel moet ik afvallen?Hoeveel moet ik afvallen?Een vetrolletje hier en daar hoeft helemaal geen ramp te zijn. Het is belangrijk dat u tevreden bent met je lichaam, maa…
RuimtemeetkundeRuimtemeetkundeJe komt het de hele dag tegen, waarschijnlijk onbewust; ruimtemeetkunde. Dit heeft alles te maken met de aanzichten van…

T-toets 2 - gemiddelden onafhankelijke steekproevenEen t-toets wordt uitgevoerd om te bekijken of een verschil significant is. Oftewel: komt het verschil door toeval of is…
T-toets 3 - gemiddelden afhankelijke steekproevenEen t-toets derde variant wordt uitgevoerd om te kijken of een verschil tussen twee afhankelijke steekproeven significan…
Bronnen en referenties
  • J. Brinkmand (2007). Cijfers spreken
Marilyn (105 artikelen)
Laatste update: 28-11-2013
Rubriek: Wetenschap
Subrubriek: Wiskunde
Bronnen en referenties: 1
Per 2021 gaat InfoNu verder als archief. Het grote aanbod van artikelen blijft beschikbaar maar er worden geen nieuwe artikelen meer gepubliceerd en nog maar beperkt geactualiseerd, daardoor kunnen artikelen op bepaalde punten verouderd zijn. Reacties plaatsen bij artikelen is niet meer mogelijk.