Statistiek de normale verdeling

Statistiek de normale verdeling

De functie die voor continue kansvariabelen de kans als functie van een zekere uitkomst weergeeft, noemt men de kansdichtheid. Kansen zijn te bereken door het oppervlak -door wiskundige integratie- onder de grafiek te bepalen. Een speciale kansdichtheid is de normale verdeling; het blijkt dat in de natuur en bij series excperimenten de gegevens vaak volgens deze verdeling te beschrijven zijn. Bij de normale verdeling vallen het gemiddelde, de mediaan, en de modus samen in een punt.

Normale verdeling

De normale verdeling is de meest gebruikte kansverdeling in de statistiek. Men kan praktische als theoretische beweegredenen aanvoeren voor deze uitspraak. Uit verzamelde praktijkgegevens blijkt dat tal van variabelen een verdeling hebben die qua vorm overeenkomt met de normale verdeling. Dit verschijnsel komen we vooral tegen in situaties waar een serie metingen verricht wordt bij hetzelfde fenomeen. Een reeks metingen die verricht wordt blijkt vaak een hoeveelheid waarnemingen of uitkomsten op te leveren die te beschrijven zijn met de wiskundige functie 'normaal verdeelde frequentieverdeling'.
(Zie ook het artikel Normale verdeling achtergrond, het bord van Galton,

Wanneer een reeks metingen in de natuur gedaan wordt, bijvoorbeeld het gewicht van een bepaalde groep personen, blijken de uitkomsten eveneens vaak te beschrijven volgens dezelfde wiskundige functie. Daarnaast wordt het gebruik van de normale verdeling vaak gefundeerd door gevolgtrekkingen uit de theoretische statistiek. Een belangrijke stelling uit de kansrekening is de centrale limietstelling. Deze stelling zegt dat de gemiddelden van grote series waarnemingen zich als een normaal verdeelde variabele gaan gedragen als de steekproefomvang naar oneindig gaat.

Wanneer een kansvariabele zelf niet normaal verdeeld is, kan men vanwege de centrale limietstelling, toch de normale verdeling gebruiken voor het gemiddelde van een steekproef. De normale verdeling is een wiskundige functie van een continue variabele. Om de kansen te kunnen berekenen gebruikt men de dichtheidsfunctie. Oppervlakktes onder de grafiek van de dichtheidsfunctie geven de kansen aan. De dichtheidsfunctie f (x) van de normale verdeling wordt weergegeven door de volgende formule:

f(x) = 1 / (σ√2π) exp ( -1/2 [ (x-μ) / σ ] ² )

Bij de normale verdeling spelen twee parameters een rol. In de eerste plaats is er de verwachtingswaarde μ die
aangeeft waar het gemiddelde (of de gemiddelde uitkomst) van de normale verdeling ligt. In de grafiek geeft x-waarde aan waarboven zich de top van de dichtheidsfunctie bevindt. Verder is er de parameter σ die de standaarddeviatie van de betrokken variabele is. Deze waarde geeft aan of de curve breed of spits is; het is een indicatie van hoeveel de gegevens afwijken van het gemiddelde.

Er is een grote familie van normale verdelingen; de keuze van μ en σ bepaalt de grootte van het gemiddelde en de vorm van de curve. De normale verdeling is een symmetrische functie (rond het gemiddelde), en heeft één top. Een variabele x die normaal verdeeld is met verwachtingswaarde en standaarddeviatie noteren we als volgt:

x ˜ N ( μ, σ )
Zomaar een integraal berekenen van een zekere kans is niet eenvoudig. Daarom is de tabel van de standaardnormale verdeling ingevoerd.

Standaardnormale verdeling

Bij gegeven μ en σ ligt de curve van de normale verdeling vast. De kansen kunnen dan als oppervlaktes onder de grafiek berekend worden. Het is niet eenvoudig om deze integralen (oppervlaktes onder de grafiek) zomaar voor willekeurige kansen te berekenen. Daarom heeft men een ander methode ontwikkeld: via tabellen kan men de kansen voor uitkomsten gemakkelijk opzoeken/aflezen. Voor de normale verdeling heeft men een tabel geconstrueerd met μ = 0 en σ = 1. Dit noemt men ook wel de standaardnormale verdeling.

Stel de kansvariabele z is standaardnormaal verdeeld. Dan geldt:
z ˜ N ( μ=0, σ=1 )

De hiernaast staande tabel geeft de 'rechteroverschrijdingskansen' aan voor punten op het positieve deel van de z-as. Dit betekent dat de kans op een uitkomst groter een zekere waarde (=rechter overschrijding) direct af te lezen is in de tabel. Klik op het plaatje om de tabel te kunnen lezen. Voor het aflezen van de tabelwaarden kunnen we een zekere handigheid ontwikkelen. We weten dat het totale oppervlak onder de grafiek gelijk is aan 1. Daarnaast is de grafiek symmetrisch. Met deze feiten in het achterhoofd kunnen we alle oppervlakken onder de grafiek berekenen.

Wanneer we bijvoorbeeld willen weten hoe groot de kans op z ≥ 1.208 = P(z ≥ 1.208), dan doen we het volgende: Zoek in de tabel in de linker kolom 1.2 op. De bijbehorende rij is dit getal tot de 1e decimaal. Zoek dan in de tabel in de bovenste rij 0.08 op. De bijbehorende kolom is dit getal in honderdsten. Daar waar de rij en kolom elkaar kruisen staat het antwoord: P(z ≥ 1.208) = 0.8997.

Dus de linkerkolom geeft het getal tot de 1e decimaal, en de bovenste rij geeft de 2e decimaal (hondersten). De kans op de uitkomst wordt gevonden door de bijbehorende rij en kolom te kruisen.



Voorbeelden

Voorbeeld 1
P(z ≥ 1.21) ? Opzoeken links 1.2; opzoeken boven 0.01. Kruisen levert : P(z ≥ 1.21) = 0.1131

Voorbeeld 2
P(0.34 < z < 1.57) ? Om deze kans te berekenen moet deze kans geschreven worden als een uitdrukking die in de tabel af te lezen moet zijn. Er geldt P( z > 0.34) = P(0.34 < z < 1.57) + P( z > 1.57), dus
P(0.34 < z < 1.57) = P( z > 0.34) - P( z > 1.57)
Aflezen in de tabel levert : P( z > 0.34) - P( z > 1.57) = (1-0.6331) - 0.0582 = 0.3669 - 0.0582 = 0.3087.

Lees verder

© 2010 - 2012 Tronic, gepubliceerd in Wiskunde (Wetenschap) op . Het auteursrecht van dit artikel en antwoorden op reacties ligt bij de infoteur. Zonder toestemming van de infoteur is vermenigvuldiging verboden.

Gerelateerde artikelen
Verklarende statistiek In marketing en marktonderzoek spelen statistieken een belangrijke rol. Er is de beschrijvende sta…
Beschrijvende statistiek Bij marktonderzoek houd je je door middel van beschrijvende statistiek bezig met het verzamelen…
De wettelijke verdeling van een erfenis? Indien bij overlijden blijkt dat de overledene geen testament heeft opgemaakt, w…
De wettelijke regels van een maatschap De maatschap is een samenwerkingsverband tussen 2 of meer personen. De maatschap i…
Meetniveau in de statistiek Een veel voorkomend begrip in de statistiek is het meetniveau van een variabele. Afhankelijk…

Reageer op het artikel "Statistiek de normale verdeling"

Plaats als eerste een reactie, vraag of opmerking bij dit artikel. Reacties moeten voldoen aan de huisregels van InfoNu.
Naam: E-mailadres: Meld mij aan voor de wekelijkse InfoNu nieuwsbrief. Reactie:
Infoteur: Tronic
Rubriek: Wetenschap
Subrubriek: Wiskunde
Schrijf mee!