Normale verdeling achtergrond, het bord van Galton

Normale verdeling achtergrond, het bord van Galton

Het bord van Galton is een demonstratiemodel dat het meest gebruikte principe uit de statistiek kan aantonen: de normale kansverdeling. Op dit bord zijn rijgewijs pinnetjes gemonteerd; bovenin het bord kan men balletjes laten vallen. Via botsingen met de pinnen vallen de balletjes in een vast aantal vakken onderin het bord. Iedere keer wanneer men dit experiment uitvoert, zal de verdeling van de balletjes in de vakken ongeveer dezelfde gedaante hebben: die van de normale kansverdeling.

Het bord van Galton

Op het bord van Galton zijn rijgewijs pinnetjes gemonteerd. De positie van een pin op elke rij is precies in het midden van twee
pinnen in de rij erboven. Zodoende krijgen we een demonstratiebord dat eruitziet zoals afgebeeld in de figuur hiernaast. Onderin het bord is een vast aantal vakken gemaakt. Bovenin het bord kan men precies boven het midden van de eerste rij balletjes of kogeltjes laten vallen. De kogeltjes zullen naar beneden vallend zich een weg zoeken door alle rijen met pinnen. Wanneer een kogeltje naar beneden valt, zal het via botsingen met de pinnen een bepaalde route naar beneden afleggen. Uitindelijk eindigt een kogeltje in een van de vakken die onderin het bord gemonteerd zijn.

Dit bord is een demonstratiemodel. Wat demonstreert het? We weten dat wanneer we een kogeltje precies boven een pin laten vallen dat de kogel zal botsen met de pin, en dat niet te voorspellen is welke kant de kogel op zal springen. Laten we aannemen dat er een volkomen elastische botsing plaatsvindt; de wet van behoud van impuls voorspelt dan dat de som van de snelheden voor en na de botsing even groot is. Nadat een kogel op een pin gebotst is, is niet te voorspellen welke richting de kogel uit zal gaan, daarom stelt men dat de kans dat de kogel linksom zal gaan even groot is als de kans dat de kogel rechtsom zal gaan (beide kansen zijn dus gelijk aan 50%).

Vereenvoudigd model

Laten we eens kijken wat er gebeurt als we 2 rijen met pinnen nemen. We nemen aan dat we een kogel precies recht boven de eerste pin kunnen laten vallen, en dat alle pinnen op precies dezelfde afstand van elkaar staan. De kogel zal tegen eerste pin botsen (1); de kans dat de kogel linksom gaat = de kans dat de kogel rechtsom gaat = 50%. Vervolgens valt de kogel verder naar benden en komt ter hoogte van de tweede rij (2). Er kunnen twee nieuwe botsingen ontstaan: de kogel botst met de linkerpin of met de rechterpin van de tweede rij. Wanneer er geen nieuwe botsingen ontstaan valt de kogel langs de pinnen in de tweede rij. We mogen opnieuw stellen dat de kans dat de kogel een van de twee pinnen linksom dan wel rechtsom zal passeren gelijk is, en 50%.

Stel de kogel valt na de eerste botsing naar links; daarna botst het op de linker pin in rij (2) en valt weer naar links. Dan komt de kogel uiteindelijk in vak A terecht. De kans op deze gebeurtenis is eenvoudig te beschrijven als:
P(A) = P(linksom(1)) * P(linksom(2)) = 50% * 50% = 25%.

Eenzelfde redenering gaat op voor een kogel die twee keer rechtsom valt,dus P(C) = 25%. Hoe groot is de kans dat de kogel in vakje B terechtkomt? Deze kans is een optelsom van twee kansen; er zijn namelijk twee mogelijke routes die naar vakje B leiden. De eerste route is linksom (1) + rechtsom (2). De tweede route is rechtsom (1) + linksom (2). Deze twee kansen tellen we op: P(B) = P(linksom(1) en rechtsom(2)) + P(rechtsom(1) en linksom(2)) = 50% * 50% + 50% * 50% = 2 * 25% = 50%. Blijkbaar kloppen deze redeneringen, want de totale kans P(A) + P(B) + P(C) = 25% + 50% + 25% = 100%.

Binomium

Het binomium van Newton (of de driehoek van Pascal) is een voorstelling van een reeks getallen. Men kan via een eenvoudige formule deze reeks beschrijven. De figuur hiernaast beeldt een aantal van deze reeksen af. We zien bijvoorbeeld in rij 0 een reeks met slechts één getal: het getal 1. In rij 1 de volgende reeks: 1 1 ; in rij 2 de volgende reeks: 1 2 1 ; in rij 3 de volgende reeks: 1 3 3 1, etc...

De reeksen staan in een driehoek (onder elkaar) afgebeeld; dit verduidelijkt de manier waarop een reeks tot stand komt. Elk getal in een zekere reeks (rij) kan worden berekend door de twee schuin-bovenliggende getallen op te tellen. Als voorbeeld de getallen in de lichtgroene streep: 1 + 5 levert 6, 6 + 15 levert 21, 21 + 35 levert 56, etc...

Deze reeks wordt gebruikt bij een speciale soort kansverdeling in de statistiek: de binomiale kansverdeling. De functie voor deze kansverdeling staat hiernaast afgebeeld; het getal p staat voor kans, het getal n staat voor het aantal waarnemingen, en het getal k geeft een zekere uitkomst aan. Wanneer we deze kansverdeling toepassen op het bord van Galton kunnen we stellen:
  • p = kans(linksom) = 0,5
  • (1-p) = 1-kans(linksom) = kans(rechtsom) = 0,5
  • n = aantal waarnemingen of onafhankelijke gebeurtenissen
  • k = uitkomst vakje onderin het bord

Laten we eens kijken: we hebben in het vereenvoudigde model 2 rijen en 3 mogelijke uitkomsten (3 vakjes onderin het bord, de uitkomsten zijn 0, 1, en 2). De kans dat het kogeltje in vakje A komt is p(A) = p(X=0) = 2!/2!0! * (0,5)^0 * (0,5)^(2-0) = (0,5)^2 = 0,25. Hetzelfde geldt voor p(C) = p(X=2). Nu het middelste vakje: p(B) = p(X=1) = 2!/1!1! * (0,5)^1 * (0,5)^(2-1) = 2 * 0,5 * (0,5)^1 = 0,50. Klopt.

Wanneer we een bord nemen met 4 rijen pinnen en 5 mogelijke uitkomsten (vakjes), dan vinden we voor de kansen: 6,25%; 25%, 37,5%, 25%, en 6,25%. We kunnen het bord zo groot maken als we zelf willen. Telkens vinden we eenzelfde soort kansverdeling voor het terechtkomen in de vakjes onderin. De buitenste vakjes zeer weinig kans, de middelste vakken de meeste kans, en er tussenin loopt het geleidelijk omhoog. Wanneer we de kogeltjes daadwerkelijk laten vallen (dus een experiment uitvoeren) blijkt dat iedere keer de verdeling van de kogeltjes in de vakjes overeenkomt met de berekende kansen. In de middelste vakjes komen de meeste kogels terecht,, in de buitenste vakjes het minst, en er tussenin loopt het geleidelijk op. Dit noemt men ook wel een klokcurve (of Gauss-kromme, zie ook het plaatje van de normale kansverdeling hieronder afgebeeld).

De normale verdeling

discreet en continu
Het hierboven beschreven experiment en de bijbehorende kansverdeling lijken erg op de meest gebruikte kansverdelingsfunctie uit de statistiek: de normale kansverdeling. Dit is een kansverdeling die een beschrijiving geeft voor kansen van continue kansvariabelen. De hierboven beschreven de binomiale kansverdeling is een voorbeeld van een kansfuncttie voor discrete kansvariabelen. Het aantal uitkomsten is discreet, dat wil zeggen ze zijn 'aftelbaar'. Bij een continue kansvariabele is de bepaalde uitkomst niet persé discreet, men kan bijvoorbeeld de kans willen uitrekenen hoeveel mannen een gewicht blijken te hebben tussen de 64,3 en 85,6 kilogram. Het hele gebied tussen deze twee grenzen (64,3 en 85,6) noemt men een continuüm.
De normale kansverdelingsfunctie is als volgt vastgelegd:

f(x) = 1 / (σ√2π) exp ( -1/2 [ (x-μ) / σ ] ² )

Hierin staat x voor de kansvariabele, μ voor de verwachtingswaarde (gemiddelde), en σ voor de standaarddeviatie. De verwachtingswaarde μ geeft de uitkomst aan waarop de kans het grootst is; dit is in het midden van de curve. De standaarddeviatie σ is een soort maat voor de mate waarin de andere uitkomsten afwijken van de verwachtingswaarde, de curve kan spits (weinig afwijking) of breed (veel afwijking) zijn. Merk op dat de curve erg lijkt op de verdeling zoals we die zien bij het bord van Galton. We mogen stellen dat de limiet voor (n → ∞) een binomiale verdeling de normale kansverdelingsfunctie op zal leveren.

Het blijkt dat sommige fenomenen in de natuur te beschrijven zijn met de normale kansverdeling. Zo is bijvoorbeeld de lengte van mannen of vrouwen in Nederland normaal verdeeld: er is een bepaalde verwachtingswaarde voor de lengte waaraan de meeste mannen of vrouwen blijken te voldoen. De kans dat de lengte van een willekeurige man of vrouw uit Nederland heel erg klein of heel erg groot is, is veel kleiner. We zitten dan in de zijkanten van de curve. Er tussenin loopt het geleidelijk op.

de praktijk
Een belangrijke stelling uit de kansrekening is de centrale limietstelling. Deze stelling zegt dat de gemiddelden van grote series waarnemingen zich als een normaal verdeelde variabele gaan gedragen als de steekproefomvang naar oneindig gaat. De normale verdelingsfunctie mag je dus niet zomaar lukraak overal op toepassen; in dit geval gaat het om steekproeven uit grote series waarnemingen. Daarnaast dienen we te beseffen dat een kansverdelingsfunctie meestal helemaal niets kan aantonen. Het zegt alleen iets over waarschijnlijkheid van optredende fenomenen, maar niets over achterliggende oorzaken en verbanden. Bovendien dient men te beseffen dat het meten van fenomenen alleen betrouwbaar is, als men over betrouwbare meetinstrumenten beschikt.

Lees verder

© 2011 - 2012 Tronic, gepubliceerd in Wiskunde (Wetenschap) op . Het auteursrecht van dit artikel en antwoorden op reacties ligt bij de infoteur. Zonder toestemming van de infoteur is vermenigvuldiging verboden.

Gerelateerde artikelen
Statistiek de normale verdeling De functie die voor continue kansvariabelen de kans als functie van een zekere uitkomst w…
Galton, Binet & Piaget, een vergelijking Galton, Binet en Piaget hadden hielden zich alle drie bezig met intelligentie. Z…
Verwenslaatje: Lauwe sla met eendenborst en foie gras Onder het motto, verwen jezelf met heerlijke slaatjes ditmaal een r…
De wettelijke regels van een maatschap De maatschap is een samenwerkingsverband tussen 2 of meer personen. De maatschap i…
Geschiedenis van de godsdienstpsychologie In 1879 opende Wilhelm Wundt in Leipzig het eerste psychologisch laboratorium.…

Reageer op het artikel "Normale verdeling achtergrond, het bord van Galton"

Plaats als eerste een reactie, vraag of opmerking bij dit artikel. Reacties moeten voldoen aan de huisregels van InfoNu.
Naam: E-mailadres: Meld mij aan voor de wekelijkse InfoNu nieuwsbrief. Reactie:
Infoteur: Tronic
Rubriek: Wetenschap
Subrubriek: Wiskunde
Schrijf mee!