7.4  Normale verdeling >
1

Bij de keuring voor de militaire dienst werd elk jaar van duizenden jongens van 18 of 19  jaar de lengte gemeten. In de tabel hieronder staan 2504  lengtemetingen, het resultaat van een week bij één van de keuringsinstanties. De lengtes zijn afgerond op hele centimeters.

a

Hoeveel jongens waren kleiner dan 162,5  cm (en werden daarom op hun lengte afgekeurd)? Hoeveel jongens waren 162,5  cm of groter maar kleiner dan 182,5  cm? Gebruik bij het beantwoorden van deze vragen de getallen in de kolom “cumulatief”.

Het gemiddelde van deze lengtes is, ook afgerond, 182  cm.

b

Bereken de mediaan van deze lengtes.

c

Hoeveel jongens waren er met een lengte die meer dan 10  cm afwijkt van het gemiddelde? Hoeveel procent is dat?

Hieronder zie je het frequentiehistogram van de lengtes van de 2504  jongens. De vloeiende, ‘klokvormige’ kromme die door het histogram getrokken is, is een normale kromme.

De uitschieters van het histogram zijn te wijten aan toeval. De 2504  lengtes vormen een toevallige steekproef uit de totale populatie van alle dienstplichtigen. Toevallig kwam de lengte  178 wat vaker voor. De invloed van toevalsstoringen wordt minder bij een grotere steekproef, het histogram van de lichaamslengten zal beter aansluiten bij de ‘klokvormige’ kromme. We komen hier later in dit hoofdstuk op terug.

2

Minder last hebben we ook van de uitschieters als we de klassenbreedte vergroten, bijvoorbeeld naar 5  cm, en de grenzen zó kiezen dat het gemiddelde midden in een klasse valt. In dit geval worden de klassenmiddens dan 157 , 162 , 167 , enzovoorts en de klassengrenzen 154,5 ; 159,5 ; ... .

a

Neem de tabel over en vul de kolom ‘aantal’ in.

b

Teken op het werkblad het histogram dat hoort bij deze nieuwe klassenindeling.

Merk op dat dit histogram al heel mooi past bij de normale kromme. Deze ‘klokvormige’ kromme geeft een wiskundig model van de verdeling van de 18 - en 19 -jarige Nederlandse jongens naar lichaamslengte. Dit model noemen we de normale verdeling.

Opmerking:

De naam ‘normale verdeling’ is enigszins misleidend, omdat zij suggereert dat elke verdeling die hiervan afwijkt abnormaal zou zijn, hetgeen zeker niet het geval is. Zo is de inkomensverdeling van de Amerikaanse artsen in de jaren veertig (zie opgave 7) ‘scheef naar rechts’ en dus een voorbeeld van een ‘niet-normale verdeling’.

In het geval van de lichaamslengte van de dienstplichtige jongens werd de normale kromme gevonden door het ‘glad strijken’ van de frequentiepolygoon. De oppervlakte van het gebied onder de kromme tussen 162,5 en 182,5 geeft de frequentie van het aantal 18 -jarige jongens met lengte tussen 162,5  cm en 182,5  cm.

3

In opgave 26 heb je berekend dat 1335 van de dienstplichtige jongens een lengte heeft tussen 162,5  cm en 182,5  cm. Dat is ongeveer 53 % .

a

Hoe kun je zien dat die 53 % aardig klopt met de laatste grafiek?

b

Welk frequentiepercentage komt overeen met de oppervlakte van het gehele gebied onder de kromme?

4

Een normale kromme is symmetrisch en op zo’n kromme liggen twee buigpunten, dat zijn de punten waarin de grafiek van hol overgaat in bol (de punten waar de kromme het steilst is).

a

Geef in de grafiek van opgave 27 de symmetrieas en de buigpunten van de normale kromme aan.

De gemiddelde lengte van de 2504  dienstplichtigen is 181,76  cm en de standaardafwijking is 6,85  cm.

b

Ga na wat de symmetrieas en de buigpunten te maken hebben met het gemiddelde en de standaardafwijking.

5

Het nut van de standaardafwijking als spreidingsmaat berust op de vuistregel dat hoogstens 5 % van de waarnemingen een afwijking van het gemiddelde heeft die groter is dan 2  maal de standaardafwijking. Dit blijkt bij veel getalverzamelingen te kloppen.
We zullen deze vuistregel even controleren bij de verzameling van de 2504  lengtes. Het gemiddelde ( x ¯ ) van deze metingen is 181,76  cm en de standaardafwijking (SD) is 6,85  cm.

a

Hoeveel metingen zijn groter dan x ¯ + 2 SD ? Hoeveel procent is dat?

b

Hoeveel metingen zijn kleiner dan x ¯ 2 SD ? Hoeveel procent is dat?

c

Hoeveel procent van de afwijkingen is dus groter dan 2 SD ? Is dit in overeenstemming met de vuistregel?

d

Hoeveel metingen wijken meer dan 1 SD van het gemiddelde af? Hoeveel procent is dat?

Er blijkt een zekere samenhang tussen de grootte van een afwijking, uitgedrukt in aantal keren de standaardafwijking, en het percentage metingen dat een grotere of kleinere afwijking heeft.
Bij klokvormige verdelingen gelden de volgende vuistregels.
Ongeveer 5 % van de waarnemingen heeft een afwijking van het gemiddelde die groter is dan 2  maal de standaardafwijking.
Ongeveer 68 % van de waarnemingen heeft een afwijking van het gemiddelde die kleiner is dan 1  maal de standaardafwijking.

Opmerking:

Deze vuistregels gelden alleen bij grote databestanden die bovendien ongeveer normaal verdeeld zijn. Bij scheve verdelingen kunnen de percentages heel anders liggen!

6

Hieronder zie je een tabel van de lengtes van de 2504  jongens, ingedeeld in klassen met breedte  5  cm.

a

Neem de tabel over en vul de kolom ‘cumulatief’ in.

b

Hoeveel jongens waren kleiner dan 179,5  cm? Hoeveel procent is dat?

c

Hoeveel jongens waren, naar je mag aannemen, kleiner dan 177  cm? Hoeveel procent is dat? (Gebruik alleen gegevens uit de tabel!)

d

Teken op je werkblad het bij de tabel horende cumulatieve frequentiehistogram. De eerste vijf staven zijn al getekend.

In de hoofdstukken Statistiek 1 en Statistiek 2 hebben we gezien hoe we van een frequentiehistogram een frequentiepolygoon maken: voeg links en rechts een lege klassen toe, zet in het midden van de bovenkant van elke balk een stip en verbind opvolgende stippen met een lijnstuk.

Op vergelijkbare manier (maar met één belangrijk verschil) wordt een cumulatieve frequentiepolygoon getekend: voeg links een lege klasse toe, zet in de rechterbovenhoek van elke balk een stip en verbind opvolgende stippen met een lijnstuk.

e

Teken in het histogram van vraag d de bijbehorende cumulatieve frequentiepolygoon.

f

Kun je verklaren waarom de stip nu niet in het midden maar in het rechter eindpunt van de bovenkant van een staaf geplaatst moet worden?

g

Lees (alleen) met behulp van de cumulatieve frequentiepolygoon af hoeveel jongens kleiner zijn dan 179,5  cm en hoeveel kleiner zijn dan 177  cm.

h

Vergelijk je antwoorden met die op vraag b en c. Zijn beide antwoorden gelijk?

Als langs de verticale as de absolute aantallen vervangen worden door percentages ( 2504 is 100 % ) dan wordt de polygoon wel de relatieve cumulatieve frequentiepolygoon genoemd.

i

Schrijf naast de verticale as op je werkblad ook de percentages.

j

Laat zien hoe je de relatieve cumulatieve frequentiepolygoon kunt gebruiken om een benadering van de mediaan van de lengtes van de 2504  jongens te vinden. Hoe groot is die benadering? Hoe groot is de afwijking van de precieze waarde die je vond in opgave 26?

Omdat de lengteverdeling normaal verdeeld is, kunnen we de relatieve cumulatieve frequentiepolygoon ook gebruiken om een benadering van het gemiddelde en de standaardafwijking te vinden.

k

Hoe groot is het gemiddelde?

l

Laat zien hoe je met de grafiek de standaardafwijking kunt bepalen. Hoe groot is die benadering?

(hint)

Gebruik de vuistregels om de standaardafwijking te vinden. We weten dat 68 % van de waarnemingen niet meer dan 1  keer de SD afwijkt van het gemiddelde.

Hoeveel verschilt deze benadering van de precieze waarde ( 6,85  cm)?

Adolphe Quetelet
(1796 - 1874)

In veel voorbeelden in de natuur en bij het menselijk handelen komt de klokvorm voor (vaak bij benadering). Dat deze verdeling vaak voorkomt, is ontdekt in de negentiende eeuw. De belangrijkste onderzoeker was de Belg Adolphe Quetelet. In 1835 publiceerde hij een boek met statistisch materiaal over allerlei grootheden betreffende een mens (bijvoorbeeld de lengte van 18 -jarige jongens). Hij merkte op dat de grootheden klokvormig verdeeld waren rond een gemiddelde. Een individuele afwijking van dat gemiddelde kwam door toevallige oorzaken. Hij voerde het idee van de “volmaakte” mens in: dat is de mens die alle grootheden gemiddeld heeft. Heel iets anders dan wat als ideaal gezien wordt!