6.1  Normaal of niet >
1

In de eredivisie voetbal worden per seizoen 306 wedstrijden gespeeld. Die zijn als volgt verdeeld over het aantal doelpunten.

a

In hoeveel procent van de wedstrijden werd niet gescoord?

Deze verdeling is niet symmetrisch, maar scheef.

b

Wat betekent dat?

2

Elke uur wordt in De Bilt de temperatuur gemeten. De resultaten tussen 8 en 9 uur ’s ochtends in de jaren 1981 t/m 2000 geven de volgende verdeling ( 7305 metingen).

a

Hoe groot is de gemiddelde temperatuur ongeveer?

b

Wat is er merkwaardig aan de verdeling?

3

Een lamp hangt boven het wegdek. Uiteraard is het recht onder de lamp het lichtst. Hoe verder je van de lamp weg gaat, des te kleiner wordt de lichtintensiteit. De volgende grafiek laat zien hoe het licht verdeeld is over de lengte van de weg,

a

Schat hoeveel procent van het licht op het wegdek valt, minder dan 100 meter van de plaats waar de lamp boven hangt.

De grafiek is heel fraai regelmatig, zeker in vergelijking met de grafieken van opgave 1 en 2.

b

Noem een paar fraaie eigenschappen van deze grafiek.

We gaan een speciaal soort verdeling bestuderen: klokvormige. Een paar voorbeelden zijn:

  1. de lengte van jongens in een bepaalde leeftijdsgroep,

  2. de levensduur van batterijen,

  3. het gewicht van zogenaamde kilopakken suiker,

  4. het jaarlijkse aantal verkeersdoden in een bepaalde streek.

Klokvormig wil zeggen:

  1. de meeste waarnemingen liggen rond het gemiddelde,

  2. de waarnemingen liggen symmetrisch rond het gemiddelde,

  3. hoe verder je van het gemiddelde afwijkt, des te minder waarnemingen daar liggen.

Hiernaast staat een plaatje van zo’n verdeling.

4

Geen van de volgende verdelingen is klokvormig.

Zeg van elke verdeling, waarom hij niet klokvormig is.

Hiermee is natuurlijk niet precies vastgelegd wat wel en wat niet een klokvormige verdeling is. En in de wiskunde werken we alleen maar met nauwkeurig vastgelegde begrippen.

We gaan nu definiëren wat we onder de “ideale” klokvormige verdeling zullen verstaan. Dat wordt het “prototype”. Deze ideale vorm zul je wel nooit precies zo tegenkomen, maar wel zullen veel verdelingen in de praktijk hier sterk op lijken.

Een ideale klokvorm kun je met GeoGebra tekenen. Als je kansrekening in GeoGebra Klassiek aanklikt, krijg je de 'standaard' ideale vorm te zien.
Deze kromme noemen we de standaardnormale kromme.
Merk op dat er linksboven in het tekenvenster staat: μ = 0 en σ = 1 .
De griekse letter μ spreek je uit als mu en σ als sigma.
Bij een klokvormige verdeling geven we het gemiddelde met μ aan en de afstand van de buigpunten (zie figuur) tot de symmetrie-as met σ . Deze afstand noemen we de standaardafwijking.
Bij de standaardnormale verdeling is het gemiddelde 0 en de standaardafwijking 1 .
Wat de rol van de standaardafwijking is zullen we in het vervolg zien.

5
a

Zoek uit hoe je de standaardnormale kromme op je GR krijgt.

De ideale klokkromme zit kennelijk standaard in de GR. Je kunt je afvragen welke formule deze functie heeft, uitgedrukt in 'bekende' functies.

b

Teken op de GR in hetzelfde window de grafiek van: y = 2 x 2 .

De grafiek lijken sprekend op elkaar. Het enige dat met de grafiek van y = 2 x 2 moet gebeuren is verticaal en horizontaal oprekken (ten opzichte van de y -as en x -as).
Dat lukt met: y = 0,4 2 0,72 x 2 .

c

Teken ook de grafiek van deze derde functie.

Je kunt je afvragen waar die factoren 0,4 en 0,72 vandaan komen.
Het zijn benaderingen. Deze getallen zorgen ervoor dat de buigpunten van de grafiek op afstand 1 van de symmetrieas liggen en de oppervlakte onder de kromme 1 is.

6

We nemen aan dat de verdeling van de lengte van 18 - jarige jongens de ideale klokvorm heeft met gemiddelde μ = 182 cm en standaardafwijking σ = 10 cm. Het enige verschil met de standaardnormale verdeling is het gemiddelde en de standaardafwijking. Je kunt de kromme bij deze verdeling in GeoGebra tekenen door μ en σ aan te passen.

Zoek uit hoe je deze verdeling op de GR kunt tekenen. Kies een geschikt window.

Een verdeling met de ideale klokvorm (zoals in het voorgaande gedefinieerd is), noemt men een normale verdeling.
Deze ligt vast door de getallen μ en σ .

7

We nemen de normale verdeling met μ = 5 en σ = 3 .
We bekijken wat er gebeurt als we μ variëren.

a

Teken de bijbehorende kromme op de GR met venster
4 x 12 en 0 y 1 2 .

b

Teken de grafieken voor μ = 5 , μ = 6 en μ = 7 in één plaatje.

c

Hoe verandert de grafiek als je μ groter maakt?

8

We beginnen weer met dezelfde verdeling als in de vorige opgave.
We bekijken nu wat er gebeurt als we σ variëren.

a

Teken de krommen bij σ = 2 , σ = 3 en σ = 4 in één plaatje.

b

Hoe verandert de grafiek als je σ groter maakt?

Bij elke normale verdeling is de oppervlakte onder de grafiek gelijk aan 1 . Dat komt omdat die totale oppervlakte 100 % van de waarnemingen vertegenwoordigt.
Zoals gezegd, zal een praktijkvoorbeeld nooit precies voldoen aan de formule van de normale verdeling, maar wel ongeveer. We spreken dan van bij benadering normaal verdeeld.

Quetelet

De normale verdeling komt hier voor jou uit de lucht vallen.
Vroeger is er veel onderzoek gedaan waaruit dit alles is voortgekomen. De twee belangrijkste onderzoekers zijn daarbij de Belg Quetelet en de Duitser Gauss. In 1835 publiceerde Quetelet een boek met statistisch materiaal over allerlei grootheden betreffende een mens (bijvoorbeeld de lengte van 18-jarige jongens). Hij merkte op dat de grootheden normaal verdeeld waren rond een gemiddelde. Een individuele afwijking van dat gemiddelde kwam door toevallige oorzaken, lees hiervoor bijvoorbeeld de tekst die aan opgave 33 vooraf gaat. Hij voerde de “volmaakte” mens in: dat is de mens die alle grootheden gemiddeld heeft.

De formule van de normale verdeling is afkomstig van de toen zeventienjarige (!) Gauss (1794). De grafiek wordt dan ook wel de Gauss-kromme genoemd. Zijn beeltenis komt voor op het Duitse bankbiljet van 10 mark, samen met de kromme; de kromme is naast het biljet uitvergroot. Carl Friedrich Gauss (1777 - 1855) is een van de grootste wiskundige aller tijden.

Vaak is het niet zo gemakkelijk om te beslissen of een verdeling wel bij benadering normaal is of niet. In beide plaatjes hieronder is behalve een normale verdeling nog een andere kromme getekend. Die lijkt misschien wel normaal, maar is het niet.

9

Als je een kilopak suiker koopt, mag je verwachten dat er 1000 gram suiker in zit. Dat staat per slot van rekening op de verpakking.

Deze pakken worden in de fabriek machinaal gevuld. De vulmachine kan wel keurig op 1000 gram zijn ingesteld, maar in de praktijk zal er in het ene pak wat meer en in het andere pak wat minder suiker terecht komen.
Stel dat de machine inderdaad op 1000 gram is ingesteld. Uit de geproduceerde pakken wordt een steekproef van 500 stuks genomen. De netto-inhoud van elk van die pakken wordt bepaald. De metingen staan in de volgende tabel, in gewichtsklassen met breedte 4 gram.

a

Teken het bijbehorende histogram.

Als je het histogram “glad strijkt”, lijkt het best op een klokvormige verdeling.

b

Teken zo goed mogelijk die klokvormige verdeling over het histogram.

c

Laat zien dat μ = 1000 .

d

Bereken met behulp van de tabel hoeveel procent van de pakken suiker een gewicht heeft tussen 980 en 1020 gram.

e

Ook tussen 990 en 1010 gram.

De standaardafwijking σ bepaalt de breedte van de normale kromme.
Bij elke normale verdeling wijkt ongeveer 68 % van de waarnemingen minder dan σ van het gemiddelde af.
Bijvoorbeeld: als een normale verdeling gemiddelde μ = 80 heeft en standaardafwijking σ = 6 , dan ligt 68 % van de waarnemingen tussen 74 en 86 .

In opgave 9 ligt ongeveer 68 % van de waarnemingen tussen 990 en 1010 .
Dus de normale kromme die je in onderdeel b hebt getekend heeft standaardafwijking σ = 10 .

10

Met GeoGebra kun je de oppervlakte onder een normale kromme eenvoudig berekenen.

a

Ga in GeoGebra voor de normale kromme met
μ = 1000 en σ = 10 na dat de oppervlakte onder die kromme tussen 990 en 1010 gelijk is aan 0,6827 .

b

Zoek uit hoe je dit percentage op de GR kunt vinden.

We werken nog steeds met pakken suiker met
μ = 1000 en σ = 10 .

c

Bereken met de GR hoeveel procent van de pakken volgens de benadering met de normale verdeling een gewicht heeft:

  1. tussen 990 en 1005 gram,

  2. minder dan 990 gram,

  3. meer dan 1005 gram.

(hint)
Er moet altijd een linker- en rechtergrens opgegeven worden. Kies een zodanig klein of groot getal dat de oppervlakte daarbuiten praktisch 0 is.
d

Controleer in elk van deze gevallen of de tabel in opgave 9 ongeveer dezelfde uitkomsten oplevert.

11

In een fabriek worden blikken gevuld met (gemiddeld) 1 liter verf. De standaardafwijking van de vulmachine is 15 milliliter. De inhoud van de blikken is normaal verdeeld.

a

Bereken hoeveel procent van de blikken meer dan 30 ml verf te weinig bevat.

b

Schets ook een normale kromme en kleur de bijbehorende oppervlakte.

c

Bereken hoeveel procent van de blikken minder dan 1980 gram verf bevat.

Voor de normale verdeling gelden vuistregels. Een daarvan hebben we gezien:
bij iedere normale verdeling (dus bij elke keuze van μ en σ ) is de oppervlakte onder de klokvormige grafiek tussen de grenzen μ σ en μ + σ (ongeveer) 68 %.

Een andere is:
bij iedere normale verdeling is de oppervlakte onder de klokvormige grafiek tussen de grenzen μ 2 σ en μ + 2 σ (ongeveer) 95 %.

12

Neem enkele waarden voor μ en σ en controleer deze vuistregel. Neem bijvoorbeeld μ = 80 en σ = 2 .

13

Wat is het percentage tussen μ 3 σ en μ + 3 σ ?

Bij klokvormige verdelingen hoort een wiskundig model: de normale verdeling. Een ideale klokvorm wordt een normale kromme genoemd. Bepalend voor de normale kromme zijn het gemiddelde μ en de standaardafwijking σ .
Eigenschappen:

  1. de verticale lijn door het gemiddelde μ is symmetrieas,

  2. de oppervlakte onder de kromme is 1 (dus 100 %),

  3. de buigpunten van de kromme liggen precies op afstand σ van de symmetrieas af

  4. de vuistregels zijn in de plaatjes hieronder weergegeven.

Opmerking:

In plaats van de letter σ gebruiken we ook SD, dit is een afkorting van standaarddeviatie. (Latijn: deviatie=afwijking)

14

Door de horizontale afstand van de buigpunten tot de symmetrieas te schatten, kun je bepalen hoe groot de SD ongeveer is.

Schat de SD bij de normale kromme in de figuur hiernaast.

Als je weet dat er sprake is van een normale verdeling en het gemiddelde en de SD zijn bekend, dan moet je met de GR opgaven kunnen maken van de vorm: “Hoeveel procent ligt onder ... / boven ... / tussen ... en ...” .

Opmerking:

We nemen als voorbeeld nog eens het gewicht van pakken suiker van 1 kg.
Het gewicht van een pak is een stochast X , normaal verdeeld, met gemiddelde μ = 1000 en standaardafwijking σ = 10 .
De kans dat het gewicht van een pak tussen 987 en 1002 graam ligt schrijven we als: P ( 987 < X < 1002 | μ = 1000 ; σ = 10 ) .

15

In 1986 werd van 103.370 dienstplichtige 18 -jarigen de lengte opgemeten. Hun gemiddelde lengte bleek 181,8 cm te zijn en de standaardafwijking 7 cm.
We willen weten hoeveel jongens 190 cm of langer zijn.

a

Schets een normale kromme en geef daarbij de gegevens en het gevraagde aan.

b

Bereken met de GR hoeveel van de jongens naar verwachting 190 cm of langer waren.

Jongens die langer waren dan 200 cm of korter dan 160 cm werden op grond van hun lengte afgekeurd.

c

Teken weer een bijpassend plaatje. Bereken hoeveel jongens er in 1986 op grond van hun lengte werden afgekeurd.

16

Het gewicht van varkens in een bepaalde groep is normaal verdeeld met gemiddelde 40 kg en SD 8 kg.

a

Bereken hoeveel procent van de varkens een gewicht heeft onder 30 kg.

b

Hoeveel procent heeft een gewicht boven 42 kg?

c

Hoeveel procent heeft een gewicht tussen 30 kg en 50 kg?

17

Twee fabrikanten brengen voor dezelfde prijs eenzelfde type lamp op de markt. Merk A heeft een gemiddelde van 1200 branduren en een standaardafwijking van 200 uur. Merk B heeft een gemiddelde van 1250 uur en een standaardafwijking van 250 uur. Je wilt een lamp kopen die minstens 1100 uur moet branden.

Welk merk heeft jouw voorkeur?

18

Nederlandse euromunten worden in Utrecht geslagen bij de Koninklijke Nederlandse Munt. De afmetingen en gewichten zijn aan zeer strikte regels gebonden.

munstsoort

metaal

middellijn
in mm

gewicht
in mg

twee euro

koper/nikkel/messing

25,75

8500

een euro

koper/nikkel/messing

23,25

7500

vijftig cent

Nordic gold

24,25

7800

twintig cent

Nordic gold

22,25

5740

tien cent

Nordic gold

19,75

4100

vijf cent

staal/koper

21,25

3920

twee cent

staal/koper

18,75

3060

een cent

staal/koper

16,25

2300

Het gewicht van een nieuw geslagen euromunt is normaal verdeeld met μ = 7500 mg en σ = 6 mg. Munten die meer dan 15 mg afwijken van het vereiste gewicht mogen niet in omloop worden gebracht.

a

Waarom gelden er zulke strikte eisen voor het toegestane gewicht?

b

Bereken welk percentage van de nieuw geslagen één-euromunten niet in omloop zal worden gebracht.

Per jaar zijn er 25 miljoen nieuwe één-euromunten nodig.

c

Hoeveel moeten er geslagen worden om aan die vraag te kunnen voldoen?

19

In een fabriek worden blikken gevuld met (gemiddeld) 1 liter verf. De vulmachine levert niet blikken van precies 1 liter. De inhoud van de blikken is normaal verdeeld met een standaardafwijking van 15 milliliter.
We willen weten hoeveel procent van de blikken meer dan 30 ml verf te weinig bevat.

a

Schets een normale kromme en kleur de oppervlakte die hoort bij deze vraag.

b

Bereken hoeveel procent van de blikken meer dan 30 ml verf te weinig bevat.

Een liter verf weegt 2 kg.

c

Bereken hoeveel procent van de blikken minder dan 1980 gram verf bevat.

20

Intelligentie is een van de factoren die een rol spelen bij het met succes volgen van een schoolopleiding. In 1938 gebruikte een onderwijskundige onderstaande grafiek, waarin de mate van intelligentie (uitgedrukt in IQ) werd gekoppeld aan soorten opleidingen en mogelijke beroepen.

Het IQ van leerlingen is normaal verdeeld met μ = 100 .

a

Bepaal uit het plaatje hoe groot de SD ongeveer is.

b

Bereken hoeveel procent van de bevolking in 1938 in staat werd geacht om ten minste de MTS als opleiding te volgen.

c

Bereken hoeveel procent in aanmerking kwam voor de HBS, maar niet voor het Gymnasium.

21

Een tomatenkweker heeft geoogst. De vruchten variëren in grootte en gewicht. Het gewicht is normaal verdeeld met μ = 90 gram en σ = 15 gram. In totaal zijn 60.000 tomaten geoogst. De oogst wordt op gewicht gesorteerd.
De drie gewichtsklassen zijn:

  1. klasse A: tot 70 gram

  2. klasse B: van 70 tot 100 gram

  3. klasse C: meer dan 100 gram

a

Hoeveel procent van de oogst komt in elk van de klassen terecht?

De opbrengst van een tomaat hangt af van zijn gewichtsklasse:

  1. klasse A: 20 eurocent

  2. klasse B: 25 eurocent

  3. klasse C: 30 eurocent

b

Welke opbrengst mag de kweker voor zijn hele oogst verwachten?

22

We gaan terug naar de vulmachine die pakken vult met (ongeveer) 1 kilogram suiker. Als de machine ingesteld staat op 1000 gram, zal het werkelijke gewicht van een pak normaal verdeeld zijn met gemiddelde 1000 gram en SD 10 gram.

a

Toon aan dat bijna 7 % van de pakken een gewicht heeft van 985 gram of minder.

Volgens EU-richtlijnen mag slechts 2 % van dit soort pakken suiker een gewicht van 985 gram of minder hebben. Dit houdt in dat de vulmachine op een hoger gemiddeld gewicht moet worden ingesteld. We nemen aan dat bij een andere instelling de SD onveranderd 10 gram is. Het probleem is nu op welk gewicht de machine minimaal ingesteld moet worden.

b

Probeer het antwoord te vinden (in grammen nauwkeurig) door verschillende instellingen te proberen.

In plaats van proberen willen we natuurlijk een rechtstreekse methode.
Om dit soort problemen op te lossen, moeten we eerst de nodige voorbereidingen treffen. In paragraaf 4 komen we hierop terug.