12.2  Kritiek gebied >
1

De wiskunde A-docent Jan Stoer zag het examen met vertrouwen tegemoet. Zijn klas had goed gewerkt, dus verwachtte hij dat het vwo wiskunde A-examen wel goed zou gaan. En dat bleek ook het geval te zijn: de 25 leerlingen scoorden de volgende cijfers:

7,6

8,7

8,0

7,8

6,1

8,5

6,8

6,9

8,3

9,9

5,6

6,8

8,0

3,4

5,3

9,4

8,6

5,7

4,1

6,9

6,8

8,5

7,6

7,1

8,0

Jan maakte bij de cijfers een frequentiehistogram, met klassebreedte 1 . De cijfers 4,5 tot en met 5,4 komen in de klasse “ 5 ”, enzovoort.

a

Wat was de mediaan van de cijfers?

Voor alle leerlingen in Nederland die het wiskunde A-examen in 2010 hebben gemaakt, was de mediaan 6,7 .

b

Hoeveel procent van de klas van Jan Stoer scoorden boven de landelijke mediaan?

Geen wonder dat Jan Stoer trots was op zijn klas (en op zichzelf). Henk Modaal, zijn collega Frans, is niet zo onder de indruk van de prestaties van Jans klas. Hij redeneert: als je een munt 25 keer opgooit, kan die best 19 of meer keer op kop vallen.

c

Bereken die kans.

d

Wat denk jij, is de trots van Jan Stoer terecht?

Twee meningen, die van Jan en van zijn collega staan tegenover elkaar:
Jan: “De klas heeft buitengewoon goed gepresteerd”,
Henk: “Dit kan best toeval zijn”.
Als Henk gelijk heeft, is de kans p dat een leerling bovenmodaal scoort 1 2 . Dat noemen we de nulhypothese: H0. Als Jan gelijk heeft, is die kans groter dan 1 2 ; dat is de alternatieve hypothese H1. H1 zegt niet hoe groot de kans p precies is; alleen maar dat hij groter is dan 1 2 .
Wie gelijk heeft is niet met zekerheid vast te stellen. Maar wel hoe zeldzaam de prestatie van Jans klas is, onder de aanname dat Henk gelijk heeft. We benaderen het probleem nu algemener (en vergeten even dat er 19 leerlingen boven de landelijke mediaan scoorden.

  1. Stel dat in Jan Stoers klas alle 25 leerlingen boven de landelijke mediaan zouden hebben gescoord. Dan zou het wel heel toevallig zijn dat dat resultaat door toeval tot stand is gekomen. In dat geval zal elk weldenkend mens Henks hypothese verwerpen.

  2. Stel dat in Jans Stoers klas maar 14 leerlingen boven de landelijke mediaan zouden hebben gescoord. Dat is een heel gewoon resultaat. Dan zal een weldenkend mens Henks hypothese niet verwerpen.

Vraag: Bij welk aantallen leerlingen die boven de mediaan scoren verwerp je Henks hypothese, en bij welke aantallen niet? Met andere woorden: Waar trek je de grens?

Hierboven staan de mogelijke aantallen leerlingen die boven de landelijke mediaan scoren; de aantallen lager dan 12 zijn weggelaten. Stel dat we de grens tussen 16 en 17 trekken:

De kans dat door louter toeval (zoals Henk beweerde) het aantal in het linker stuk terecht komt is 0,946 , de kans dat hij in het rechter stuk terecht komt is dus 0,054 . Het aantal leerlingen boven de mediaan in Jan Stoers klas was 19 . Dat zit in het rechter stuk. Omdat de kans om daarin terecht te komen slechts 0,054 is, is de prestatie van Jans klas waarschijnlijk geen toeval.

We hadden de grens ook tussen 17 en 18 kunnen trekken:

De kans op het rechter stuk is nu zelfs maar 0,022 . Omdat het aantal in Jans klas in dat gebied valt, is de conclusie gerechtvaardigd dat Jan een goede klas had.

Er zit iets willekeurigs in de aanpak. Wat vind je een kleine kans? Dat bepaalt waar je de grens gaat trekken. En dat bepaalt weer of je Henk gelijk geeft of niet. De beslissingsprocedure is als volgt:

  1. We letten op het aantal leerlingen dat boven de landelijke mediaan scoort: dat is de toetsingsgrootheid X .

  2. De mogelijke waarden worden opgesplitst in twee stukken, zo dat - als H0 waar is - de kans dat X een waarde binnen het ene (in dit geval rechter) stuk aanneemt kleiner is dan α.

  3. Als X dan toch een waarde in dat stuk aan blijkt te nemen, zal men H0 verwerpen.


Dat stuk heet het kritieke gebied. “Kritiek”, omdat dan wel eens een verkeerde beslissing genomen kan worden. Het kritieke gebied hangt af van de waarde van α. α heet wel het significantieniveau. Vaak wordt α = 0,05 genomen.

Voorbeeld:

Om het kritieke gebied in bovenstaand voorbeeld bij α = 0,05 te bepalen, kun je met de GR een tabel maken.

k

P ( X k , n = 25, p = 0,5 )

16

0,114

17

0,053

18

0,021

19

0,007

Met de tabel zie je: 17 ligt niet in het kritieke gebied, 18 wel. Dus het kritieke gebied bij α = 0,05 bestaat uit de getallen 18,19, ,25 .
NB. De kans bij k = 17 in de tabel bereken je met de GR als volgt:
P ( X 17, n = 25, p = 0,5 ) = 1 P ( X 16, n = 25, p = 0,5 ) 0,053 .

2
a

Ga na hoe je de tabel in het voorgaande voorbeeld op de GR kunt maken.

b

Wat is het kritieke gebied in bovenstaand voorbeeld bij
α = 0,02 .

3

Iemand zegt helderziende te zijn. Hij kan zeggen of een speelkaart een klaveren, ruiten, harten of schoppen is – zonder de kaart te zien natuurlijk. Hem worden twintig kaarten voorgelegd, waarvan hij de kleur gaat voorspellen. X is het aantal goede voorspellingen dat hij gaat doen.

a

Wat is het waardengebied van X ?

Stel H0 : De “helderziende” is een bedrieger en heeft geen talent om kaarten te voorspellen.

b

Wat is dan de kans per kaart dat hij hem goed voorspelt?

c

Wat is dan de verwachtingswaarde van X ?

d

Wat is het kritieke gebied als α = 0,05 ? En als α = 0,1 ? En als α = 0,02 ?

4

Een atleet zegt tegen een journalist dat hij de 100 meter gemiddeld loopt in 11,0 seconden en dat hij 80 % van zijn sprints loopt binnen de 11,3 seconden.
Neem aan dat zijn 100 -metertijd normaal verdeeld is.

a

Welke standaardafwijking volgt uit de beweringen van de atleet? Geef je antwoord in twee decimalen.

De atleet gaat de 100 meter lopen. De tijd in seconden die hij gaat realiseren noemen we T . Veronderstel dat de atleet gelijk heeft. We splitsen de verzameling mogelijke waarden van T in twee stukken:

  1. waarden boven of gelijk aan een zekere grenswaarde g ; dat is het kritieke gebied,

  2. waarden onder die grenswaarde g .

Dat doen we zo, dat - als de atleet gelijk heeft - een resultaat in het kritieke gebied kleiner dan α is.

b

Wat is het kritieke gebied als α = 0,1 .

c

Bepaal ook het kritieke gebied als α = 0,05 .

De journalist gelooft de atleet niet als T een waarde boven of gelijk aan g aanneemt; anders wel. De atleet realiseert een tijd van 11,48 seconde.

d

Wat is bij elk van de waarden van α de conclusie van de journalist?

Iemand doet een bewering, een ander twijfelt aan de juistheid daarvan. Een hypothesetoets is een procedure om te beslissen wie gelijk krijgt. Daarbij heb je:

  1. twee hypothesen: de nulhypothese H0 en de alternatieve hypothese H1,

  2. een toetsingsgrootheid; dat is het aantal X dat geteld wordt (of een gewicht dat gemeten wordt, of ...),

  3. een criterium dat zegt bij welke waarden van X de nulhypothese wordt verworpen. Deze waarden vormen het zogenaamde kritieke gebied.

Het kritieke gebied wordt zo bepaald dat - als H0 waar is - de kans dat X een waarde aanneemt in het kritieke gebied kleiner is dan een vooraf afgesproken α. Deze α heet het significantieniveau. Voor α neemt men vaak 0,05 , 0,01 of zelfs 0,005 , afhankelijk van hoe zwaarwegend de beslissing is.

Schematisch:

  1. H0: en H1:

  2. X =

  3. α =

  4. Kritiek gebied:


Voorbeeld (opgave 9)

  1. H0: Henk heeft gelijk en H1: Jan heeft gelijk

  2. X = het aantal leerlingen dat hoger dan de landelijke mediaan scoort;
    X is binomiaal verdeeld met n = 25 en succeskans p = 1 2 ,

  3. H0: p = 1 2 en H1: p > 1 2 ,

  4. α =

  5. Kritiek gebied: 17,18, ,25

5

Definieer X en formuleer H0 en H1 in de opgaven 11 en 12.

Na het opstellen van de hypothesetoets volgt een experiment (Let op de juiste volgorde. Je moet eerst de toets opstellen en daarna pas het experiment uitvoeren.) Daarin neemt X een waarde aan.
Als X in het kritieke gebied zit, wordt H0 verworpen (en dus H1 geaccepteerd).
Waarschijnlijk gebeurt dat terecht, maar helemaal zeker is dat niet. Het is dus mogelijk dat een verkeerde beslissing wordt genomen. Vandaar de term kritiek gebied.
Als H0 ten onrechte wordt verworpen, spreekt men van de fout van de eerste soort. De kans op de fout van de eerste soort is kleiner dan α.
Als X niet in het kritieke gebied zit, wordt H0 niet verworpen.
Er is een redelijke kans dat dit onterecht gebeurt. Men spreekt dan van de fout van de tweede soort.
Dit wordt meestal minder erg gevonden.

Opmerking:

Als H0 niet verworpen wordt, omdat het resultaat niet significant is, kan er toch (veel) twijfel bestaan of H0 wel juist is. Vergelijk dit met de rechtspraak: als een verdachte bij gebrek aan bewijs niet wordt veroordeeld, betekent dat nog niet dat hij onschuldig is.

6

In het begin van een voetbalwedstrijd moet de speelrichting van de teams worden bepaald en wie mag aftrappen. De scheidsrechter doet dit door “tossen”: hij gooit een muntstuk op; als het op kop valt kiest het team dat kop koos de speelrichting en de andere partij doet de aftrap. (Voor de tweede helft is het omgekeerd.)
Men gaat er bij de toss vanuit dat het muntstuk met evenveel kans op kop als op munt valt. Als in plaats van een muntstuk een kroonkurk wordt gekozen, is dat niet zo zeker.
De kans dat een kroonkurk met de holle kant naar boven valt, noemen we p .
We zetten twee meningen tegenover elkaar:
H0: p = 0,5 en H1: p 0,5 .
Omdat p volgens de alternatieve hypothese zowel groter als kleiner dan 0,5 kan zijn, hebben we hier te maken met een tweezijdige toets.
X is het aantal keer dat de holle kant boven komt, in een serie van vijftig worpen.
H0 zal worden verworpen als de waarde van X sterk afwijkt van het verwachte aantal 25 , naar beneden of naar boven. Het kritieke gebied bestaat dus uit twee stukken, namelijk de erg lage aantallen en de erg hoge aantallen. Beide stukken moeten een kans hebben van hoogstens 1 2 α .

a

Bepaal het kritieke gebied bij α = 0,1 .

X blijkt de waarde 37 aan te nemen.

b

Is de kroonkurk bruikbaar om te tossen?

7

Sanne en Harm toepen regelmatig samen. Toepen is een kaartspel waarbij de spelers elk vier kaarten krijgen uit een spel van 32 kaarten: B, V, H, A, 7, 8, 9, 10 van elke kleur. De 10 is de hoogste, de boer de laagste kaart. Het is dus gunstig om 10’en te krijgen. De kans dat een speler minstens één 10 krijgt is 0,43 .

a

Reken dat na.

Die kans is 0,43 , tenminste als er eerlijk gedeeld wordt. Harm is argwanend en denkt dat Sanne de kaarten “steekt” als ze de kaarten deelt. Hij denkt dat Sanne - als ze zelf deelt - veel vaker ten minste één 10 heeft dan in 43 % van de keren. We gaan dit vermoeden toetsen, in twintig keer dat Sanne deelt.

b

Leg uit dat je hier niet met een tweezijdige toets te maken hebt.

We spreken hier van een eenzijdige toets.

c

Definieer een toetsingsgrootheid X en formuleer H0 en H1.

d

Bepaal het kritieke gebied bij α = 0,1 .

Harm telt dat Sanne dertien keer een of meer 10’en had als ze deelde.

e

Wat gaat Harm concluderen bij α = 0,1 ?

Opmerking:

Over eenzijdig en tweezijdig
Vaak constateren mensen iets, bijvoorbeeld dat een munt vaak op kop valt en denken daarom dat ze eenzijdig moeten toetsen. H0: kans op kop p = 1 2 tegen H1: kans op kop p > 1 2 .
Dit is onjuist. Zo’n constatering mag je wel op het idee brengen een hypothese te toetsen, maar je moet onbevoordeeld aan de toets beginnen: eerst de toets formuleren en dan pas het experiment uitvoeren. In dit geval moet dus tweezijdig getoetst worden.
In het voorbeeld van het toepen deelt Sanne eerlijk of niet. Als ze oneerlijk deelt, is het verwachte aantal 10’en per keer groter dan 1 2 en beslist niet kleiner. Nu moet dus eenzijdig getoetst worden.

8

Sanne beweert dat een punaise met kans 3 4 met de punt naar boven valt en met kans 1 4 met de punt naar beneden. Harm zou niet weten waarom dat zo is.
Om Sannes bewering te toetsen, keert hij een bakje met honderd punaises ondersteboven en telt het aantal punaises X dat met de punt omhoog komt te liggen. Als significantieniveau neemt hij 0,1 .
Het kritieke gebied bestaat uit twee stukken. De kans dat de waarde van X in één van die stukken ligt, moet dus kleiner dan 0,05 zijn.

a

Bereken P ( X 84 ) en P ( X 66 ) .

b

Wat zal Harms conclusie zijn als X de waarde 84 blijkt te hebben?

c

Wat zal Harms conclusie zijn als X de waarde 66 blijkt te hebben?

Opmerking:

Als X de waarde 84 blijkt te hebben, hoeven we het kritieke gebied niet te bepalen. We kunnen volstaan met de kans P ( X 84 ) . Omdat die kleiner is dan 1 2 α = 0,05 , kan Harm Sannes bewering verwerpen.
We noemen P ( X 84 ) de overschrijdingskans van 84 , dat is de kans op een aantal van 84 of meer.

9

We gaan nog even terug naar het vermeende steken van de kaarten door Sanne (opgave 15). Neem aan dat H0 waar is: Sanne deelt eerlijk. X is het aantal keer dat Sanne een of meer 10’en krijgt in een serie van twintig keer dat ze zelf deelt. Als significantieniveau kiezen we weer 10 %.

Wat is dan P ( X 13 ) ?

Omdat deze kans kleiner is dan 0,1 , zullen we H0 bij α = 0,1 verwerpen, als Sanne 13 keer ten minste één 10 krijgt in de serie van twintig. Ook nu hoeven we dus niet het kritieke gebied te bepalen. De kans P ( X 13 ) is de overschrijdingskans van 13 , dat is de kans op een aantal van 13 of groter.

10
Mendel 1822-1884

Gregor Mendel deed biologische experimenten, waarbij hij erwtenplantjes met elkaar kruiste. Volgens de theorie moesten 75 % van de nakomelingen geel zijn en 25 % groen. Hij testte de theorie met 8023 erwtenplantjes van de tweede generatie.

a

Wat was Mendels toetsingsgrootheid? En welke waren H0- en H1-hypothese, denk je?

b

Wat is het kritieke gebied bij α = 0,05 ?

Soms moet je eenzijdig en soms tweezijdig toetsen.

In het geval van tweezijdig toetsen, bestaat het kritieke gebied uit twee stukken. Die worden zó bepaald dat de kans dat de toetsingsgrootheid X een waarde in een van die stukken aanneemt – als H0 waar is – kleiner is dan α. Dus zó dat de kans dat X een waarde in één van die stukken aanneemt kleiner is dan 1 2 α .
Stel dat X de waarde x aanneemt.
H0 wordt verworpen als de overschrijdingskans P ( X x ) kleiner is dan 1 2 α en ook als de overschrijdingskans P ( X x ) kleiner is dan 1 2 α .
In het geval van eenzijdig toetsen, bestaat het kritieke gebied uit één stuk. Dat wordt zó bepaald dat de kans dat de toetsingsgrootheid X een waarde in dat stuk aanneemt – als H0 waar is – kleiner is dan α.
Stel dat X de waarde x aanneemt.
Bij een rechtszijdige toets wordt H0 verworpen als de overschrijdingskans P ( X x ) kleiner is dan α en bij een linkszijdige toets als de overschrijdingskans P ( X x ) kleiner is dan α.