12.7  Extra opgaven
1

In 1787 en 1788 schreven Alexander Hamilton en James Madison de zogenaamde The Federalist Papers, om de inwoners van New York te overreden de Constitutie te ratificeren. Beide schrijvers ondertekenden met "Publius".
Van 48 van deze teksten is bekend dat zij van Hamilton zijn en van 50 dat zijn van Madison zijn. Om ook van de overige teksten de auteur te achterhalen, heeft men van diverse woorden geteld hoe vaak ze in een tekst van Hamilton voorkomen en hoe vaak in een tekst van Madison. Voor elk van die teksten heeft men daarna de frequentie per 1000 woorden berekend.
Van een bepaald woord weet men dat dit bij Hamilton per 1000 woorden voorkomt met een gemiddelde van 17,2 en een standaarddeviatie van 4,1 . Men mag aannemen dat de frequenties normaal verdeeld zijn. Voor Madison zijn deze gegevens niet bekend.
Bij een gegeven tekst vindt men onder de eerste 1000 woorden dit woord 24 maal.

a

Onderzoek of men bij een significantieniveau van 5 % voldoende reden heeft te twijfelen aan het auteurschap van Hamilton.

Om een grotere nauwkeurigheid te bereiken, kijkt men nu naar de eerste 4000 woorden van die tekst. Het gezochte woord blijkt hierbij 86 maal voor te komen.

b

Onderzoek of men nu bij een significantieniveau van 5 % voldoende reden heeft te twijfelen aan het auteurschap van Hamilton.

Een andere aanpak is door niet naar één woord te kijken, maar door aan de hand van meerdere woorden te kijken wie de auteur is. Het ene woord kan namelijk een andere vermoedelijke auteur aanwijzen dan de andere. Zo heeft men een bepaalde tekst op 20 woorden onderzocht. Op grond daarvan heeft men 15 maal gekozen voor Hamilton als auteur en 5 maal voor Madison als auteur.

c

Onderzoek of men hieruit met een significantieniveau van 2,5 % mag besluiten dat Hamilton de schrijver was.

2

Een wijnkenner beweert dat hij verschillende wijnjaren van de wijnsoort Medoc kan onderscheiden

Er worden hem tien glazen wijn voorgezet: 6 gevuld met Medoc 1975 en 4 met Medoc 1970. De glazen staan in willekeurige volgorde en de wijnkenner is gedurende de hele proef geblinddoekt. Het enige dat hij weet is dat er 6 glazen van de eerste soort en 4 glazen van de tweede soort zijn ingeschonken.
Veronderstel dat de wijnkenner een bluffer is en slechts raadt naar het wijnjaar.

a

Hoe groot is de kans dat hij tien keer het goede wijnjaar noemt?

Nu worden de tien glazen stuk voor stuk 'ad random' met een van de wijnsoorten gevuld (er wordt steeds een geldstuk geworpen; bij 'kop' schenkt men 1975 in, anders 1970).
Neem opnieuw aan dat de wijnkenner alleen maar raadt.

b

Hoe groot is de kans dat hij tien keer het goede jaar noemt?

De wijnkenner zwakt zijn bewering af en zegt dat hij weliswaar niet met zekerheid kan vaststellen met welk wijnjaar hij te doen heeft, maar dat hij vaker goed dan fout kiest. Hij krijgt opnieuw tien glazen wijn voorgezet, stuk voor stuk 'ad random' gevuld, en noemt achtmaal het goede jaar.

c

Is er op grond van deze uitslag reden genoeg om hem te geloven bij een significantieniveau van 5 %?

Een week later voert men opnieuw deze toets uit, maar nu met een ander aantal glazen 'ad random' met één van beide wijnsoorten gevuld). Bij een significantieniveau van 5 % wordt de wijnkenner slechts geloofd als hij ten hoogste één keer een verkeerd jaar noemt.

d

Hoeveel glazen krijgt hij ten minste voorgezet?

3

Mens erger je niet
Bij een spelletje Mens erger je niet heeft Harrie flink verloren. Volgens hem ligt dat aan de dobbelsteen; die zou niet helemaal in orde zijn. Hij had bij dat spelletje opvallend weinig zessen gegooid, terwijl zijn vriendinnetje Mady juist erg vaak een zes gooide. Harrie heeft op school net voor het eerst van een hypothesetoets gehoord en besluit die kennis meteen te gebruiken.

a

Harrie besluit een tweezijdige toets op te stellen. Ben jij het daarmee eens?

Hij gooit 100 keer met de dobbelsteen en telt daarbij op het aantal keren zes. Dat aantal noemen we X .

b

Formuleer H0 en H1 en bepaal het kritieke gebied bij significantieniveau α = 0,10 .

4

Taaltest
Met deze test wordt onderzocht of iemand iets afweet van een bepaalde taal. De test bestaat uit tien vragen. Bij iedere vraag zijn er drie woorden in de vreemde taal gegeven met de bijbehorende Nederlandse woorden, maar die staan in een willekeurige volgorde. De proefpersoon moet bij elke vraag de juiste volgorde van de woorden aangeven door één van de zes mogelijke volgordes te kiezen. Hij krijgt dan zoveel punten als er woorden goed geplaatst zijn.
X 1 is het aantal punten dat bij de eerste vraag gescoord wordt.
Neem even aan (H0) dat de proefpersoon niets van de vreemde taal weet.

a

Ga na dat E ( X 1 ) = 1 en Var ( X 1 ) = 1 .

Laat T het totaal aantal punten zijn dat de proefpersoon behaalt bij de tien vragen, dus T = X 1 + X 2 + + X 10 .

b

Bereken: P ( T = 0 ) , P ( T = 1 ) , P ( T = 28 ) en P ( T = 30 )

c

Bereken E ( T ) en Var ( T ) .

T is bij benadering normaal verdeeld.

d

Bereken hiermee P ( T = 15 ) .

We willen met een hypothesetoets onderzoeken of de proefpersoon wel of niet iets van de taal afweet.
De proefpersoon scoort in totaal 17 punten.

e

Formuleer H0 en H1 en ga na of deze score bij een significantieniveau van 5 % voldoende is om te concluderen dat de proefpersoon niets van de vreemde taal afweet.

5

In een kogellagerfabriek worden stalen kogeltjes gemaakt die een diameter tussen 3,98 en 4,02 mm dienen te hebben. Door middel van twee zeven worden de kogeltjes gesorteerd. Het is inmiddels bekend dat de diameter van de kogeltjes normaal verdeeld is met standaardafwijking 0,008 mm, maar het gemiddelde μ is onbekend. Van een aselecte steekproef van 250 kogeltjes werden er 11 uitgezeefd omdat ze te dun of te dik waren.

Neem aan dat μ = 4,005 .

a

Bereken de kans dat een aselect gekozen kogeltje een te grote of te kleine diameter heeft.

b

Wordt op grond van de uitkomst van de steekproef de hypothese dat μ = 4,005 verworpen? Neem als significantieniveau α = 0,05 .