1

East Coast Milk (ECM) is een bedrijf in de VS dat elke dag melk bij honderd boeren in de regio ophaalt. Voordat de melk in de transporttank gaat, wordt bij elke boer een monster van de melk genomen. In het laboratorium van ECM wordt de melk onderzocht op het voorkomen van bacteriële vervuiling. Daartoe wordt in elk monster het aantal bacteriën per centiliter (cl) geteld.

De Public Health Service (PHS), verantwoordelijk voor de kwaliteitsbewaking, stelt als eis een maximum van 80  bacteriën per cl. In de tabel zie je een frequentietabel van de gevonden waarden in de honderd monsters van een dag. Het gemiddelde is gelijk aan 59  bacteriën per cl en de standaardafwijking is 20,3  bacteriën per cl. Er zijn bij deze gegevens nog twee andere representaties gemaakt, zie figuur 1 en figuur 2.

a

Welke van deze drie representaties is/zijn niet geschikt om het aantal overschrijdingen van de PHS norm vast te stellen? Licht je antwoord toe.

Het laboratorium let goed op uitschieters omdat die op bijzonderheden kunnen wijzen. Vaak zijn dat meetfouten.
Het laboratorium gebruikt de volgende vuistregel:
Een uitschieter ligt buiten het interval mediaan ± 1,5 interkwartielafstand .

b

Ga na hoeveel uitschieters er zijn. Bij welke zou het om een meetfout kunnen gaan?

De twee monsters met de laagste waarde worden opnieuw gemeten. Dat levert in beide gevallen een waarde van 50  bacteriën per cl op.

c

Beredeneer, zonder een berekening te maken, dat met deze nieuwe meetwaarden het gemiddelde groter wordt en de standaardafwijking kleiner wordt.

d

Beredeneer wat er verandert aan de mediaan.

De totale hoeveelheid melk die elke dag wordt opgehaald, heet een dagproductie. Men weet uit ervaring dat de monsters representatief zijn voor de dagproductie. Voor elke dagproductie wordt een 95 % -betrouwbaarheidsinterval van het gemiddeld aantal bacteriën per cl gemaakt. Op een dag is het monstergemiddelde 60  bacteriën per cl en de standaardafwijking 20  bacteriën per cl. Als zowel het gemiddelde als de standaardafwijking van het aantal bacteriën per cl in de dagproductie kleiner zijn dan respectievelijk 60 en 20 , heeft dat gevolgen voor het 95 % -betrouwbaarheidsinterval.

e

Beredeneer wat die gevolgen zijn.

Bron: Voorbeeldopgaven statistiek
2

Hieronder zie je de kruistabel van de variabelen huiswerk (het aantal uur dat een leerling besteedt aan huiswerk) en profiel.

a

Welke van beide variabelen is kwalitatief? Is die variabele ordinaal of nominaal?

Je wilt nu de frequentieverdeling van de variabele huiswerk over de profielen bestuderen.

b

Hoe ga je dan percenteren: horizontaal of verticaal? Licht je antwoord toe.

c

Maak nu de bij b passende kruistabel met percentages.

d

Trek een conclusie over de grootte van het verschil in aantal uur huiswerk tussen de verschillende profielen.

(hint)

Bepaal de cumulatieve percentages per profiel.

3

Al heel lang worden bij het KNMI in De Bilt metingen verricht aan het weer. In deze opgave kijken we naar gegevens over het weer in de maand september.

In het steelbladdiagram is de hoeveelheid neerslag van de maand september van de jaren 1901 tot en met 2000 weergegeven (in totaal dus 100  metingen). Je ziet hierin bijvoorbeeld dat er twee jaren zijn geweest met 68  mm neerslag in de maand september en dat er zelfs een septembermaand is geweest met 213  mm neerslag. Het steelbladdiagram staat ook op het werkblad.

a

Hoe groot is de modus en hoe groot is de mediaan van de neerslag in dit steelbladdiagram? Licht je antwoorden toe.

Op de uitwerkbijlage staat onder het steelbladdiagram een schaalverdeling.
Boven die schaalverdeling is ruimte voor een boxplot van de neerslag in de septembermaanden van 1901 tot en met 2000.

b

Teken op de uitwerkbijlage deze boxplot en omcirkel in het steelbladdiagram op de bijlage de getallen die je hebt gebruikt voor het tekenen van de boxplot.

naar examen HAVO wiskunde A1,2 2005 2e tijdvak
4

Ga naar de website van de Wageningse Methode en speel Kwartetten met Statistiek.

5

In januari 2008 verscheen er in de NRC een artikel over de becijfering van een tentamen Recht. In figuur 1 zie je de verdeling van de cijfers voor dat tentamen.

Uit de gegevens in figuur 1 volgt dat het gemiddelde van de tentamencijfers 5,4 was en de standaardafwijking 1,9 .

a

Bereken (met je GR) het gemiddelde en de standaardafwijking in twee decimalen nauwkeurig.

De schrijvers van het artikel waren erg kritisch. Zij waren van mening dat er opvallend weinig cijfers 5 waren uitgedeeld. In het artikel werd een verklaring genoemd voor de vreemde verdeling van de cijfers. De groep studenten die dit tentamen had gemaakt, zou niet homogeen zijn maar bestaan uit twee homogene en ongeveer even grote subgroepen, namelijk de werkers en de niet-werkers. Daar gaan we in de rest van deze opgave naar kijken.

Neem aan dat de cijfers van de werkers normaal verdeeld waren met gemiddelde 6,7 en standaardafwijking 1,5 en de cijfers van de niet-werkers normaal verdeeld waren met gemiddelde 3,3 en standaardafwijking 1,1 .

b

Hoeveel procent van de niet-werkers haalde het tentamen?

(hint)

Je haalt het tentamen als je een 5,5 of hoger haalt.

In figuur 2 zie je vier grafieken getekend die horen bij vier verschillende normale verdelingen. Grafiek A hoort bij de cijfers van de werkers.

Eén van de overige drie grafieken B, C en D hoort bij de niet-werkers. Dat is grafiek D.

c

Leg uit waarom grafieken B en C niet kunnen horen bij de cijfers van de niet-werkers.

naar examen VWO wiskunde A 2012 1e tijdvak
6

Priesters in de Katholieke Kerk mogen niet trouwen. Deze regel wordt het celibaat genoemd. In de Volkskrant van 29 mei 2012 stond een artikel naar aanleiding van een peiling onder priesters. De kop van het artikel was:

“Peiling onder 135 priesters. 40% priesters wil van celibaat af.”

Als er sprake zou zijn van een aselecte steekproef van 135  priesters, zou je de uitkomst van de peiling nauwkeuriger kunnen formuleren, namelijk: Het percentage priesters dat van het celibaat af wil, ligt tussen ... % en ... % .

a

Bereken het betrouwbaarheidsinterval van het percentage priesters dat van het celibaat af wil bij een betrouwbaarheid van 95 % .

In het begin van het artikel lezen we: “Het NCRV-programma Altijd Wat stuurde ruim 700  maatschappelijk actieve priesters een enquêteformulier toe met vragen die onder andere over het celibaat gingen. Van hen zonden 135  priesters het formulier ingevuld terug, al dan niet anoniem.”
Deze 135   personen vormen volgens het artikel een steekproef uit de populatie van alle priesters.

b

Is hier sprake van een representatieve en aselecte steekproef? Licht je antwoord toe.

Het artikel gaat als volgt verder: “Uit de antwoorden blijkt dat 40 % voor afschaffing van het celibaat is. Een fractie minder, 39 % , vindt dat het celibaat gehandhaafd moet blijven. De overige 21 % van de priesters reageerde neutraal.”

c

Mag je hieruit de conclusie trekken dat er minder priesters zijn die vinden dat het celibaat gehandhaafd moet blijven dan priesters die van het celibaat af willen? Licht je antwoord toe.

Bron: Voorbeeldopgaven statistiek
7

In de gezondheidszorg staan veel mensen op een wachtlijst, bijvoorbeeld voor een behandeling in een ziekenhuis of voor een plaats in een verzorgingshuis.
De regering wil dat minder mensen op een wachtlijst staan. Ook wil men dat mensen die op een wachtlijst staan, minder lang hoeven te wachten.
Voor alle specialismen, waaronder neurochirurgie en orthopedie, heeft men de wachtlijsten in kaart gebracht. Men heeft bekeken hoeveel mensen op een wachtlijst staan en hoelang ze moeten wachten.
In figuur 1 staat een weergave van de wachttijd bij neurochirurgie en bij orthopedie.

In deze figuur kun je bijvoorbeeld over de wachtenden op een behandeling bij neurochirurgie aflezen:

  • bijna 40 % van de mensen is binnen 4  weken aan de beurt,

  • meer dan 25 % moet 26  weken of langer wachten.

a

Hoeveel procent van de wachtenden bij neurochirurgie moet tussen de 4 en de 10  weken wachten? Licht je antwoord toe.

Bij neurochirurgie is de gemiddelde wachttijd 17  weken. Bij orthopedie is de gemiddelde wachttijd korter. Met behulp van de klassenmiddens van de klassen A tot en met I van orthopedie kan dat gemiddelde worden geschat.

b

Bereken met behulp van de klassenmiddens de gemiddelde wachttijd bij orthopedie. Geef je antwoord in gehele weken.

Ondanks dat de gemiddelde wachttijd bij neurochirurgie langer is dan bij orthopedie, beweert neurochirurgie dat ze het beter doen dan orthopedie.

c

Noem een argument dat neurochirurgie kan aanvoeren en onderbouw dit argument met de gegevens uit figuur 1.

Aan de hand van figuur 1 kun je met behulp van lineaire interpolatie een schatting geven van het derde kwartiel van de wachttijd bij neurochirurgie.

d

Bereken op deze manier dit derde kwartiel. Geef je antwoord in gehele weken.

In figuur 2 zijn vier (gladgestreken) cumulatieve frequentiepolygonen (I, II, III en IV) voor de eerste 12  weken getekend.

e

Welke van deze vier cumulatieve frequentiepolygonen past het best bij de wachttijden tot 12  weken bij neurochirurgie uit figuur 1? Licht je antwoord toe.

naar examen HAVO wiskunde A1,2 2003 2e tijdvak
8

Op 5 juni 2014 keek 9,2 % van de Nederlandse bevolking van 6  jaar en ouder op televisie naar het NOS-journaal van 20.00  uur.
We zeggen dan dat de kijkdichtheid van dit journaal 9,2 is. Stel dat dit cijfer het resultaat is van een kijkonderzoek onder een aselecte steekproef van 2700  personen van 6  jaar en ouder.

a

Laat zien dat het 95 % -betrouwbaarheidsinterval voor de kijkdichtheid van dit journaal gelijk is aan 9,2 ± 1,1 .

Stichting KijkOnderzoek (SKO) houdt het kijkonderzoek om uitspraken te kunnen doen over hoeveel en welke mensen van de Nederlandse bevolking van 6  jaar en ouder naar de verschillende televisiezenders en programma’s kijken.
SKO wil dat het betrouwbaarheidsinterval smaller wordt. Hiervoor moet het aantal deelnemers aan het kijkonderzoek worden vergroot.
Neem aan dat de kijkdichtheid bij een grotere steekproef steeds 9,2 blijft.

b

Hoe groot moet de steekproefomvang minstens zijn, zodat de totale breedte van het 95 % -betrouwbaarheidsinterval in het kijkonderzoek kleiner dan 1 is? Geef je antwoorden in tientallen nauwkeurig.

In werkelijkheid wordt voor het kijkonderzoek geen aselecte steekproef van personen van 6  jaar en ouder genomen. We bekijken verschillende mogelijkheden om een steekproef te trekken.
Een mogelijke aanpak zou zijn om eerst een aselecte steekproef uit de Nederlandse adressen te trekken. Uit de bewoners op elk gekozen adres wordt vervolgens aselect één deelnemer aan het kijkonderzoek getrokken.

c

Leg uit waarom je hiermee geen aselecte steekproef van personen van 6  jaar en ouder hebt getrokken.

(hint)

Aselect betekent dat iedere persoon van 6  jaar of ouder dezelfde kans heeft om geselecteerd te worden.

Een andere mogelijkheid is dat SKO een grote aselecte steekproef van personen van 6  jaar en ouder trekt en dan aan deze personen vraagt om zich zelf op te geven voor het kijkonderzoek. Dat levert gemotiveerde deelnemers op.

d

Leg uit waarom deze aanpak voor SKO niet verstandig is.

Voor de werkelijke trekking van deelnemers aan het kijkonderzoek worden de deelnemers geselecteerd in twee stappen. De eerste stap is het trekken van een steekproef van Nederlandse gemeentes. Dit wordt gedaan door de gemeentes op een lijst te zetten, gesorteerd op volgorde van grootte. Met vaste stapgrootte wordt door de lijst gegaan en de namen van de getrokken gemeentes worden genoteerd. De tweede stap is het trekken van huishoudens binnen gemeentes.

e

Geef aan hoe deze eerste stap de kwaliteit van de steekproef van deelnemers bevordert.

Bron: Voorbeeldexamenopgaven statistiek
9

In de Verenigde Staten is het gebruikelijk dat je in een restaurant een flinke fooi geeft aan degene die je bedient. Het basisloon is er zeer laag en daardoor is het bedienend personeel veel meer afhankelijk van fooien dan in Nederland.
In New York bestudeerde een onderzoeker welke fooien er gegeven werden bij 500  rekeningen in restaurant A en 500  rekeningen in restaurant B.
In de figuur zijn de cumulatieve relatieve frequentiepolygonen van de fooien van de restaurants A en B getekend.

a

In welk restaurant werd in totaal meer fooi gegeven? Licht je antwoord toe.

b

In welk restaurant werden er relatief meer fooien tussen de 6 en de 8  dollar gegeven? Licht je antwoord toe.

Ruim driekwart van de fooien in restaurant B is hoger dan de 75 % laagste fooien van restaurant A.

c

Leg uit hoe je dit in de figuur terug kunt vinden.

Op grond van de figuur kun je met behulp van het formuleblad met twee verschillende vuistregels een uitspraak doen over het verschil tussen de fooien in restaurant A en die in restaurant B.

d

Beschrijf hoe je met twee verschillende vuistregels dit verschil kunt bepalen en geef bij beide de conclusie: is het verschil groot, middelmatig of gering?

(hint)

Schets op basis van cumulatieve relatieve frequentiepolygonen de boxplots voor het fooibedrag van restaurant A en B. Welke vuistregels kun je nu gebruiken (bij cumulatieve relatieve frequentiepolygonen en bij boxplots)?

Bron: Voorbeeldexamenopgaven statistiek
10

Een geiser is een heetwaterbron, die met regelmatige tussenpozen heet water en stoom de lucht in spuit. De Old Faithful geiser in het Yellowstone park in de Verenigde Staten is één van de bekendste geisers ter wereld.

Van 222  opeenvolgende uitbarstingen van de Old Faithful zijn gegevens verzameld over de tijdsduur van iedere uitbarsting D en de tussentijd tot de eerstvolgende uitbarsting E . Hierbij zijn D en E in minuten. Deze gegevens zijn verwerkt in figuur 1.

De tussentijden tot de eerstvolgende uitbarsting zijn te verdelen in kort en lang.

a

Geef op basis van figuur 1 een schatting van de verhouding tussen het aantal korte en lange tussentijden. Licht je werkwijze toe.

b

Hoelang is de tijdsduur van de beide uitbarstingen die horen bij de twee kleinste tussentijden tot de eerstvolgende uitbarsting? Licht je werkwijze toe.

In een toeristische folder over de Old Faithful staat onder andere de volgende informatie.

  • De tijdsduur van een uitbarsting varieert tussen de 1,5 en 5,5  minuten.

  • Het kortste tijdsinterval tussen twee uitbarstingen was ongeveer 42  minuten.

  • De hoogte van het water is bij elke uitbarsting tussen 32 en 56  meter.

  • Hoe langer een uitbarsting duurt, hoe langer het duurt tot de volgende uitbarsting.

c

Geef aan welke informatie je met figuur 1 kunt controleren.

Je kunt met behulp van figuur 1 schatten dat de gemiddelde tussentijd tot de eerstvolgende uitbarsting ongeveer 70  minuten is.

d

Geef een schatting van het gemiddeld aantal uitbarstingen van de Old Faithful per dag. Licht je werkwijze toe.

Door de regelmaat van de uitbarstingen van de Old Faithful zijn de uitbarstingen vrij goed voorspelbaar. In figuur 2 staat nogmaals figuur 1 met daarin de trendlijn.

De formule van de trendlijn is E = 10 D + 35 , met D en E in minuten.

e

Toon dit aan.

Door de regelmaat van de uitbarstingen van de Old Faithful kan na een uitbarsting met behulp van de formule het tijdstip van de volgende uitbarsting worden voorspeld aan de hand van het tijdstip en de duur van de laatste uitbarsting. Uit de praktijk is gebleken dat de voorspelling van 99 % van deze tijdstippen niet meer dan 15  minuten van het werkelijke tijdstip verschilt.

Een toerist komt om 11.07  uur aan bij de ingang van Yellowstone park. Hij hoort van een parkwachter dat hij net een uitbarsting van 4,3  minuten heeft gemist. De toerist gaat wandelen in het park, maar hij wil de eerstvolgende uitbarsting niet missen.

f

Bereken met behulp van de trendlijn op welk tijdstip de toerist bij de Old Faithful moet zijn om de volgende uitbarsting met 99 % zekerheid te zien.

Bron: Voorbeeldexamenopgaven statistiek
11

In ziekenhuizen worden vaak medische rapporten geschreven. Bij een onderzoek naar de inhoud van dergelijke rapporten zijn 2500  rapporten van het Elkerliek Ziekenhuis (ELK) te Deurne vergeleken met 2500  rapporten van het Academisch Ziekenhuis Maastricht (AZM). Van elk rapport is de lengte bepaald, dat is het aantal woorden dat het rapport bevat. In figuur 1 zijn de gegevens weergegeven in een gecombineerd staafdiagram met klassenbreedte  10 .

Voor de lengte van de rapporten van het ene ziekenhuis geldt:
I: Het 1 e  kwartiel is 68 , de mediaan is 100 en het 3 e  kwartiel is 149 .
Voor de lengte van de rapporten van het andere ziekenhuis geldt:
II: Het 1 e  kwartiel is 92 , de mediaan is 127 en het 3 e  kwartiel is 184 .

a

Welke van deze series gegevens, I of II, hoort bij het ELK? Licht je antwoord toe.

Uit het onderzoek bleek dat de mediaan en het gemiddelde van de lengte van de rapporten van het AZM niet even groot zijn.

b

Geef met een redenering, dus zonder een berekening, aan of de mediaan groter of kleiner is dan het gemiddelde.

De rapporten van beide ziekenhuizen bevatten samen 996   734  woorden. Toch waren er in totaal slechts ongeveer 20   000  verschillende woorden. Dit komt omdat er woorden zijn die heel vaak gebruikt worden. In de tabel zie je de 10  woorden die het meest frequent in de rapporten werden gebruikt.

Je ziet dat in de tabel de woorden op rangnummer, in volgorde van hun frequentie, zijn genoemd. Zo kun je bijvoorbeeld aflezen dat het woord ‘met’ in totaal 27   677  keer is geteld en dat dit woord rangnummer  4 heeft.
Op grond van het onderzoek kun je berekenen hoeveel keer per 10   000  woorden het woordje ‘geen’ in een medisch rapport gebruikt wordt. Ook kun je het bijbehorende 95 % -betrouwbaarheidsinterval berekenen.

c

Bereken dit aantal keer per 10   000  woorden en bepaal het bijbehorende 95 % -betrouwbaarheidsinterval

(hint)

Toon eerst aan dat het woord ‘geen’ 114  keer wordt gebruikt per 10   000  woorden.

Voor algemene teksten is er een formule die het verband aangeeft tussen het rangnummer r van een woord en de bijbehorende frequentie f . Deze formule staat bekend als de wet van Zipf.
In het geval van een algemene tekst van 996   734  woorden is de formule:
f = 88   000 r (wet van Zipf).

Medische rapporten bevatten uiteraard medische teksten. Men wil onderzoeken in hoeverre er verschil is tussen medische teksten en algemene teksten. Daartoe worden voor de medische teksten de cumulatieve percentages van de 10 meest gebruikte woorden gebruikt. Zie de tabel. Met behulp van de wet van Zipf kan men ook cumulatieve percentages van de meest gebruikte woorden in algemene teksten bepalen.

Op grond van de cumulatieve frequenties van beide teksten en een vuistregel op het formuleblad kan dan worden bepaald in hoeverre er verschil is tussen de onderzochte medische teksten en algemene teksten. Op den duur lopen deze cumulatieve percentages behoorlijk gelijk, maar in het begin wijken ze behoorlijk van elkaar af. Hierdoor is het voldoende naar de eerste 3  rangnummers te kijken.

d

Onderzoek op bovenstaande wijze of het verschil tussen de onderzochte medische teksten en algemene teksten gering, middelmatig of groot is.

(hint)

Bepaal de (cumulatieve) frequenties van de woorden met rangnummer 1, 2 en 3 in algemene teksten.

Men wil de resultaten van het onderzoek nog wat preciezer bekijken. Daarom zijn in figuur 2 van alle gebruikte woorden in de medische teksten de frequenties uitgezet tegen de rangnummers. Op beide assen is gekozen voor een logaritmische schaalverdeling. De woorden uit de tabel vind je terug als de bovenste 10  punten. Ook is de grafiek van de wet van Zipf getekend.

Je ziet dat, behalve van de woorden ‘een’ en ‘de’, de frequenties van de 2000 meest gebruikte woorden in de medische teksten hoger zijn dan verwacht mag worden volgens de wet van Zipf.

e

Bereken hoeveel procent het woord met rangnummer  100 in medische teksten vaker voorkomt dan volgens de wet van Zipf verwacht mag worden.

Bron: Voorbeeldexamenopgaven statistiek
12

Er is onderzoek gedaan naar het gedrag van hommels. De onderzoekers vroegen zich hierbij af hoe efficiënt hommels van bloem naar bloem vliegen om nectar te vinden.
Tijdens het onderzoek werd steeds een hommel in een afgesloten ruimte geplaatst. In deze ruimte bevonden zich zes kunstmatige bloemen met daarin een nectarachtige suikeroplossing. Telkens als de hommel vanuit het hommelnest op zoek ging naar voedsel, werd na terugkeer op het nest genoteerd welke route hij die vlucht volgde, welke afstand werd afgelegd en hoelang de vlucht duurde.

De onderzoekers deden het onderzoek met 8  verschillende hommels. Van elke hommel werden de gegevens genoteerd van 8  series van elk 10  vluchten. Dat leverde in totaal 640  onderzoeksresultaten op. Niet alle onderzoeksresultaten waren bruikbaar. Als de hommel niet alle zes bloemen had bezocht, werd de vlucht afgekeurd. In tabel 1 zie je per hommel het aantal afgekeurde vluchten.

In tabel 1 zie je bij hommel 1 bijvoorbeeld dat 4 van de eerste 10  vluchten zijn afgekeurd. In de laatste serie van 10  vluchten werd van deze hommel geen enkele vlucht afgekeurd.

De onderzoekers concludeerden op grond van de tabel: “De hommels hadden in het begin wat moeite om alle bloemen te vinden. Het percentage afgekeurde vluchten in serie A is ... keer zo hoog als het percentage afgekeurde vluchten in het gehele onderzoek.”

a

Bereken welk getal er op de puntjes moet staan.

De onderzoekers vergeleken de afgelegde afstand van de routes van de goedgekeurde vluchten in de verschillende series, zie tabel 2.

De onderzoekers keken naar de afgelegde afstand per goedgekeurde vlucht en stelden: “Vaker vliegen maakt verschil. In de laatste serie is de gemiddelde afgelegde afstand per goedgekeurde vlucht een stuk kleiner dan in de eerste serie.”

b

Bepaal of het verschil groot, middelmatig of gering is.

(hint)

Van welke vuistregel op het formuleblad heb je alle gegevens?

In figuur 1 zie je drie schetsen van een verdeling.

c

Leg uit welk van deze schetsen het best past bij de afgelegde afstand per goedgekeurde vlucht van serie A.

Ook de vluchtduur (het aantal seconden dat een vlucht duurt) van alle goedgekeurde vluchten is gemeten. In figuur 2 zie je voor de series A, B en H de boxplot van de vluchtduur in seconden.

Een vergelijking van de boxplots laat zien dat de vluchtduur afneemt. De onderzoekers vragen zich af of er al verschil is in vluchtduur tussen de vluchten in serie A en die in serie B.

d

Bepaal met behulp van de boxplots hoe groot het verschil in vluchtduur is tussen serie A en serie B.

Blijkbaar weten de hommels de weg naar de zes bloemen steeds beter te vinden. Veel hommels hebben vroeg of laat de kortste route van 2462  cm gevonden.
De hommel die in serie H de snelste tijd neerzette, nam deze kortste route. Deze hommel had tijdens zijn vlucht gemiddeld 5  seconden per bloem nodig om de suikeroplossing eruit te halen. De overige tijd gebruikte hij om zijn route langs de zes bloemen te vliegen.

e

Gebruik figuur 2 om de gemiddelde vliegsnelheid van deze hommel tijdens zijn snelste vlucht te berekenen. Geef je antwoord in cm per seconde.

(hint)

Bepaal met behulp van de boxplots de vluchtduur van de hommel die de snelste tijd neerzette in serie H.

Met de informatie uit het onderzoek kun je op verschillende manieren de conclusie trekken dat hommels kunnen leren.

f

Geef drie argumenten om deze conclusie te ondersteunen en vermeld bij elk argument uit welke tabel of figuur de informatie komt.

Bron: Voorbeeldexamenopgaven statistiek
13

Op de Universiteit van Leiden is een onderzoek gedaan onder een groep studenten. Hierbij werden onder andere de lichaamslengte en de armlengte van de studenten gemeten. Ook werden het geslacht, de kleur van de ogen en de voorkeurshand genoteerd. In totaal ging het om 34  mannelijke studenten en 32  vrouwelijke studenten. Enkele resultaten zie je in tabel 1. Op basis van resultaten van dit onderzoek wil men uitspraken doen over alle mannelijke en vrouwelijke studenten in Leiden.

a

Noem de variabelen uit tabel 1 en geef van elk van de variabelen aan of deze nominaal of ordinaal is. Licht je antwoord toe.

b

Bepaal met behulp van het formuleblad of het verschil in voorkeurshand tussen de mannelijke en de vrouwelijke studenten in het onderzoek groot, middelmatig of gering is.

(hint)

Welke vuistregel van het formuleblad kun je gebruiken bij een kruistabel?

In tabel 2 staan het gemiddelde en de standaardafwijking van de lichaamslengte van de studenten.

Op basis van tabel 2 kunnen voor de lichaamslengte van mannen en vrouwen 95 % -betrouwbaarheidsintervallen worden opgesteld.

c

Welke informatie geeft zo’n 95 % -betrouwbaarheidsinterval in deze context?

d

Onderzoek welk van deze twee intervallen het smalst is.

Iemand die iets wil zeggen over de grootte van het verschil in lichaamslengte tussen de mannen en de vrouwen in het onderzoek, zou gebruik kunnen maken van de effectgrootte. Bij de berekening van de effectgrootte zijn de gemiddeldes en standaardafwijkingen van beide groepen van belang. Ga ervan uit dat het verschil van de gemiddeldes gelijk blijft.

e

Leg uit op welke wijze grotere standaardafwijkingen de grootte van het verschil (groot, middelmatig, gering) kunnen beïnvloeden.

(hint)

Beredeneer met de formule voor de effectgrootte (zie het formuleblad) hoe de effectgrootte verandert als de standaardafwijkingen groter worden.

De resultaten van de lichaamslengten zijn ook in boxplots verwerkt, zie figuur 1.

Je kunt met behulp van de gegevens over de lichaamslengten in tabel 2 onderzoeken hoe groot het verschil in lichaamslengte in het onderzoek is. Dit kun je ook doen met behulp van de gegevens in figuur 1.

f

Toon met behulp van het formuleblad aan dat je met deze twee gegevensbronnen een verschillende conclusie trekt over de grootte van het verschil in lichaamslengte tussen de mannelijke en de vrouwelijke studenten.

g

Beargumenteer welk van beide conclusies het best te verdedigen is.

Om te onderzoeken of er een verband bestaat tussen de lichaamslengte en de armlengte van de studenten zijn de resultaten van het onderzoek in een spreidingsdiagram gezet (figuur 2).
Er blijkt in dit onderzoek bij benadering een lineair verband te zijn tussen de lichaamslengte L in cm en de armlengte A in cm. De getekende trendlijn geeft dit verband weer.

h

Stel een formule op van de trendlijn.

De punten in het spreidingsdiagram liggen niet precies op de trendlijn. Ga ervan uit dat de armlengte normaal verdeeld is bij alle mogelijke lichaamslengten tussen 150  cm en 200  cm en dat bij elke lichaamslengte de standaardafwijking van de bijbehorende armlengte gelijk is aan 3,0  cm.
Als we de resultaten van dit onderzoek gebruiken om op basis van de lichaamslengte de armlengte van studenten te voorspellen, kunnen we hierbij figuur 2 gebruiken.

i

Teken op het werkblad het gebied waar de middelste 95 % van de armlengten ligt voor elk van de lichaamslengten tussen 150 en 200  cm.

(hint)

Wat is de armlengte van de middelste 95 % van de studenten met een lichaamslengte van 150  cm? En van de studenten met een lichaamslengte van 200  cm?

Bron: Voorbeeldexamenopgaven statistiek