Enkele leerlingen, die een onvoldoende voor wiskunde op het rapport hebben, krijgen bijles. Iedere donderdagmiddag krijgen ze uur bijles. Het eerste proefwerk, enige weken later, blijkt voor hen een succes. De gemiddelde score van het groepje is . Dus de bijles helpt prima, is de voor de hand liggende conclusie.
Bedenk argumenten om deze snelle conclusie onderuit te halen.
Geef kritiek bij de volgende situaties. Kritiek kun je geven op de opzet van het onderzoek
of op de
conclusies die getrokken worden.
Geef waar mogelijk aanwijzingen om het onderzoek te verbeteren.
Ontevreden vrouwen
Bij een onderzoek naar seksuele gewoontes werden vrouwen aangeschreven met het verzoek een
enquête in te vullen. Slechts vrouwen voldeden aan dat verzoek. De resultaten van het onderzoek
werden vastgelegd in een rapport. Daarin wordt gesproken over het feit dat drie van
de vier vrouwen
ontevreden is over de man.
Vaccinatie levensgevaarlijk
In oktober 1976 werd in de Verenigde Staten gestart met griepvaccinatie. Allereerst
werden de ouderen en
zwakken ingeënt. In de eerste week werden mensen van jaar en ouder ingeënt. Drie ervan
overleden kort hierna. Daarop stopten acht staten met de vaccinatie. Hier trok men
blijkbaar de conclusie
dat vaccineren gevaarlijk is.
Vitamines verlengen je leven
De laatste jaren is er een enorme stijging in het gebruik van vitaminen. Speciale
'gezondheidswinkels'
rijzen als paddestoelen uit de grond. Een van die winkels wil voor reclamedoeleinden
aantonen dat het
gebruik van extra vitaminepillen de gezondheid bevordert. Er worden enquêteformulieren
neergelegd in
alle filialen van deze winkel. De enquête wordt ingevuld door mensen.
Van deze groep zegt %
baat te hebben bij extra vitaminegebruik.
Vervolgens adverteert de winkel. In de advertentie zet hij: 'Onderzoek toont aan dat
% van de mensen
baat heeft bij extra vitaminegebruik'.
Naar het buitenland?
Een onderzoeker wil graag weten hoeveel Nederlanders er dit jaar de zomervakantie
in eigen land willen
doorbrengen.
Om mensen voor zijn steekproef te selecteren bezoekt hij reisbureaus in de randstad (daar wonen veel
mensen) en interviewt daar iedere zevende bezoeker. Het resultaat van het onderzoek
was dat een record
aantal Nederlanders zijn vakantie in het buitenland wil doorbrengen.
De inktvis Paul leefde in een aquarium in
Oberhausen (Duitsland). Had hij voorspellende
gaven voor voetbalwedstrijden?
De dag voorafgaand aan een voetbalwedstrijd
tussen twee landen werden Paul twee kistjes
aangeboden, elk met een mossel als voedsel.
Op de kistjes waren de vlaggen van de twee
landen aangebracht. Het kistje dat Paul als
eerste koos om de mossel te consumeren, was
het land dat hij voorspelde als winnaar.
wedstrijd |
winnaar |
uitslag |
Duitsland - Polen |
Duitsland |
goed |
Kroatië - Duitsland |
Duitsland |
fout |
Oostenrijk - Duitsland |
Duitsland |
goed |
Portugal – Duitsland |
Duitsland |
goed |
Duitsland – Turkije |
Duitsland |
goed |
Duitsland – Spanje |
Duitsland |
fout |
Duitsland - Australië |
Duitsland |
goed |
Duitsland - Servië |
Servië |
goed |
Ghana - Duitsland |
Duitsland |
goed |
Duitsland - Engeland |
Duitsland |
goed |
Argentinië – Duitsland |
Duitsland |
goed |
Duitsland - Spanje |
Spanje |
goed |
Uruguay - Duitsland |
Duitsland |
goed |
Spanje - Nederland |
Spanje |
goed |
Hierboven staan Pauls voorspellingen tijdens het
Europees kampioenschap van 2008 en het
wereldkampioenschap van 2010.
Veronderstel dat Paul geen verstand van voetbal
heeft.
Wat is dan de kans dat hij twaalf of meer van de veertien wedstrijden goed voorspelt?
Heeft Paul voorspellende gaven?
Paul is op op 12 juli 2010 als orakel met pensioen gegaan. Kort daarna, op 26 oktober is hij op -jarige leeftijd overleden.
Soms lijkt het dat twee variabelen (de uitslag van een voetbalwedstrijd en de eerste
keuze van een mossel)
samenhangen. Zonder dat het duidelijk is wat die samenhang is. Veroorzaakt de ene
variabel de andere, of
omgekeerd, of hebben ze helemaal niets met elkaar te maken en berust de overeenkomst
op louter toeval.
We bekijken nog wat voorbeelden.
Tussen 1960 en 1980 nam het aantal geboorten in Duitsland af. In dezelfde periode nam ook het aantal ooievaars in Duitsland af, terwijl de teelt van rode kool gelijk bleef. De theorie luidt: de ooievaarsstand neemt af, daardoor kunnen ze minder kinderen brengen.
Haal de theorie onderuit.
Lees het krantenartikel hiernaast. (De laatste zin had
moeten zijn: Vooral bij personen van jaar of ouder
bleek dat het geheugen achteruit ging.)
Tofu is een vleesvervanger op basis van sojabonen.
Vind je dit bericht verrassend?
Kun je een mogelijke verklaring verzinnen?
Tussen 1995 en 2005 is de bierprijs flink gestegen en ook de bedragen die studenten lenen als aanvulling op de basisbeurs. Allicht: als de bierprijs stijgt, hebben de studenten hogere uitgaven, dus moeten ze wel meer lenen.
Geef commentaar.
Koeien met een naam geven meer melk, dan koeien zonder naam. Dit is de conclusie van
een onderzoek
dat de Ig-Nobelprijs voor diergeneeskunde in 2009 in de wacht sleepte.
(De Ig Nobelprijs is een parodie op de Nobelprijs en wordt ieder jaar uitgereikt voor
tien onderzoeken
waar men eerst om moet lachen, maar die ook aan het denken zetten.)
Geef een mogelijke verklaring.
Sinds de Tour de France is begonnen lijkt het wel of ik meer mensen op racefietsen zie. Het gaat vooral om mannen van middelbare leeftijd.
Geef een mogelijke verklaring.
Tijdens de kwartfinale Nederland-Frankrijk van het Europees kampioenschap voetbal van 1996 miste Clarence Seedorf de beslissende strafschop. Het bleek dat op die dag meer mannen een infarct kregen.
Vind je dat logisch?
Logisch, want zo’n wedstrijd brengt natuurlijk de nodige spanning met zich mee. En
zo haalde een nieuw
statistisch significant verband de krant: voetbal is dodelijk. Echter, de desbetreffende
wedstrijd werd
gespeeld op een zaterdag. Het blijkt dat de zaterdag altijd meer infarcten heeft,
soms nog meer dan de
‘piek’ op de zaterdag van de gemiste penalty. (Naar Hans van Maanen, studium generale
Utrecht, 17
februari 2010)
Hoe langer de naam van een eredivisie
voetbalclub, des te slechter de prestaties.
Dit is de conclusie uit de eindstand van de
vaderlandse voetbalcompetitie 2008/2009.
We onderscheiden de clubs in de bovenste
helft (de eerste negen) en de onderste helft.
En we kijken naar de lengte van de naam:
bestaat die uit ten hoogste negen letters, of uit
meer dan negen?
1 |
AZ |
10 |
VITESSE |
2 |
FC TWENTE |
11 |
NEC |
3 |
AJAX |
12 |
WILLEM II |
4 |
PSV |
13 |
SPARTA ROTTERDAM |
5 |
SC HEERENVEEN |
14 |
ADO DEN HAAG |
6 |
FC GRONINGEN |
15 |
HERACLES ALMELO |
7 |
FEYENOORD |
16 |
RODA JC |
8 |
NAC BREDA |
17 |
DE GRAAFSCHAP |
9 |
FC UTRECHT |
18 |
FC VOLENDAM |
Vul de volgende tabel in.
bovenste helft |
onderste helft |
totaal |
|
korte naam |
|||
lange naam |
|||
totaal |
Bereken de odds-ratio bij de tabel.
Geef commentaar op het geconstateerde verband tussen de lengte van de naam en de voetbalprestatie.
In opgave 8 hebben we gesproken over wiegendood/SIDS (sudden infant death syndrome).
De Britse expert Sir Roy Meadow schreef eind jaren ’70 dat het vrijwel uitgesloten
was dat wiegendood
meer dan één maal in een gezin voorkwam. "Eén keer wiegendood in een gezin is
een drama, twee keer
wiegendood is verdacht, drie keer wiegendood is moord", luidde de Wet van Meadow.
Alleen al tussen
1993 en 2003 zijn enkel op basis van deze wet ouders voor moord op hun kind veroordeeld. Eind
2003 werden de eerste vonnissen teruggedraaid, waarna er een brede discussie ontstond
over de
betrouwbaarheid van de wet van Meadow.
Ga uit van een wiegendood bij op baby’s.
Wat is de kans dat in een willekeurig gezin met twee geboortes beide baby’s aan wiegendood overlijden?
Wat is de kans dat in een willekeurig gezin met drie geboortes alle drie de baby’s aan wiegendood overlijden?
Er is nog een andere factor in het spel. In Groot-Brittanië worden elk jaar kinderen geboren. Je mag verwachten dat er jaarlijks keer wiegendood optreedt. Bij een deel van die gezinnen zal nog een tweede kind geboren worden; stel dat er dat jaarlijks zijn.
Hoe vaak verwacht je dat in honderd jaar tijd dat tweede kind ook aan wiegendood zal overlijden?
Omdat er zoveel kinderen geboren worden is het helemaal niet zo onwaarschijnlijk
dat er twee keer ergens een
wiegendood voorkomt in één gezin. Dat is wel erg toevallig, maar ook erg toevallige
dingen komen voor,
zeker als het “experiment” heel vaak herhaald wordt.
Vergelijk dit met de veroordeling van Lucia de Berk (opgave 9).
Kun je beredeneren dat de kans op twee of zelfs drie keer wiegendood in één gezin niet zo klein is als de uitkomsten van a, b en c doen geloven?
Een ander voorbeeld geeft de Bulgaarse lottotrekking van 10 september 2009: 4, 15, 23, 24, 35 en 42. De vorige trekking, op 6 september, waren precies dezelfde balletjes uit de draaiende trommel gevallen. De Bulgaarse Lotto werkt met de nummers 1 t/m 42. De kans dat in een week precies dezelfde getallen worden dan de week daarvoor is .
Reken deze kans na.
Waarom betekent dit niet dat de Bulgaarse Lotto corrupt is?
Schijncausaliteit
Er lijkt een verband te zijn tussen wiegen dood en buikligging. Is dat een reden om
baby’s niet meer op de
buik te leggen?
Dat veel wiegendood-baby’s op de buik lagen, zou als volgt verklaard kunnen worden.
Een kind voelt
zich niet goed en is onrustig. Daarom legt een ouder het kind op de buik. Als het
kind dan overlijdt, lijkt
de buikligging de oorzaak te zijn.
Sinds 1996 overlijden van de wiegendoodkinderen in een box. Is dit een reden om baby’s niet meer in
een box te leggen?
Een verklaring zou kunnen zijn dat, als een baby in een box gelegd is, de ouders niet
meer zo intensief op
het kind (hoeven te) letten.
En buikligging in de box is helemaal uit den boze. Maar pas op. Onderzoeken wijzen
uit dat buikligging
in een box goed is voor de motorische ontwikkeling van het kind.
Tien van alle wiegendoodgevallen in Nederland vindt plaats op een kinderdagverblijf.
Op een kinderdagverblijf
is de kans op wiegendood maar liefst maal zo groot als thuis.
Is dit een reden een kind niet meer naar een kinderdagverblijf te doen?
Een mogelijke verklaring is dat een kind meer gestrest is op een kinderdagverblijf.
De moraal
Wees voorzichting met het leggen van een oorzakelijk verband tussen twee verschijnselen.
De kans op een wiegendood is zo klein dat de ouders, de box of het kinderdagverblijf
snel verdacht zijn.
Maar er kunnen andere factoren in het spel zijn die heel plausibele verklaringen geven.
Placebo
Voordat een geneesmiddel op de markt komt, wordt eerst onderzocht of het effectief
is. Maar hoe weet je
of een gemeten effect is veroorzaakt door het geneesmiddel, of door andere factoren?
Die andere factoren kunnen van alles zijn. Patiënten kunnen bijvoorbeeld na verloop
van tijd gewoon
weer beter worden door het natuurlijke verloop van de ziekte: de ziekte is self-limiting,
of het immuunsysteem
maakt de patiënt beter. Ook door meetfouten of externe factoren kunnen gemeten effecten
vertroebeld raken. Om toch het effect van het geneesmiddel correct te meten, worden
geneesmiddelen
vergeleken met een placebo. De patiënten die meedoen aan het onderzoek worden willekeurig
verdeeld in
twee groepen en krijgen precies dezelfde behandeling, met één belangrijk verschil:
de ene groep krijgt het
geneesmiddel en de andere groep een placebopil (die geen werkzame bestanddelen bevat).
Er kleven ethische aspecten aan het gebruik van placebo’s. Mag je patiënten willens
en wetens een niet
werkzaam middel voorschrijven? Volgens de Medisch Ethische Commissie wel als je ze
bij aanvang van
de studie duidelijk maakt dat ze misschien een placebo toegediend krijgen. Uiteindelijk
is het wel ten bate
van de wetenschap en de kennis over het geneesmiddel.
Gek genoeg blijken die placebo’s ook vaak genoeg een gunstig effect op de gezondheid te hebben: het placebo-effect.
Heb je hier een verklaring voor?
De rol van de menselijke psyche wordt prachtig gedemonstreerd door het volgende voorbeeld.
Bij een onderzoek kregen studenten een rood of een blauw pilletje, beide placebo’s,
in de veronderstelling
dat ze of een rustgevend of een oppeppend middel kregen toegediend. Niet alleen bleken
de ‘pillen’
daadwerkelijk effect te hebben; de studenten wisten ook zeker dat de rode pillen de
oppeppers waren en
de blauwe pillen de rustgevende middelen.
Simpsonparadox
Burgerrechten zijn rechten die door de overheid gegarandeerd behoren te worden, en
die de burgers
beschermen tegen oneerlijke behandeling gebaseerd op huidskleur, geloof of geslacht.
Vooral in de
Verenigde Staten zijn burgerrechten in de 20e eeuw veel in opspraak geraakt doordat
ze vaker voor
blanken dan voor zwarten (Afro-Amerikanen) golden; vooral in de zuidelijke staten
van de VS was dat
het geval. In 1964 werd de Civil Rights Act aangenomen die de staten verplichtte hun
burgerrechten voor
al hun inwoners te laten gelden.
In de eerstvolgende tabel staat hoe het Amerikaanse Congres was samengesteld uit Democraten
en Republikeinen
opgesplitst naar de zuidelijke en noordelijke staten. In de tweede tabel staat hoe
de Democraten en
Republieken stemden, ook opgesplitst naar de zuidelijke en noordelijke staten.
aantal congresleden |
democraten |
republikeinen |
totaal |
noordelijk |
|||
zuidelijk |
|||
totaal |
aantal vóórstemmers |
democraten |
republikeinen |
totaal |
noordelijk |
|||
zuidelijk |
|||
totaal |
Bereken het percentage voorstemmers onder de democraten in de noordelijke staten (dus 145 van 154).
Ga na dat de percentages voorstemmers onder de democraten zowel in de noordelijke als van de zuidelijke staten groter waren dan de percentages voorstemmers onder de republikeinen.
Ga na dat over alle staten bekeken het percentage voorstemmers bij de republikeinen
hoger was dan
onder de democraten.
Terwijl de democraten positiever tegenover de Civil Rights Act stonden dan de republikeinen
als je Noord
en Zuid afzonderlijk bekijkt, is dat niet zo over het geheel bezien. Dit komt bijzonder
vreemd, zelfs tegennatuurlijk,
over. Vandaar dat men hier spreekt van een paradox.
Een nieuw medicijn werd getest.
mannen kregen het medicijn, waarvan er genazen;
mannen kregen een placebo waarvan er
genazen.
vrouwen kregen het medicijn, waarvan er genazen;
vrouwen kregen een placebo, waarvan er
genazen.
Ga na dat het medicijn beter dan de placebo presteert bij de mannen en ook bij de vrouwen.
Wat presteert het beste over alle mensen tezamen, het medicijn of de placebo?
De moraal
Intuïtie kan bedrieglijk zijn.
Terugval naar het midden
De kinderen van hoogbegaafde ouders zijn vaak niet hoogbegaafd.
Extreem lange mensen zijn vaak niet extreem zwaar.
Een sportman, -vrouw of -ploeg die dit jaar een topprestatie heeft geleverd, zal volgend jaar waarschijnlijk wat minder goed presteren.
Als je voor je laatste toets een laag cijfer hebt gehaald, zal de volgende toets waarschijnlijk iets beter gaan.
Ben jij het met de volgende beweringen eens?
Het idee achter al deze voorbeelden is: bij een extreem resultaat zal een volgende keer het resultaat wel
weer extreem zijn, maar minder extreem, dus dichter bij het gemiddelde liggen.
Dit verschijnsel noemt men terugval naar het midden.
Sir Francis Galton (1822 – 1911), een Brits statisticus (en neef van Charles Darwin),
is grondlegger was
van de psychometrie (het meten van persoonskenmerken). Rond 1888 stelde Galton vast
dat verschillende
menselijke eigenschappen, zoals lengte en intelligentie, de neiging hebben om dichter
bij het gemiddelde
te liggen in een volgende generatie. Lange ouders hebben bijvoorbeeld gemiddeld kinderen
die minder
lang zijn dan zijzelf, terwijl korte ouders juist kinderen hebben die gemiddeld langer
zijn dan zijzelf. Hij
noemde dit verschijnsel terugval naar het midden.
De bevindingen van Galton werden bevestigd door de Amerikaanse psycholoog Lewis Terman
(1877 –
1956). Rond 1920 startte hij een onderzoek waarin meer dan hoogbegaafde kinderen (met een
gemiddeld IQ van ) levenslang gevolgd werden.
In 1950 testte Terman nakomelingen; die bleken
een gemiddeld IQ te hebben van “maar” . Meer dan de helft van deze kinderen van hoogbegaafde
ouders waren niet hoogbegaafd.
Op grond van het bovenstaande zou je kunnen denken dat er in volgende generaties steeds minder hoogbegaafden zullen zijn.
Bedenk een reden waarom dat niet het geval zal zijn.
Waarom is terugval naar het midden relevant in deze paragraaf met titel “Gevaar”?
Veronderstel dat een prestatie afhangt van kundigheid en van toeval. Dan zal een zeer
hoge prestatie
meestal gevolgd worden door een minder hoge prestatie. Dat is zo omdat die hoge prestatie
door geluk
(meewerkende toevalligheden) tot stand kwam en bij gelijke kundigheid een volgende
keer het geluk
minder zal zijn of er zelfs sprake van pech kan zijn.
Dit is bijvoorbeeld het geval bij lichaamslengte; die wordt gedeeltelijk door aanleg
bepaald, maar ook
door toeval. En bij de dagtemperatuur van twee opvolgende dagen; de temperatuur op
een dag hangt
samen met die op de dag daarvoor, maar wordt gedeeltelijk door toeval bepaald. Vaak
wordt echter niet
aan die toevallige factoren gedacht en wordt de volgende keer een even hoge prestatie
verwacht.
Geef commentaar op de volgende conclusies.
Een bedrijf kan dit jaar erg goede jaarcijfers overleggen. Volgende jaar verwachten de aandeelhouders weer zulke goede cijfers.
De jackpot viel in een jaar vier van de tien keer in Gelderland. Mensen overwegen nu om naar deze provincie te verhuizen.
Vorige week waren er wel tien diefstallen in de Winkel van Sinkel. De directie stelde een opziener in uniform aan. Deze week waren er maar vier winkeldiefstallen. Zo’n opziener in uniform helpt dus.
Een patiënt voelt zich erg beroerd en krijgt een medicijn. De volgende dag voelt hij zich een stuk beter. De verklaring ligt voor de hand: dat komt door het medicijn.
De moraal
Na een extreem slecht resultaat worden maatregelen genomen. Als er daarna verbetering
optreedt, hoeft
dat niet door die maatregelen te komen. Immers, meestal komt er een terugval naar
het midden voor.
In de volgende opgave bekijken we een aardig model om terugval naar het midden te
simuleren op de GR.
We willen met de grafische rekenmachine lengtes van mannen uit opeenvolgende generaties
produceren.
Daarvoor gebruiken we de optie randomgenerator die willekeurige getallen uit een normale
verdeling met
een gemiddelde van en een standaardafwijking van geeft.
We maken de rij lengtes als volgt.
Start met bijvoorbeeld cm,
neem van de lengte,
tel daarbij een random getal uit de normale verdeling met een gemiddelde van en een standaardafwijking van op,
dit wordt de lengte van de volgende generatie.
Produceer op deze manier een rij van lengtes uit twintig opeenvolgende generaties.
Ga na of er bij de geproduceerde rij lengtes sprake is van terugval naar het midden.
Wat is (volgens dit model) de kans dat de zoon van een man van cm langer is dan zijn vader?
Wat is (volgens dit model) de kans dat de zoon van een man van cm kleiner is dan zijn vader?