Frequentieverdelingen

In een groep letten we op een zekere eigenschap (variabele). Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden: elke waarde komt een zeker aantal keren voor. We spreken van een frequentieverdeling. Zie figuur 1.
Als de verdeling in procenten van de totale groep is, spreken we van een relatieve frequentieverdeling.
De som van de relatieve frequenties is 100 %.

figuur 1
figuur 2

Bij een frequentieverdeling kunnen we een staafdiagram of een frequentiehistogram maken. Zie figuur 2.
De hoogte van een staaf geeft het aantal of het percentage in de bijbehorende klasse. In plaats van de hoogte kun je ook op de oppervlakte letten.

Voorbeeld: de totale oppervlakte van het histogram links van 27 , inclusief 27 zelf, geeft het percentage van de gevallen dat de waarde 27 of lager is.
Als we in een frequentiehistogram de middens van de opvolgende balken verbinden, ontstaat een frequentiepolygoon.
Als in een frequentiehistogram de balken heel smal zijn, is de frequentiepolygoon goed te benaderen met een continue gladde kromme.

Een zekere variabele (bijvoorbeeld gewicht, tijdsduur, bedrag) neemt waarden aan tussen 1 en 8 . Hieronder staat zijn frequentieverdeling:

Hoe vaak de grootheid een waarde kleiner dan 8 heeft, wordt gegeven door de oppervlakte van het grijze gebied.
Preciezer: het percentage van het gebied onder de kromme dat gekleurd is, is gelijk aan het percentage van de gevallen dat de variabele kleiner dan 8 is.

Kans

Als in 3,8 % van de gevallen een variabele een waarde kleiner dan 20 heeft, zeggen we: de kans dat de variabele kleiner dan 20 is, is 3,8 %. Van een discrete variabele staat hieronder een relatief frequentie-staafdiagram.

De kans op een waarde kleiner dan 10 is de som van de percentages van de waarden 5 t/m 9 .
Dat is oppervlakte van de staven bij 5 , 6 , 7 , 8 en 9 oppervlakte van alle staven .

Van een continue variabele staat hieronder een relatieve frequentiepolygoon.

De kans op een waarde kleiner dan 10 is dan hoeveel procent het deel tussen 5 en 10 is van het geheel. Dat is oppervlakte links van 10 totale oppervlakte .

Een kans laat zich uitdrukken als een percentage (tussen 0 % en 100 %) en ook als een breuk (tussen 0 en 1 ).

De wet van de grote aantallen

Veronderstel dat bij een zeker experiment de kans op een treffer 0,6 is.
Als het experiment vaak herhaald wordt, nadert het gemiddelde aantal treffers altijd tot 0,6 .

We voeren het experiment bij herhaling uit en volgen het verloop van het aantal treffers. Dan zal op den duur het percentage treffers zeer dicht in de buurt komen van de kans op een treffer.

Theoretische kansen

De kans op vijf ogen bij een worp met een dobbelsteen is 1 6 .
De kans op kop bij een worp met een muntstuk is 1 2 .
Een randomgenerator produceert de cijfers 0 t/m 9 . De kans op het cijfer 5 is 1 10 .


Bij een toevalsexperiment zijn er verschillende uitkomsten mogelijk. De totale kans van 100 % is verdeeld over de verschillende uitkomsten. We spreken van een kansverdeling. Veronderstel dat er zeven uitkomsten mogelijk zijn. Als die gelijkwaardig zijn (gemiddeld even vaak voorkomen) zeggen we dat elk van die uitkomsten kans 1 7 heeft.

Simulaties

Soms is het ondoenlijk een experiment in werkelijkheid vaak uit te voeren. Om dan toch zicht te krijgen op de kansen maken we gebruik van simulatie. Dat wil zeggen dat we het experiment nabootsen. Hierbij kan de computer worden ingeschakend of de randomgenerator op de GR.

Rekenen met kansen

Een experiment wordt opgesplitst in deelexperimenten. We voeren het experiment in gedachten een groot aantal keren uit, zeg 1600  keer. In een stroomdiagram splitst dat aantal zich na elk deelexperiment. Bij elke splitsing vraag je je af: "hoe vaak mag ik verwachten dat de ene uitslag voorkomt, en hoe vaak de andere". Aan de toppen (de uiteinden) van het diagram kun je tellen hoe vaak je mag verwachten dat een speciale uitkomst optreedt.

Als bij elk deelexperiment de kans op G 1 4 is en op F 3 4 , dan gaat de stroom als volgt:

Bij * lees je af dat je 225  keer het resultaat "2G en 1F" mag verwachten.
De kans op 2G en 1F is 225 1600 = 9 64 .

Je hoeft niet een (geschikt) aantal experimenten te kiezen om in het stroomdiagram te beginnen. Je kunt ook rekenen met de fracties (kansen) langs de wegen van het diagram. In het voorbeeld wordt dat zoals hieronder.

De kans op het resultaat * laat zich als volgt berekenen:
1 4 1 4 3 4 + 1 4 3 4 1 4 + 3 4 1 4 1 4 = 9 64 .


Bij een kansexperiment geldt: de som van de kansen op alle mogelijke uitkomsten gelijk aan 1.

Als bij een kansexperiment bijvoorbeeld de mogelijke uitkomsten 7 , 8 , 9 , 10 en 11 zijn, dan is het volgende vaak handig:

  1. de kans op minstens waarde 8 = 1 − de kans op waarde 7 ,

  2. de kans op hoogstens waarde 10 = 1 − de kans op waarde  11 .

Voorwaardelijke kansen

In een groep van 20  jongens en 10  meisjes komt een eigenschap voor bij 12  jongens en 4  meisjes.

Dan lezen we uit de tabel af dat:

  1. 12 20 100 = 60 % van de jongens die eigenschap heeft,

  2. 12 16 100 = 75 % van de mensen met die eigenschap jongen is.

Met kansen zeggen we het zó:

  1. de kans dat een jongen die eigenschap heeft is P (eigenschap | jongen) = 0,6 ,

  2. de kans dat de drager van de eigenschap een jongen is, is P (jongen | eigenschap) = 0,75 .

Men spreekt hier van voorwaardelijke kansen; de voorwaarden zijn “jongen” respectievelijk “eigenschap”.