{"id":158,"date":"2022-01-20T14:38:12","date_gmt":"2022-01-20T13:38:12","guid":{"rendered":"https:\/\/wiskunst.hjgsoft.nl\/?page_id=158"},"modified":"2023-02-03T10:15:53","modified_gmt":"2023-02-03T09:15:53","slug":"een-beetje-statistiek","status":"publish","type":"page","link":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/","title":{"rendered":"Een beetje statistiek"},"content":{"rendered":"<h2>Inleiding<\/h2>\n<p style=\"font-weight: 400;\">In deze aflevering zal ik op eenvoudige wijze proberen een aantal veel gebruikte statistische termen uit te leggen. Ik zal dat zowel technisch doen alsook de betekenis erbij geven. Er is echter een bekend gezegde, dat de geachte lezer altijd in gedachte moet houden wanneer hij of zij met statistiek bezig is.<\/p>\n<p style=\"font-weight: 400;\">Er zijn drie soorten leugens: 1. Een leugentje om bestwil, 2. Een grove leugen en 3. Statistiek.<\/p>\n<h2>Waarnemingsgetallen<\/h2>\n<p style=\"font-weight: 400;\">Waarnemingsgetallen zijn niets anders dan de resultaten van een of andere test of onderzoek. Te denken valt hierbij aan de cijfers van een klas, temperaturen in de wintertijd, aantal gereden kilometers per dag gedurende een jaar, etcetera.<\/p>\n<h2>Modus<\/h2>\n<p style=\"font-weight: 400;\">De modus is het waarnemingsgetal dat het meeste voorkomt in een verzameling waarnemingsgetallen. Kijk maar naar de volgende verzameling: {1, 2, 3, 3, 3, 4, 5, 5, 6, 7}. Het getal 3 komt het meeste voor en is daarom de modus. Wanneer er meer getallen even vaak (en het meest) voorkomen, dan is er geen modus.<\/p>\n<h2>Mediaan<\/h2>\n<p style=\"font-weight: 400;\">De mediaan is het middelste waarnemingsgetal van een verzameling gesorteerde waarnemingsgetallen. Wanneer de verzameling een even aantal elementen bevat, dan is de mediaan het gemiddelde van de twee middelste waarnemingsgetallen. In de verzameling {1, 2, 3, 3, 4, 5, 5, 6, 7} is 4 de mediaan, in de verzameling {1, 2, 3, 3, 3, 4, 5, 5, 6, 7} is de mediaan het gemiddelde van 3 en 4, en dat is 3\u00bd.<\/p>\n<h2>Gemiddelde<\/h2>\n<p style=\"font-weight: 400;\">Het gemiddelde van een verzameling waarnemingsgetallen is het quoti\u00ebnt van de som der waarnemingsgetallen en het aantal waarnemingsgetallen. We praten hier overigens over een \u201crekenkundig\u201d gemiddelde. Iedereen heeft wel een intu\u00eftief gevoel van het begrip gemiddelde, maar statistisch gezien heb je er vrij weinig aan.<\/p>\n<p style=\"font-weight: 400;\">Het gemiddelde van de waarnemingsgetallen {1, 2, 3, 3, 3, 4, 5, 5, 6, 7} is dus 1+2+3+3+3+4+5+5+6+7=39 gedeeld door 10 (het aantal waarnemingsgetallen) is 3,9.<\/p>\n<p style=\"font-weight: 400;\">Een relevantere vraag is of bv. 3 ook \u201cgemiddeld\u201d is. En wat te denken van 7?<\/p>\n<h2>Standaarddeviatie<\/h2>\n<p style=\"font-weight: 400;\">Deviatie is een ander woord voor afwijking. We praten hier over een afwijking van een waarnemingsgetal ten opzichte van het gemiddelde. We kunnen dit per waarnemingsgetal bepalen, maar we willen eigenlijk 1 \u201cmaat\u201d van afwijking voor de gehele verzameling waarnemingsgetallen hebben. Dat laatste noemen we de standaarddeviatie of standaardafwijking. Technisch gezien is de standaarddeviatie de wortel van het quoti\u00ebnt van de som der afwijkingen in het kwadraat en het aantal waarnemingsgetallen. Dat is natuurlijk een prachtige volzin, maar laten we het toch maar even illustreren.<\/p>\n<p style=\"font-weight: 400;\">Kijken we naar de volgende verzameling waarnemingsgetallen: {1, 3, 4, 5, 7}.<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">waarnemingsgetal<\/td>\n<td width=\"154\">afwijking tov gem.<\/td>\n<td width=\"154\">afw<sup>2<\/sup><\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">1<\/td>\n<td width=\"154\">1-4=-3<\/td>\n<td width=\"154\">-3<sup>2<\/sup>=9<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">3<\/td>\n<td width=\"154\">3-4=-1<\/td>\n<td width=\"154\">-1<sup>2<\/sup>=1<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">4<\/td>\n<td width=\"154\">4-4=0<\/td>\n<td width=\"154\">0<sup>2<\/sup>=0<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">5-4=1<\/td>\n<td width=\"154\">1<sup>2<\/sup>=1<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">7<\/td>\n<td width=\"154\">7-4=3<\/td>\n<td width=\"154\">3<sup>2<\/sup>=9<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">som<\/td>\n<td width=\"154\">20<\/td>\n<td width=\"154\">som<\/td>\n<td width=\"154\">20<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">gemiddelde<\/td>\n<td width=\"154\">20\/5=4<\/td>\n<td width=\"154\">standaarddeviatie<\/td>\n<td width=\"154\">\u221a(20\/5)=\u221a4=2<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">Allereerst bepalen we het gemiddelde. In dit voorbeeld is dat 4. Dan gaan we van ieder afzonderlijk waarnemingsgetal de afwijking t.o.v. het gemiddelde bepalen. Deze vind je in de derde kolom. Dan bepaal je per afwijking het kwadraat, zie vierde kolom. Dan bepaal je de som van alle afwijkingen in het kwadraat en deel je die door het aantal waarnemingsgetallen. Tot slot trek ja van het verkregen getal de wortel, en je hebt de standaarddeviatie van de gehele verzameling.<\/p>\n<p style=\"font-weight: 400;\">Wat zegt de standaarddeviatie ons nu? In de vorige paragraaf stelden we de vraag of bepaalde waarnemingsgetallen nu \u201cgemiddeld\u201d waren of niet. Met de standaarddeviatie in handen kunnen we deze vragen beantwoorden, waarbij we de volgende vuistregel hanteren. Ieder waarnemingsgetal dat binnen twee keer de standaarddeviatie van het gemiddelde ligt is\u00a0<u>niet<\/u>\u00a0uitzonderlijk.<\/p>\n<p style=\"font-weight: 400;\">In ons voorbeeld zijn dus alle getallen tussen 0 (=4-2&#215;2) en 8 (=4+2&#215;2) niet uitzonderlijk. Dat geldt in dit voorbeeld voor alle getallen!<\/p>\n<p style=\"font-weight: 400;\">Wanneer je dus een of ander statistisch onderzoek leest, dan zegt het gemiddelde alleen maar iets wanneer ook de standaarddeviatie is gegeven. Een leerling die een 10 haalt met een gemiddelde van 5 hoeft dus niet uitzonderlijk te zijn.<\/p>\n<h2>Correlatie ofwel appels en peren<\/h2>\n<p style=\"font-weight: 400;\">Een vaak gehoorde uitdrukking is dat je appels en peren niet met elkaar kunt vergelijken. In de statistiek kan dit echter wel!<\/p>\n<p style=\"font-weight: 400;\">Door middel van correlatie kun je twee verzamelingen met waarnemingsgetallen met elkaar in verband brengen. Ik ga hier niet een exacte definitie of formule van correlatie geven, want dat is te ingewikkeld. De methode om tot een correlatieco\u00ebffici\u00ebnt (zo heet dat nu eenmaal officieel) te komen is echter niet zo ingewikkeld. Allereerst moeten we de waarnemingsgetallen uit de twee verzamelingen \u201cnormaliseren\u201d. Dat betekent dat we aan alle waarnemingsgetallen een nieuwe waarde moeten toekennen zodat ze wel met elkaar vergeleken kunnen worden. Om van een waarnemingsgetal tot een normaalgetal te komen delen we de afwijking van dat waarnemingsgetal door de standaarddeviatie. Voor de verzameling van waarnemingsgetallen uit de vorige paragraaf komen we dan tot de volgende tabel:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">waarnemingsgetal<\/td>\n<td width=\"154\">afwijking tov gem.<\/td>\n<td width=\"154\">normaalgetal<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">1<\/td>\n<td width=\"154\">1-4=-3<\/td>\n<td width=\"154\">-3\/2=-1,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">3<\/td>\n<td width=\"154\">3-4=-1<\/td>\n<td width=\"154\">-1\/2=-0,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">4<\/td>\n<td width=\"154\">4-4=0<\/td>\n<td width=\"154\">0\/2=0<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">5-4=1<\/td>\n<td width=\"154\">\u00bd=0,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">7<\/td>\n<td width=\"154\">7-4=3<\/td>\n<td width=\"154\">3\/2=1,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">som<\/td>\n<td width=\"154\">20<\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<\/tr>\n<tr>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<\/tr>\n<tr>\n<td width=\"154\">gemiddelde<\/td>\n<td width=\"154\">20\/5=4<\/td>\n<td width=\"154\">standaarddeviatie<\/td>\n<td width=\"154\">2<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">Nu zou het handig zijn als we een tweede verzameling waarnemingsgetallen hadden. Vooruit dan maar: {50, 90, 70, 10, 130}. Dit levert de volgende tabel op:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">waarnemingsgetal<\/td>\n<td width=\"154\">afwijking tov gem.<\/td>\n<td width=\"154\">normaalgetal<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">50<\/td>\n<td width=\"154\">50-70=-20<\/td>\n<td width=\"154\">-20\/40=-0,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">90<\/td>\n<td width=\"154\">90-70=20<\/td>\n<td width=\"154\">20\/40=0,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">70<\/td>\n<td width=\"154\">70-70=0<\/td>\n<td width=\"154\">0\/40=0<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">10<\/td>\n<td width=\"154\">10-70=-60<\/td>\n<td width=\"154\">-60\/40=-1,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">130<\/td>\n<td width=\"154\">130-70=60<\/td>\n<td width=\"154\">60\/40=1,5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">som<\/td>\n<td width=\"154\">350<\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<\/tr>\n<tr>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<\/tr>\n<tr>\n<td width=\"154\">gemiddelde<\/td>\n<td width=\"154\">350\/5=70<\/td>\n<td width=\"154\">standaarddeviatie<\/td>\n<td width=\"154\">40<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">Als het goed is moeten je nu twee dingen opvallen: 1. de grootte van de waarnemingsgetallen van de twee verzamelingen liggen nogal uiteen, terwijl 2. de normaalgetallen, qua grootte, dicht bij elkaar liggen.<\/p>\n<p style=\"font-weight: 400;\">De correlatieco\u00ebffici\u00ebnt verkrijgen we nu als volgt: 1. Vermenigvuldig de normaalgetallen paarsgewijs met elkaar, 2. Bepaal vervolgens hun som en 3. Deel de som door het aantal paren normaalgetallen. Kijk naar het resultaat maar naar de volgende tabel:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\">normaalgetal 1 (n1)<\/td>\n<td width=\"154\">normaalgetal 2 (n2)<\/td>\n<td width=\"154\">n1xn2<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">-1,5<\/td>\n<td width=\"154\">-0,5<\/td>\n<td width=\"154\">0,75<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">-0,5<\/td>\n<td width=\"154\">0,5<\/td>\n<td width=\"154\">-0,25<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">0<\/td>\n<td width=\"154\">0<\/td>\n<td width=\"154\">0<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">0,5<\/td>\n<td width=\"154\">-1,5<\/td>\n<td width=\"154\">-0,75<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">1,5<\/td>\n<td width=\"154\">1,5<\/td>\n<td width=\"154\">2,25<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">som<\/td>\n<td width=\"154\">2<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">correlatieco\u00ebf.<\/td>\n<td width=\"154\">2\/5=0,4<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">Wat zegt ons die 0,4 nu eigenlijk?<\/p>\n<p style=\"font-weight: 400;\">Een correlatieco\u00ebffici\u00ebnt ligt altijd tussen de \u20131 en de 1. In het algemeen kunnen we zeggen dat twee verzamelingen correlatie vertonen als de correlatieco\u00ebffici\u00ebnt kleiner is dan \u20130,5 of groter is dan 0,5. Hoe meer de correlatieco\u00ebffici\u00ebnt naar de \u20131 of de 1 kruipt, hoe meer verband er is tussen de twee verzamelingen waarnemingsgetallen.<\/p>\n<p style=\"font-weight: 400;\">In ons voorbeeld is er dus eigenlijk geen overtuigend verband tussen de twee verzamelingen.<\/p>\n<p style=\"font-weight: 400;\">Tot slot nog een paar opmerkingen:<\/p>\n<ol style=\"font-weight: 400;\">\n<li>Om de correlatieco\u00ebffici\u00ebnt te kunnen bepalen is de volgorde van de waarnemingsgetallen in de verzameling belangrijk.<\/li>\n<li>Het aantal waarnemingsgetallen in beide verzamelingen moet gelijk zijn.<\/li>\n<li>Wanneer de correlatieco\u00ebffici\u00ebnt positief is wil dat zeggen dat wanneer de elementen van de ene verzameling groter worden, dat in de andere verzameling ook zal gebeuren.<\/li>\n<li>Wanneer de correlatieco\u00ebffici\u00ebnt negatief is wil dat zeggen dat wanneer de elementen van de ene verzameling groter worden, de elementen in de andere verzameling juist kleiner worden.<\/li>\n<\/ol>\n<h2>Correlatie 2<\/h2>\n<p style=\"font-weight: 400;\">Er is nog een andere manier om de correlatieco\u00ebffici\u00ebnt uit te rekenen. Bepaal het quoti\u00ebnt van de covariantie en het product van de standaarddeviatie en je krijgt de correlatieco\u00ebffici\u00ebnt.<\/p>\n<p style=\"font-weight: 400;\">De covariantie van twee verzamelingen waarnemingsgetallen is ook een maat voor afhankelijkheid tussen beide verzamelingen. Daar echter de covariantie niet \u201cgenormaliseerd\u201d is, is het in de praktijk niet handig om dat daarvoor te gebruiken.<\/p>\n<p style=\"font-weight: 400;\">Het is echter niet moeilijk om de covariantie van twee verzamelingen waarnemingsgetallen te bepalen. Dat gaat als volgt: Bepaal het gemiddelde van de som van de producten van de paarsgewijze waarnemingsgetallen. Bepaal dan het product van de gemiddelden van de verzamelingen waarnemingsgetallen en trek de laatste nu van de eerste af. Dat getal is de covariantie. Kijk maar weer naar onderstaande tabel:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">waarnemingsgetal 1 (w1)<\/td>\n<td width=\"154\">waarnemingsgetal 2 (w2)<\/td>\n<td width=\"154\">w1*w2<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">1<\/td>\n<td width=\"154\">50<\/td>\n<td width=\"154\">50<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">3<\/td>\n<td width=\"154\">90<\/td>\n<td width=\"154\">270<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">4<\/td>\n<td width=\"154\">70<\/td>\n<td width=\"154\">280<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">10<\/td>\n<td width=\"154\">50<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\">7<\/td>\n<td width=\"154\">130<\/td>\n<td width=\"154\">910<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">som<\/td>\n<td width=\"154\">20<\/td>\n<td width=\"154\">350<\/td>\n<td width=\"154\">1560<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">aantal<\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">5<\/td>\n<td width=\"154\">5<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">gemiddelde<\/td>\n<td width=\"154\">4<\/td>\n<td width=\"154\">70<\/td>\n<td width=\"154\">1560\/5=312<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">standaarddeviatie<\/td>\n<td width=\"154\">2<\/td>\n<td width=\"154\">40<\/td>\n<td width=\"154\"><\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\">gem1*gem2<\/td>\n<td width=\"154\">280<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\">covariantie<\/td>\n<td width=\"154\">312-280=32<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\">sd1*sd2<\/td>\n<td width=\"154\">80<\/td>\n<\/tr>\n<tr>\n<td width=\"154\"><\/td>\n<td width=\"154\"><\/td>\n<td width=\"154\">correlatieco\u00ebf.<\/td>\n<td width=\"154\">32\/80=0,4<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">In de laatste twee regels van de tabel worden achtereenvolgens het product van de standaarddeviaties van de twee verzamelingen waarnemingsgetallen en de correlatieco\u00ebffici\u00ebnt bepaald.<\/p>\n<h2>Regressie<\/h2>\n<p style=\"font-weight: 400;\">Door middel van regressie kunnen we bepalen door welke (rechte) lijn de grafiek van de twee verzamelingen waarnemingsgetallen het best wordt bepaald. Ik bedoel natuurlijk dat je de twee verzamelingen waarnemingsgetallen tegen elkaar uitzet.<\/p>\n<p style=\"font-weight: 400;\">Wanneer we beide verzamelingen uit de vorige paragrafen tegen elkaar uitzetten krijgen we de volgende grafiek:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-160 alignleft\" src=\"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif\" alt=\"\" width=\"380\" height=\"181\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p style=\"font-weight: 400;\">Kunnen we nu een rechte lijn bedenken die deze grafiek het best benadert? Het antwoord is natuurlijk ja, want anders was ik niet aan deze paragraaf begonnen.<\/p>\n<p style=\"font-weight: 400;\">Even een opmerking tussendoor: Omdat de correlatieco\u00ebffici\u00ebnt in ons voorbeeld vrij laag is, zal de lijn die we gaan zoeken natuurlijk niet al te best zijn.<\/p>\n<p style=\"font-weight: 400;\">Een rechte lijn heeft de volgende algemene formule: y=ax+b, waarbij a de zgn. richtingsco\u00ebffici\u00ebnt is en b het snijpunt met de y-as is. Vanuit onze voorgaande statistische analyses kunnen we a en b gemakkelijk bepalen. Namelijk: a=r*(sd2\/sd1), waarbij r de correlatieco\u00ebffici\u00ebnt is en sd1 en sd2 resp. de standaarddeviatie van de eerste en de tweede verzameling waarnemingsgetallen is, en b=g2-a*g1, waarbij g1 en g2 resp. het gemiddelde van de eerste en tweede verzameling waarnemingsgetallen is.<\/p>\n<p style=\"font-weight: 400;\">In onderstaande tabel bepalen we a en b:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"154\">g1<\/td>\n<td width=\"154\">4<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">sd1<\/td>\n<td width=\"154\">2<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">g2<\/td>\n<td width=\"154\">70<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">sd2<\/td>\n<td width=\"154\">40<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">r<\/td>\n<td width=\"154\">0,4<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">a=r*(sd2\/sd1)<\/td>\n<td width=\"154\">0,4*(40\/2)=8<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">b=g2-a*g1<\/td>\n<td width=\"154\">70-8*4=38<\/td>\n<\/tr>\n<tr>\n<td width=\"154\">y=ax+b<\/td>\n<td width=\"154\">y=8x+38<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"font-weight: 400;\">De lijn y=8x+38 is de beste benadering voor vervanging van onze grafiek. Getekend in de grafiek komt e.e.a. er als volgt uit te zien:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-162 alignleft\" src=\"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/Grafiek2.gif\" alt=\"\" width=\"688\" height=\"387\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p style=\"font-weight: 400;\">Ook kunnen we door de formule voorspellen wat de overeenkomstige waarde in de tweede verzameling waarnemingsgetallen zal zijn voor een niet bestaand waarnemingsgetal in de eerste verzameling waarnemingsgetallen.<\/p>\n<p style=\"font-weight: 400;\">Hoe hoger echter de correlatieco\u00ebffici\u00ebnt, hoe beter zo\u2019n voorspelling natuurlijk zal zijn.<\/p>\n<h2>Ter afsluiting<\/h2>\n<p style=\"font-weight: 400;\">In deze aflevering heb ik hopelijk laten zien dat statistiek, althans een klein maar veel gebruikt gedeelte daarvan, eigenlijk helemaal niet zo moeilijk is als sommige instanties ons willen doen geloven. Het was echter ook een redelijk technisch verhaal. De lezer dient zich te realiseren dat conclusies trekken uit statistische feiten erg gevaarlijk kan zijn. Er zijn best statistische methodes om waardes te geven aan eventuele foutmarges, maar het blijft toch een riskante zaak.<\/p>\n<p style=\"font-weight: 400;\">Ik realiseer me goed, dat ik aan een aantal zaken voorbij ben gegaan. Belangrijke zaken als bijvoorbeeld normaalverdelingen en dergelijke. Maar het was dan ook niet mijn bedoeling om de statistiek hier uitputtend te behandelen.<\/p>\n<p style=\"font-weight: 400;\">Wel hoop ik bereikt te hebben dat de lezer in het vervolg kritischer naar statistische publicaties zal kijken, en zich bijvoorbeeld realiseren dat het melden van een gemiddelde zonder het melden van de standaarddeviatie daarbij, redelijk nutteloos is.<\/p>\n<p style=\"font-weight: 400;\">\n","protected":false},"excerpt":{"rendered":"<p>Inleiding In deze aflevering zal ik op eenvoudige wijze proberen een aantal veel gebruikte statistische termen uit te leggen. Ik zal dat zowel technisch doen alsook de betekenis erbij geven. Er is echter een bekend gezegde, dat de geachte lezer altijd in gedachte moet houden wanneer hij of zij met statistiek bezig is. Er zijn [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":1709,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"templates\/template-full-width.php","meta":{"_lmt_disableupdate":"no","_lmt_disable":"","footnotes":""},"class_list":["post-158","page","type-page","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Een beetje statistiek - Wiskunst<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/\" \/>\n<meta property=\"og:locale\" content=\"nl_NL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Een beetje statistiek - Wiskunst\" \/>\n<meta property=\"og:description\" content=\"Inleiding In deze aflevering zal ik op eenvoudige wijze proberen een aantal veel gebruikte statistische termen uit te leggen. Ik zal dat zowel technisch doen alsook de betekenis erbij geven. Er is echter een bekend gezegde, dat de geachte lezer altijd in gedachte moet houden wanneer hij of zij met statistiek bezig is. Er zijn [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/\" \/>\n<meta property=\"og:site_name\" content=\"Wiskunst\" \/>\n<meta property=\"article:modified_time\" content=\"2023-02-03T09:15:53+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Geschatte leestijd\" \/>\n\t<meta name=\"twitter:data1\" content=\"10 minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/\",\"url\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/\",\"name\":\"Een beetje statistiek - Wiskunst\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/wiskunst.nl\\\/wp-content\\\/uploads\\\/2022\\\/01\\\/grafiek1.gif\",\"datePublished\":\"2022-01-20T13:38:12+00:00\",\"dateModified\":\"2023-02-03T09:15:53+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/#breadcrumb\"},\"inLanguage\":\"nl-NL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/#primaryimage\",\"url\":\"https:\\\/\\\/wiskunst.nl\\\/wp-content\\\/uploads\\\/2022\\\/01\\\/grafiek1.gif\",\"contentUrl\":\"https:\\\/\\\/wiskunst.nl\\\/wp-content\\\/uploads\\\/2022\\\/01\\\/grafiek1.gif\",\"width\":380,\"height\":181},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/een-beetje-statistiek\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/wiskunst.nl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wiskunde is leuk\",\"item\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Oude artikelen\",\"item\":\"https:\\\/\\\/wiskunst.nl\\\/index.php\\\/wiskunde-is-leuk\\\/oude-artikelen\\\/\"},{\"@type\":\"ListItem\",\"position\":4,\"name\":\"Een beetje statistiek\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/wiskunst.nl\\\/#website\",\"url\":\"https:\\\/\\\/wiskunst.nl\\\/\",\"name\":\"Wiskunst\",\"description\":\"2\u221e\u2227&gt;\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/wiskunst.nl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"nl-NL\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Een beetje statistiek - Wiskunst","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/","og_locale":"nl_NL","og_type":"article","og_title":"Een beetje statistiek - Wiskunst","og_description":"Inleiding In deze aflevering zal ik op eenvoudige wijze proberen een aantal veel gebruikte statistische termen uit te leggen. Ik zal dat zowel technisch doen alsook de betekenis erbij geven. Er is echter een bekend gezegde, dat de geachte lezer altijd in gedachte moet houden wanneer hij of zij met statistiek bezig is. Er zijn [&hellip;]","og_url":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/","og_site_name":"Wiskunst","article_modified_time":"2023-02-03T09:15:53+00:00","og_image":[{"url":"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif","type":"","width":"","height":""}],"twitter_card":"summary_large_image","twitter_misc":{"Geschatte leestijd":"10 minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/","url":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/","name":"Een beetje statistiek - Wiskunst","isPartOf":{"@id":"https:\/\/wiskunst.nl\/#website"},"primaryImageOfPage":{"@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/#primaryimage"},"image":{"@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/#primaryimage"},"thumbnailUrl":"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif","datePublished":"2022-01-20T13:38:12+00:00","dateModified":"2023-02-03T09:15:53+00:00","breadcrumb":{"@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/#breadcrumb"},"inLanguage":"nl-NL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/"]}]},{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/#primaryimage","url":"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif","contentUrl":"https:\/\/wiskunst.nl\/wp-content\/uploads\/2022\/01\/grafiek1.gif","width":380,"height":181},{"@type":"BreadcrumbList","@id":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/een-beetje-statistiek\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/wiskunst.nl\/"},{"@type":"ListItem","position":2,"name":"Wiskunde is leuk","item":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/"},{"@type":"ListItem","position":3,"name":"Oude artikelen","item":"https:\/\/wiskunst.nl\/index.php\/wiskunde-is-leuk\/oude-artikelen\/"},{"@type":"ListItem","position":4,"name":"Een beetje statistiek"}]},{"@type":"WebSite","@id":"https:\/\/wiskunst.nl\/#website","url":"https:\/\/wiskunst.nl\/","name":"Wiskunst","description":"2\u221e\u2227&gt;","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/wiskunst.nl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"nl-NL"}]}},"_links":{"self":[{"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/pages\/158","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/comments?post=158"}],"version-history":[{"count":6,"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/pages\/158\/revisions"}],"predecessor-version":[{"id":1819,"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/pages\/158\/revisions\/1819"}],"up":[{"embeddable":true,"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/pages\/1709"}],"wp:attachment":[{"href":"https:\/\/wiskunst.nl\/index.php\/wp-json\/wp\/v2\/media?parent=158"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}