CENTRUMMATEN
Als je een reeks datapunten heb, wil je natuurlijk de data samenvatten. De bekendste manier om data samen te vatten is het gemiddelde te berekenen.
Het gemiddelde
Het gemiddelde wordt berekend door alle getallen bij elkaar op te tellen, en te delen door het aantal net opgetelde getallen. Het gemiddelde is een zogenaamde centrummaat.
![]() |
Formula gemiddelde |
Het gemiddelde is niet alleen bruikbaar om datareeksen efficiënt te rapporteren. Het gemiddelde wordt ook vaak gebruikt om de verschillende onderdelen van een operationalisatie te combineren.
Outliers
Een outlier of uitschieter is een datapunt dat zo extreem is, dat het waarschijnlijk een artefact is van de dataverzameling. Bij een datareeks van 4, 4, 5, 5, 5, 6, 6, 7, 8, 28 is de data van 28 een outlier. Outliers liggen vaak ver af van de rest van de datapunten. Het is belangrijk om te weten dat niet alle datapunten die ver afliggen van de rest v.d. datapunten noodzakelijkerwijs niet reëel: sommige deelnemers scoren nu eenmaal hoog of laag. Extreme scores representeren simpelweg individuen die extreem scoren.
In een verpleeghuis waar 99% van bewoners leeftijd tussen 75-95 liggen is een bewoner met de leeftijd van 120 een outlier, maar wel een reële meting.
Een outlier of uitschieter is een datapunt dat zo extreem is, dat het waarschijnlijk een artefact is van de dataverzameling. Bij een datareeks van 4, 4, 5, 5, 5, 6, 6, 7, 8, 28 is de data van 28 een outlier. Outliers liggen vaak ver af van de rest van de datapunten. Het is belangrijk om te weten dat niet alle datapunten die ver afliggen van de rest v.d. datapunten noodzakelijkerwijs niet reëel: sommige deelnemers scoren nu eenmaal hoog of laag. Extreme scores representeren simpelweg individuen die extreem scoren.
In een verpleeghuis waar 99% van bewoners leeftijd tussen 75-95 liggen is een bewoner met de leeftijd van 120 een outlier, maar wel een reële meting.
Als er wel een outlier is, trekt die het gemiddelde heel erg naar zich toe. In zulke gevallen is het ook verstandig om de modus en de mediaan uit te rekenen.
De modus
De modus is gedefinieerd als de meest voorkomende waarde in de datareeks. In een datareeks van 4, 4, 5, 5, 5, 6, 6, 7, 8, 28 is 5 de modus, 5 komt namelijk 3x voor de datareeks.
De modus is gedefinieerd als de meest voorkomende waarde in de datareeks. In een datareeks van 4, 4, 5, 5, 5, 6, 6, 7, 8, 28 is 5 de modus, 5 komt namelijk 3x voor de datareeks.
De mediaan
De mediaan is simpelweg het middels datapunt in de datareeks. Om mediaan te vinden moeten we eerst alle data punten van hoog naar laag op een rijtje zetten en daarna middelste vinden. In onze datareeks (4, 4, 5, 5, 5, 6, 6, 7, 8, 28) zijn 5 en 6 middelpunt dus we delen 5 en 6 door 2 om tot mediaan te komen.
(5+6)/2=5,5
Mediaan is 5,5.
De mediaan is simpelweg het middels datapunt in de datareeks. Om mediaan te vinden moeten we eerst alle data punten van hoog naar laag op een rijtje zetten en daarna middelste vinden. In onze datareeks (4, 4, 5, 5, 5, 6, 6, 7, 8, 28) zijn 5 en 6 middelpunt dus we delen 5 en 6 door 2 om tot mediaan te komen.
(5+6)/2=5,5
Mediaan is 5,5.
SPREIDINGSMATEN
Spreidingsmaten geven informatie over hoe groot de spreiding rondom de centrummaten is. De eenvoudigste spreidingsmaat is de range (bereik), die is simpelweg het verschil tussen het maximum en het minimum. In onze geval is het 28-4=24. Jammer genoeg volstaat deze eenvoudige maat niet, omdat hij er gevoelig is voor outliers.
Interkwartielafstand (IQR)
De interkwartielafstand (interquartile range, oftewel IQR) is eigenlijk voor spreidingsmaten wat de mediaan is voor centrummaten.
Toen we de mediaan berekenden, pakten we het middelste datapunt. Daarmee kunnen we een datareeks in twee even grote delen splitsen. Stel dat we nu van elk deel weer de mediaan nemen, zodat we de datareeks in vier even grote delen kunnen splitsen, met in totaal drie ‘breekpunten’. Die drie ‘breekpunten’ heten, van onder naar boven, het eerste kwartiel (ook wel Q1 genoemd), het tweede kwartiel (Q2, en dit is gelijk aan de mediaan), en het derde kwartiel (Q3). De afstand tussen het eerste en het derde kwartiel heet de interkwartielafstand (IQR), en is een maat voor spreiding die minder gevoelig is voor outliers dan de range.
Variatie, Variantie en Standaarddeviatie