Statistische gegevens
Hieronder worden enkele basisbegrippen in verband met statistische gegevens besproken.
- Populatie
Een populatie is de totale verzameling aan elementen waarvan men bepaalde eigenschappen statistisch wilt onderzoeken.
- Steekproef
Een steekproef is een deel van de populatie die men gaat gebruiken om de eigenschappen te onderzoeken. Daarom is het van belang dat deze steekproef representatief is en dus aselect gekozen wordt.
- Veranderlijke X
De veranderlijke X is een afbeelding van de steekproef naar een verzameling van waarnemingsresultaten. Deze waarnemingsresultaten wil men onderzoeken. Bijvoorbeeld X(i): boer i heeft X(i) kippen.
Discrete verzameling
Het resultaat is exact vast te stellen. Er zijn geen tussenresultaten mogelijk. Bijvoorbeeld: aantal tickets die verkocht zijn, aantal eieren, aantal mensen,…
Continue verzameling
Het resultaat is niet exact vast te stellen. Er is steeds een kleine fout op de metingen. Bijvoorbeeld: seconden dat iemand loopt, gewicht dat iemand heeft, lengte van een persoon, …
CentrummatenÂ
Gemiddelde, mediaan en modus zijn centrummaten.
Gemiddelde
Wanneer men de som neemt van een rij getallen en dit deelt door hun aantal bekomt men het gemiddelde van deze waarnemingsgetallen.
Mediaan
Indien men de waarnemingsgetallen rangschikt van klein naar groot en dan het middelste getal bij een oneven aantal getallen of het gemiddelde van de twee middelste getallen bij een even aantal getallen neemt bekomt men de mediaan.
Modus
Het waarnemingsgetal dat het meeste voorkomt noemen we de modus.
Spreidingsmaten
Variatiebreedte, variantie en de standaardafwijking zijn spreidingsmaten. Ze geven aan hoe sterk de waarnemingsgetallen verspreid liggen rond een centrummaat:
Variatiebreedte
Verschil tussen het grootste en het kleinste waarnemingsgetal.
Variantie
\begin{eqnarray*}
Var(x) = \frac{1}{n} \cdot \sum ^n_{i=1}(x_i-\bar{x})
\end{eqnarray*}
Standaardafwijking
\begin{eqnarray*}
s = \sqrt{Var(x)}
\end{eqnarray*}
Grafische voorstellingen van statistische gegevens
Box plot
Op onderstaande afbeelding wordt een box plot weergegeven. Volgende gegevens worden hierop aangeduid:
– minimum (Min)
– maximum (Max)
– mediaan (Me)
– mediaan van de eerste helft waarnemingsgetallen ( \(Q_1\)
– mediaan van de tweede helft waarnemingsgetallen ( \(Q_3\)
Stengel – en bladdiagram
Met een stengelblad diagram kan men de gegevens op een overzichtelijke manier presenteren en gemakkelijk aflezen in welke groep (stengel) de meeste gegevens voorkomen (blad). Onderstaand voorbeeldje is de leeftijd van een groep personen. Hier vormen de tientallen van de leeftijd de stengel en de eenheden de bladeren.
Histogram
Op onderstaande afbeelding wordt een histogram weergegeven. Op de horizontale as noteert men de intervalgrenzen. De oppervlakte van elke rechthoek geeft de frequentie aan.