Statistische gegevens, centrum- en spreidingsmaten en grafische voorstellingen van statistische gegevens

Statistische gegevens

Hieronder worden enkele basisbegrippen in verband met statistische gegevens besproken.

  • Populatie

Een populatie is de totale verzameling aan elementen waarvan men bepaalde eigenschappen statistisch wilt onderzoeken.

  • Steekproef

Een steekproef is een deel van de populatie die men gaat gebruiken om de eigenschappen te onderzoeken. Daarom is het van belang dat deze steekproef representatief is en dus aselect gekozen wordt.

  • Veranderlijke X

De veranderlijke X is een afbeelding van de steekproef naar een verzameling van waarnemingsresultaten. Deze waarnemingsresultaten wil men onderzoeken. Bijvoorbeeld X(i): boer i heeft X(i) kippen.

Discrete verzameling

Het resultaat is exact vast te stellen. Er zijn geen tussenresultaten mogelijk. Bijvoorbeeld: aantal tickets die verkocht zijn, aantal eieren, aantal mensen,…

Continue verzameling

Het resultaat is niet exact vast te stellen. Er is steeds een kleine fout op de metingen. Bijvoorbeeld: seconden dat iemand loopt, gewicht dat iemand heeft, lengte van een persoon, …

Centrummaten 

Gemiddelde, mediaan en modus zijn centrummaten.

Gemiddelde

Wanneer men de som neemt van een rij getallen en dit deelt door hun aantal bekomt men het gemiddelde van deze waarnemingsgetallen.

Mediaan

Indien men de waarnemingsgetallen rangschikt van klein naar groot en dan het middelste getal bij een oneven aantal getallen of het gemiddelde van de twee middelste getallen bij een even aantal getallen neemt bekomt men de mediaan.

Modus

Het waarnemingsgetal dat het meeste voorkomt noemen we de modus.

Spreidingsmaten

Variatiebreedte, variantie en de standaardafwijking zijn spreidingsmaten. Ze geven aan hoe sterk de waarnemingsgetallen verspreid liggen rond een centrummaat:

Variatiebreedte

Verschil tussen het grootste en het kleinste waarnemingsgetal.

Variantie

\begin{eqnarray*}
Var(x) = \frac{1}{n} \cdot \sum ^n_{i=1}(x_i-\bar{x})
\end{eqnarray*}

Standaardafwijking

\begin{eqnarray*}
s = \sqrt{Var(x)}
\end{eqnarray*}

Grafische voorstellingen van statistische gegevens
Box plot

Op onderstaande afbeelding wordt een box plot weergegeven. Volgende gegevens worden hierop aangeduid:

– minimum (Min)
– maximum (Max)
– mediaan (Me)
– mediaan van de eerste helft waarnemingsgetallen ( \(Q_1\)
– mediaan van de tweede helft waarnemingsgetallen ( \(Q_3\)

Stengel – en bladdiagram

Met een stengelblad diagram kan men de gegevens op een overzichtelijke manier presenteren en gemakkelijk aflezen in welke groep (stengel) de meeste gegevens voorkomen (blad). Onderstaand voorbeeldje is de leeftijd van een groep personen. Hier vormen de tientallen van de leeftijd de stengel en de eenheden de bladeren.

stam-bladdiagram

Histogram

Op onderstaande afbeelding wordt een histogram weergegeven. Op de horizontale as noteert men de intervalgrenzen. De oppervlakte van elke rechthoek geeft de frequentie aan.

histogram