Ugrupperede observationer

Ugrupperede observationer er et begreb fra deskriptiv statistik. Ugrupperede observationer er helt grundlæggende et ganske almindeligt observationssæt.

Diskrete observationer eller ikke-grupperet data er andre ord for ugrupperede observationer.

Ugrupperede observationer er modsætningen til grupperede observationer, hvor observationerne er inddelt i intervaller. Det er gjort for at forøge overskueligheden, oftest på grund af store observationssæt.

Ugrupperede observationer er derimod helt ’rå’ og ikke på nogen måde kategoriseret.

Man vælger næsten altid at bibeholde de ’rå’ diskrete observationer, når det er hele tal eller en form for talrække eller skala. På 7-trins karakterskalaen er der ikke nogen værdier, der er udeladt mellem de forskellige trin på skalaen. Det giver eksempelvis ikke mening at tale om tallet 8 på en karakterskala. Det er en klart defineret talrække uden nogen værdier mellem 7 og 10.

Når man taler om karaktergennemsnit er det derimod en helt anden sag. Her er der ’uendelig’ mange karaktergennemsnit, og denne type data vil danne grobund for at gruppere observationerne.

Ugrupperede data er ideelle til små observationssæt, men meget dårlig til store mængder af data.

Eksempel 1

Skulle man beskrive den årlige lønindkomst på en arbejdsplads med 5 personer kunne det ordnede observationssæt se således ud:

(273.312 kr., 273.312 kr., 299.573 kr., 312.915 kr., 361.641 kr.}

Det ville ikke skabe mere overskuelighed at gruppere et observationssæt af denne størrelse. Derfor bibeholder man de ’rå’ ugrupperede observationer.

Hvis man derimod havde 15 eller 20 medarbejdere på arbejdspladsen ville en gruppering umiddelbart give mening.

Som hovedregel skal man kun gruppere data, hvis de er så uoverskuelige, at man ikke kan sige noget fornuftigt om observationssættet uden at foretage en sådan gruppering.

I langt de fleste tilfælde med små observationssæt skal man bibeholde ugrupperede observationer. Men det afhænger ALTID af det statistiske materiale, som beskrives.

Eksempel 2

Skal man beskrive, hvordan hyppigheden af karakterer ser ud af en klasse med 29 elevers matematik-eksamen, ville man bibeholde ugrupperede observationer. De kunne se således ud:

-03:  0 elever

00:   2 elever

02:   3 elever

4:     4 elever

7:     10 elever

10:   6 elever

12:   4 elever

Her giver det mest mening at bruge ugrupperede observationer, da karakterskalaen er overskuelig. Denne overskuelighed ville ikke blive forøget ved en gruppering. Karakterskalaen er netop en skala, når det kun gælder et enkelt fag. Skalaen i sig selv skaber overblikket.

Eksempel 3

Hvis der derimod er tale om klassens (N = 29) gennemsnit af deres eksaminer i fagene matematik og fysik, kunne observationssættet (ordnet) se således ud:

{1,0; 2,0; 2,0; 2,0; 3,0; 3,5; 4,0; 4,5; 4;5; 5,5; 5,5; 6,0; 7,0; 7,0; 7,0;

7,0; 7,0; 8,0; 8,5; 8,5; 8,5; 9,5; 10,0; 10,0; 11,0; 11,0; 11,0; 12,0; 12,0}

Disse ugrupperede observationer kan godt forblive ugrupperede. Man får stadig et billede af det samlede statistiske materiale.

Men det er et temperamentsspørgsmål. Det er nemlig et observationssæt med en tilpas stor mængde observationer, som man godt kunne vælge at gruppere.

Man kunne sagtens argumentere for at overskueligheden er gået en smule tabt. Der er mange flere typer observationer nu, når der er tale om gennemsnit af to karakterer, end med karakteren i kun et fag (skala).

I eksempel 3 i artiklen Grupperede observationer, kan du se et forslag på en gruppering.