Deskriptiv statistik

Statistik er et af matematikkens hovedemner. Statistik er kort fortalt en metode til at udtrække information fra datamateriale.

Statistik inddeles grundlæggende i deskriptiv statistik og i inferential statistik.

Dette delkapitel i formelsamlingen handler om den mest simple af de to, nemlig deskriptiv statistik (på engelsk: descriptive statistics).

Deskriptiv statistik benævnes også den beskrivende statistik.

Læs mere om inferential (analytisk) statistik (findes ikke endnu) i det andet delkapitel til statistik i Studieportalens Matematik Formelsamling.

Mange vil nok spørge, hvad deskriptiv statistik er, og hvordan man mest meningsfyldt skal beskrive de informationer, som et datasæt indeholder.

Deskriptiv statistik er først og fremmest en måde på at organisere, præsentere og beskrive et datasæt. Den deskriptive statistiks formål er at fremstille et større eller mindre datamateriale på en overskuelig og informativ måde.

Det kan både være matematisk og visuel/grafisk overskuelighed i enten en tabel eller en grafisk fremstilling.

Det datasæt, som man vil beskrive statistisk, kaldes et observationssæt. Antallet af observationer kaldes observationssættets størrelse.

Strukturen i kapitlet om deskriptiv statistik

Først foretages en grundig gennemgang af de statistiske deskriptorer. Disse deskriptorer inkluderer de fleste begreber, man benytter i deskriptiv statistik. Eksempelvis hyppighed, frekvens, typetal, variationsbredde, varians, standardafvigelse (spredning), fraktil og kvartil.

Derudover er en meget vigtig distinktion om man behandler ugrupperede observationer eller grupperede observationer. Nogle typer data benyttes i deres ’rå form’, mens andre typer data inddeles i intervaller. I sidstnævnte tilfælde foretager man en såkaldt gruppering af observationerne.

Sidst i kapitlet om deskriptiv statistik behandles et par grafiske metoder, nemlig et histogram og et boksplot. Et boksplot kan benyttes med begge typer data, mens et histogram benyttes ved grupperede observationer. 

I deskriptiv statistik benytter man såkaldte statistiske deskriptorer, som på hver deres måde beskriver forskellige karakteristika ved observationssættet. Disse kan enten aflæses eller findes ved simple matematiske udregninger.

Min og max

Minimum (Min) og maksimum (Max) er de mest simple statistiske deskriptorer. De kræver ikke yderligere behandling, men defineres blot her som henholdsvis den mindste og største observation i et observationssæt.

Et observationssæt indeholde 5 observationer: 1, 3, 5, 7, 9

Her kan man nemt aflæse, at:

Min = 1

Max = 9

Se endvidere eksempel 1 og 2 nedenfor.

Eksempel 1

Et andet observationssæt med 8 observationer indeholder observationerne: 2, 2, 4, 5, 6, 8, 9, 13

Her kan Min og Max igen nemt aflæses til henholdsvis:

Min = 2

Max = 13

Eksempel 2

Et tredje observationssæt indeholder 15 observationer: 

75, 83, 40, 28, 115, 113, 94, 72, 63, 69, 81, 36, 106, 27, 52

For at finde Min og Max, og i det hele taget få et bedre overblik er det en fordel at 'ordne' observationerne, så de er i rækkefølge: 

27, 28, 36, 40, 52, 63, 69, 72, 75, 81, 83, 94, 106, 113, 115

Som det fremgår, er:

Min = 27

Max = 115

Der er mange flere statistiske deskriptorer end de nævnte i de to eksempler ovenfor, som vil blive forklaret i hver deres artikel.

De fleste deskriptorer giver mest mening at tale om, når man behandler et større observationssæt. Her i introduktionen til emnet deskriptiv statistik tjener simplificeringen dog et større formål.