Fraktil

Fraktil er et begreb der knytter sig til den deskriptive statistik. En fraktil er en vis andel af et observationssæt. Eksempelvis er 0,40-fraktilen en angivelse af, at 40% af observationerne er under en given grænse. Dermed er det samtidig et mål for at 60% er over den pågældende grænse.

Hvis man eksempelvis har et observationssæt med forsøgspersoners alder og 0,40-fraktilen er 38 år, ved man at 40% af forsøgspersonerne er 38 år eller derunder. Samtidig ved man at 60% er 38 år eller derover.

Fraktiler angives som et decimaltal mellem 0 - 1.

De mest almindelige fraktiler er de såkaldte kvartiler. Kvartiler deler et observationssæt op i kvarte. Nedre kvartil indeholder 25%, median indeholder 50% og øvre kvartil indeholder 75% af observationerne. Tilsammen kaldes de tre angivelser kvartilsættet, og de benyttes især i forbindelse med et boksplot.

Fraktiler er en tilsvarende angivelse, som kan benyttes for alle tal mellem 0 - 1 eller med andre ord mellem 0 - 100%. Man benytter ofte enten 0,10-fraktilen som et mål for de laveste 10%. Eller 0,90-fraktilen som et tilsvarende mål for laveste 90% og dermed også de øverste 10% i et observationssæt.

Den nemmeste måde at aflæse fraktiler er ved at tegne en sumkurve for grupperede observationer. For ugrupperede observationer kan fraktiler aflæses eller udregnes med simple metoder.

Da fraktiler er en procentangivelse, er frekvens og især kumuleret frekvens af afgørende betydning for at kunne angive fraktiler.

Lad os først se på et eksempel med ugrupperede observationer, hvor fraktiler nemt kan aflæses.

I eksempel 2 er det derimod ugrupperede observationer, og her skal en sumkurve tegnes for nemmest at bestemme fraktilerne.

Eksempel 1

Når man skal finde fraktiler for ugrupperede observationer, skal man blot aflæse de kumulerede frekvenser. Her er et uddrag af en tabel, der benyttes i artiklen Trappediagram, der viser antal mål pr. kamp i den tyske Bundesliga i fodbold.

Samlede antal mål pr. kamp, samlet, x

Hyppighed h(x)

Frekvens f(x)

Kumuleret frekvens

0

21

6,86 %

6,86 %

1

30

9,80 %

16,66 %

2

56

18,30 %

34,96 %

Heraf fremgår det eksempelvis at:

0,10-fraktilen = 1 mål (da den kumulerede frekvens på 10% rammes ved netop 1 mål)

0,20-fraktilen = 2 mål (da den kumulerede frekvens på 20% rammes ved observationen 2 mål)

0,30-fraktilen = 2 mål (da den kumulerede frekvens på 30% rammes indenfor netop 2 mål)

Man kan konkludere, at i 30% af kampene scores max 2 mål. Hvis man skulle bestemme 0,20-fraktilen ville resultatet være det samme. Men når man ser på det i sammenhæng, er det mest korrekt at konkludere det førstnævnte.

Eksempel 2

Dette observationssæt viser den årlige lønindkomst for 38 ansatte i en virksomhed. Fordelingen ser således ud, når lønindkomsten er inddelt i intervaller af 50.000 kr. Intervalhyppighed er optalt og derefter er intervalfrekvens og kumuleret intervalfrekvens beregnet.

Lønindkomsten i kr. betegnes som observationsintervallet for dette observationssæt. Observationsintervallet er valgt til 50.000 på baggrund af, at det virker passende i forhold til lønspredningen (250.000-600.000). Derudover spiller overskueligheden i forhold til at præsentere lønindkomsten også ind på de valgte observationsintervaller. Havde man istedet valgt 25.000, ville der være dobbelt så mange rækker i tabellen og det kunne formindske overskueligheden.

Lønindkomst i kr.

Intervalhyppighed

Intervalfrekvens

Kumuleret intervalfrekvens

250.000 - 300.000

5

13,16 %

13,16 %

300.000 - 350.000

8

21,05 %

34,21 %

350.000 - 400.000

12

31,58 %

65,79 %

400.000 - 450.000

7

18,42 %

84,21 %

450.000 - 500.000

4

10,53 %

94,74 %

500.000 - 550.000

0

0 %

94,74 %

550.000 - 600.000

2

5,26 %

100,00 %

Sum:

N = 38

100 %

For derefter at kunne finde fraktiler skal man tegne en sumkurve. Se artiklerne Kvartil og Median, hvor samme datasæt benyttes og hvor en sumkurve forklares nærmere. Når man skal finde fraktiler, er det afgørende at formatere y-aksen, så man nemt kan aflæse de fraktiler man skal bruge. Her er fraktilerne inddelt i 0,10-fraktiler.

Sumkurven for dette observationssæt ser således ud:

Sumkurve (kvartil, median og fraktiler)

Lad os sige, at man er interesseret i at bestemme 0,40-fraktilen og 0,90-fraktilen. Dermed undersøger man henholdsvis den øvre grænse for hvad 40% af de ansatte tjener og den øvre grænse for hvad 90% af de ansatte tjener. Efter aflæsning kan det bestemmes at den årlige lønindkomst på baggrund af denne fraktil-opdeling er:

0,40-fraktilen = 360.000 kr.

0,90-fraktilen = 480.000 kr.

Dermed kan man konkludere, at 40% af de ansatte tjener 360.000 kr. eller mindre. Samtidig kan det udledes, at 90% af de ansatte tjener max 480.000 kr. På baggrund af 0,90-fraktilen kan det endvidere konkluderes, at 10% tjener mere end 480.000 kr.