Matematik

Summary Statistics - Percentiles

09. februar kl. 15:31 af anonym000 - Niveau: Universitet/Videregående

Jeg har et datasæt bestående af datapunkterne:

8.27

3.83

2.84

2.21

1.55

1.45

1.33

1.27

1.24

0.94

0.92

Jeg skal finde den "65th percentile".

For at finde indeks for denne værdi regner jeg  i = n*p = 11*65 = 7,15.

Skal jeg funde op eller ned? (og hvorfor ).

Hvordan er den p'te fraktil desuden defineret?


Brugbart svar (1)

Svar #1
09. februar kl. 18:08 af oppenede

https://www.studieportalen.dk/forums/thread.aspx?id=1867136

Den 65'te percentil er 65%-fraktilen, som er et tal (eller interval) sådan at 65% af målingerne ligger under tallet (eller et hvilket som helst tal i intervallet), og 35% af målingerne ligger over.


Svar #2
09. februar kl. 18:12 af anonym000

Det fik jeg mig læst til.

Mit hovedspørgmål hvorfor man skal tage ceiling af n·p, hvis det ikke er et heltal? Hvorfor er det ikke man runder til nærmeste heltal? 

Jeg opretter en tråd med en opgave hvor dette er eksemplificeret.

- - -

...............


Brugbart svar (1)

Svar #3
09. februar kl. 18:12 af AMelev

Den p'te fraktil (p% fraktilen er den x-værdi hvor den kumulerede frekvens F(x) = p%. Dvs. at p% af målingerne ligger under eller på (eller under) denne x-værdi og resten over (eller på eller over).
Allerede her er definitionen tvetydig, da der er uenighed om, hvorvidt der skal gælde ≤ eller kun <. 

For grupperet observationssæt er 65 procentilen 1.koordinaten til punktet (x , 65%) på sumkurven.

For ikke grupperet materiale, kan man ikke regne med at ramme lige præcis 65%, og der er i det tilfælde ikke hverken en entydig definition af fraktilen eller metode til at bestemme den.

Nogle angiver, at det er 1.koordinaten til punktet (x , 65%) på sumkurven.

Andre tager, hvis fraktilen ligger mellem to værdier, gennemsnittet af disse. Det gælder i hvert fald kvartilsættene. Jeg har ikke set generelle fraktiler i anvendelse på ikke-grupperet materiale.

En metode, man kan anvende, til at bestemme fraktilen, er at 
1: line målingerne op i rækkefølge 0.92,0.94,1.24,1.27,1.45,1.55,2.21,2.84,3.83,8.27
2. beregne hvor mange målinger de p% laveste skal omhandle, dit i = 7.15
3. tælle 7.15 målinger op nedefra - her lander vi mellem 2.21 og 2.84.
Om du så vælger tallet midt mellem de to eller det største af målingerne, betyder ikke så meget, da betydningen af tallet alligevel er så diffus.


Svar #4
09. februar kl. 18:14 af anonym000

AMelev

Jeg fiskeret nemlig efter en forklaring på denne tvetydighed! :D

Jo, dummere man stille et spørgsmål jeg bedre en forklaring får man!

- - -

...............


Brugbart svar (1)

Svar #5
09. februar kl. 18:30 af AMelev

Fraktil kommer af fraktion ~ brøkdel/andel (angivet i procent)
Percentile kommert af Percent ~ procentdelen. På dansk skulle det vel hedde procentil, men ordet ligger måske lidt for tæt op ad projektil. Under alle omstændigheder er fraktiler og percentiles det samme.

Kvartil er 25% fraktilerne. Kvart ~ 1/4 = 25%.
Nedre kvartil Q1 ~ 50%, MedianQ2 ~ 25%, Øvre kvartil Q3 ~ 75%.

Danmarks Statistik angiver Deciler, som er 10% fraktilerne. Deci ~1/10 = 10%

Der er måske andre med specialnavne, men dem kender jeg ikke.


Skriv et svar til: Summary Statistics - Percentiles

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.