Matematik

Chi^2-test

29. august 2011 af SvendMortensen (Slettet) - Niveau: A-niveau

Hej alle.

Betragt eksempel 14 (s. 19-23) på http://www.matematikfysik.dk/mat/noter_tillaeg/normalfordeling.pdf.

Jeg vil gerne udføre en χ2-test på dataene for at afgøre, hvor godt de er normalfordelte.

Mine spørgsmål er følgende:

1) Hvad er nulhypotesen?
2) Hvor mange frihedsgrader er der?


Brugbart svar (2)

Svar #1
29. august 2011 af peter lind

Nulhypotesen er at det er en normalfordeling.

Lige noget om testmetoden.

Man inddeler observationerne i intervaller og bruger som tilnærmelse polynomialfordelingen. Det kræver at der er mindst 5 observationer i hvert inetrval, så du bliver nød til enten at slå nogle af endepunktsintervallerne sammen eller udelade dem. I hver af  intervallerne beregner du så  hvor mange der forventes ved brug af normalfordelingen og den estimerede middelværdi m og spredning s. For eks. er der i intervallet mellem 195,5 og 196,5 observeret 61 = nobs. Du finder så det forventede antal nforv som Φ(196,5) -Φ(195,5). Teststørrelsen bliver

∑(nobs-nforv)2/s2

som er χ2 fordelt med antal frihedsgrader =antallet af intervaller -2

De 2 skal fratrækkes fordi du har foretaget 2 estimationer


Svar #2
29. august 2011 af SvendMortensen (Slettet)

Mange tak!

Jeg prøver at gennemregne det og så skriver jeg (nok i morgen eller onsdag).


Brugbart svar (1)

Svar #3
29. august 2011 af locatio (Slettet)

 Er det B-niveau?


Brugbart svar (1)

Svar #4
29. august 2011 af Madsst (Slettet)

Du kan finde information om det mest almindelige normalfordelingstest her:

http://en.wikipedia.org/wiki/Jarque%E2%80%93Bera_test 


Svar #5
31. august 2011 af SvendMortensen (Slettet)

Hej peter lind.

Når du skriver "Φ",  er det så den kumulative fordelingsfunktion (den øverste funktion på http://en.wikipedia.org/wiki/Normal_distribution#Cumulative_distribution_function)?


Brugbart svar (1)

Svar #6
01. september 2011 af peter lind

jeg tænkte mere på formlen lige over alternative formulations.Jeg burde have skrevet P{x ≤ 196,5} - P{x < 195,5} hvor P er så den kommulerede sandsynlighedsfunktion med den pågældende middelværdi og varians.Dn kan slås op i regneark og sandsynligvis også på din lommeregner


Svar #7
02. september 2011 af SvendMortensen (Slettet)

#6:
Jeg har læst om χ2-test de sidste par dage; i den vedhæftede PDF-fil kan ses, hvad jeg er kommet frem til. (Sig endelig til, hvis jeg har lavet nogle fejl.)

Efter at have bestemt teststatistikken, ved jeg ikke, hvordan jeg skal afgøre, om nulhypotesn skal forkastes eller ej. Det er noget med, at jeg skal slå op i en tabel og sammenligne to tal, så vidt jeg har forstået det. (Jeg har ikke kunnet finde en tabel med 43 frihedsgrader, kun med 35 og 50. Det er så noget med, at jeg kan interpolere imellem dem, men jeg er ikke sikker på, hvordan jeg skal gøre det.)

Hvis du gider at fortælle (sådan relativt detaljeret), hvordan jeg klarer resten af testen, vil jeg sætte stor pris på det.

På forhånd tak!


PS. Jeg har prøvet at vedhæfte en fil, men jeg aner ikke, om det er lykkedes, og hvordan jeg finder ud af, om det er det. Jeg har valgt filen via "> Vedhæft fil" lige under boksen, man skriver i.


Brugbart svar (1)

Svar #8
02. september 2011 af peter lind

Det med filen er ikke lykkedes, så jeg kan kun svare udefra det ovenstående.

Du kan godt interpolere. En anden mulighed er at slå det op elektronisl for eks. i et regneark eller på en lommeregner.

Til testen skal du først bestemme et signifikantsniveau, hvilket typisk er noget i retning af 5% eller 10%. Hvis du vælger 5 % skal du slå 95% kvartilen op. Hvis den beregnede teststørrelse er under 95% accepteres hypotesen ellers forkastes den.


Svar #9
03. september 2011 af SvendMortensen (Slettet)

#8:
Må jeg sende dig en mail med mine beregninger, peter lind? (Jeg oplyser gerne min egen mailadresse, hvis det er nødvendigt.)


Svar #10
03. september 2011 af SvendMortensen (Slettet)

Hej igen, peter lind.

Jeg har uploadet filen på http://gupl.dk/64880/.

Vedhæftet fil:stokastik.pdf

Svar #11
03. september 2011 af SvendMortensen (Slettet)

Nå, nu ser den ud til også at være uploadet her på siden. Jamen så er jeg da på den sikre side. :-)


Brugbart svar (1)

Svar #12
04. september 2011 af peter lind

Du har næppe fundet middelværdi og spredning ved løsning af 2 ligninger med 2 ubekendte. De burde være beregnet direkte med nogle kendte formler.

Intervallerne behøver ikke være lige store; men det gør selvfølgelig ikke noget at de er det.

Jeg kender ikke matematica, så den del kan jeg ikke kommentere.

Så skal du bare slå 95% kvartilen (hvis du vælger signifikantsniveauet 5%) for χ2(43) op og se om det er større end 117,9. Er den det accepters normalfordelingen.  Du kan også slå P(X<117,9) op for χ2 fordelingen op. Er den mindre end de 95% accepteres normalfordelingen.


Svar #13
04. september 2011 af SvendMortensen (Slettet)

Tak for svarene.

Jeg ved dog ikke, hvordan jeg bestemmer χ2(43) med 5 %-signifikansniveau. Hvis jeg nu gerne vil bruge en TI-83 Plus-lommeregner, kan jeg så det, og hvad skal jeg i givet fald gøre?

Hvis jeg skal bruge en tabel, ved jeg ikke, hvordan jeg skal slå op. Såfremt du gider at give mig værdien, vil jeg blive meget glad.

Undskyld min dumhed.

PS. En mere pæcis værdi af teststatistikken er χ2 = 117,88951.


Brugbart svar (1)

Svar #14
04. september 2011 af peter lind

Det kan slås op i regnearket i OpenOffice. Funktionen hedder chiinv. Resultatet er 59,3 Det betyder at at det afvises ekstremt klart at det er en normalfordeling. Middellværdien for en χ2 fordeling er antal frihedsgrader så alene ud fra det se der usandsynligt ud.  Når jeg sasmmenligner med din graf tror jeg ikke på det. Du må have lavet en fejl et eller andet sted.


Svar #15
04. september 2011 af SvendMortensen (Slettet)

Tak.

Hmm. Ja, jeg har da vidst lavet en fejl. Jeg kan bare ikke lige finde den.

Jeg har prøvet at indtaste det i et regneark, hvilket kan ses på http://gupl.dk/64962/.

Har jeg måske brugt den forkerte formel til at beregne χ2?

PS. Tak for hintet om chiinv-funktionen.


Brugbart svar (1)

Svar #16
04. september 2011 af peter lind

Du skal beregne summen af (nobs-nberegnet)2/s2 ikke (nobs-nberegnet)2/nberegnet altså dividere med samme tal i alle led.


Svar #17
04. september 2011 af SvendMortensen (Slettet)

Dividerer jeg med variansen σ2, får jeg 713,9. Dividerer jeg derimod med μ2, får jeg 1,015. Det sidste giver altså noget, som er klart mindre end 59,30, men det er jo åbenbart ikke, hvad jeg skal gøre.

Jeg kan simpelthen ikke finde fejlen. :-(


Brugbart svar (1)

Svar #18
04. september 2011 af peter lind

Jeg har opdaget en anden fejl. Det forventede antal er for eks. P(X<162,5) -P(161,5) og det er ikke det du gør. Du skal have fat i den akkumuleret sandsynlighed og ikke frekvensfunktionen.


Svar #19
04. september 2011 af SvendMortensen (Slettet)

Hmm. Jeg troede, at det var det, jeg havde gjort.

Passer det ikke, at

eller hvad? Jeg troede så, at det var lig med

Jeg må ærligt indrømme, at jeg ikke ved hvad jeg skal gøre. Kan du evt. komme med en reference til en konkret formel eller lignende?

Igen undskylder jeg min uvidenhed.


Brugbart svar (0)

Svar #20
04. september 2011 af peter lind

Det er det du skal gøre: men det er ikke det du har gjort i regnearket. Der har du benyttet frekvensfunktionen


Forrige 1 2 Næste

Der er 32 svar til dette spørgsmål. Der vises 20 svar per side. Spørgsmålet kan besvares på den sidste side. Klik her for at gå til den sidste side.