Matematik

Chi i anden uafhængighedstest

24. juni 2013 af eravn (Slettet) - Niveau: A-niveau

Hej!
Jeg skal til AT-eksamen i matematik og samfundsfag og min matematiske teori-del er Chi i anden uafhængihedstest. Jeg plejer sådan set bare at indsætte de observerede værdier i Nspire og lave en test, men jeg tænker, at jeg lige vil løbe igennem de forskellige ting man tager højde for og således forklare hvad Nspire i virkeligheden gør.

Derfor, håber jeg lige, at der er nogen med styr på dette, der har lyst til at løbe dette i gennem og eventuelt komme med forslag til hvordan det kan forenkles/ siges mere overskueligt/ eller blot kommentere på gyldigheden af det jeg siger.

Det er jo i og for sig en "snakke-eksamen" det vil sige, at jeg ikke kan stå og skrive formler på tavlen imens jeg taler. Det er muligt for mig at give et stykke papir med eksempelvis formlen for teststørrelsen på, men jeg vil nødig skulle huske samtlige formler og gå alt for teoretisk til værks, derfor modtages simple forklaringer med kyshånd.

Jeg har skrevet følgende i mit udkast:

- Man skelner mellem to forskellige former for chi^2-test. I mit tilfælde har jeg brugt uafhængighedstesten, da jeg har skulle undersøge sammenhænge mellem faktorer ud fra en stikprøve.
- Først opstilles en nulhypotese. Det er altid, at der ikke er en sammenhæng eller en forskel, for hvis nulhypotesen ikke godkendes, er det altså muligt at finde denne sammenhæng eller forskel.
- Herefter udregnes de forventede værdier på baggrund af de observerede værdier (antallet adspurgte). (rækketotal/total * søjletotal)
- Når de forventede værdier er beregnede, beregner man teststørrelsen, som er den værdi man skal bruge til at afgøre om de variable man undersøger er afhængige eller uafhængige af hinanden.
- χ2 =∑(obs.antal−forv.antal)2  / forv.antal .
- Teststørrelsen sammenholder således den observerede værdi og den forventede værdi og den beskriver således observationssættet.
- Når teststørrelsen er beregnet, kan denne omregnes til sandsynlighed. Altså sandsynligheden som vil være afgørende for om man vil konkludere de testede variable for afhængige eller uafhængige.
- Teststørrelsen skal omregnes til en sandsynlighed for, om det er rimeligt at acceptere hypotesen om, at de to variable er uafhængige. Til dette anvender man, at teststørrelsen er tilnærmelsesvist ki i anden fordelt med x-antal frihedsgrader. (antallet af frihedsgrader kan beskrives som antal celler, der er i den tabel man skal udføre uafhængighedstest på). Denne sandsynlighed kaldes også p-værdien, p for probability.
- Ud fra p-værdien vurderer vi om hypotesen skal forkastes eller accepteres Der findes intet logisk matematisk grundlag, der entydigt fortæller os, hvornår vi skal forkaste eller acceptere en hypotese. Det er et af de steder i statistikken, hvor det bliver lidt løst/subjektivt.
- Hvis p-værdien er lille, er observationen ekstrem i forhold til hypotesen, dvs. hypotesen kan forkastes. Hvis p-værdien derimod er stor, er observationen ikke ekstrem i forhold til hypotesen, dvs. hypotesen accepteres.
- Grænsen mellem stor og lille fastlægges med et signifikansniveau. Vi siger, at vi tester hypotesen på et 5% signifikansniveau og mener, at hvis p-værdien er under 5%, vil vi forkastes hypotesen, dvs. der er en signifikant effekt (en betydelig effekt). Ved en forkastning af hypoteserne (det er det i mit tilfælde) vil vi altså kunne sige, at der med 95% sikkerhed er tale om signifikante forskelle.

ps. er der nogen, der kan forklarer "chi i anden fordelt" sådan helt enkelt? Jeg er klar over, at det hænger sammen med frihedsgraderne og at denne teststørrelse rangordner observationssættet efter hvor godt det passer til hypotesen, men hvad menes helt præcist med, at det er chi i anden fordelt?

Håber I sidder nogen, der har lyst til at hjælpe!


Mvh Amalie
 


Brugbart svar (0)

Svar #1
24. juni 2013 af Singlefyren (Slettet)

(antallet af frihedsgrader kan beskrives som antal frie celler, der er i den tabel man skal udføre uafhængighedstest på). Oftest (rækker-1)*(søjler-1)

- Hvis p-værdien er lille, er observationen ekstrem, dvs. hypotesen om ensartethed kan med stor sandsynlighed forkastes. Hvis p-værdien derimod er stor, er observationen ikke ekstrem, dvs. hypotesen om ensartethed kan ikke forkastes.


Brugbart svar (0)

Svar #2
24. juni 2013 af Singlefyren (Slettet)

Pas på det ikke bliver for stift og lærebogsagtigt. Lav evt. nogle eksempler eller fokuser på nogle detaljer. F.eks. at talværdierne i cellerne helst skal være > 5 ...eller fordele og ulemper.

Chi^2 udmærker sig ift. andre test ved at den medtager mange kategorier (rækker og søjler) som en samlet helhed. Binominaltest kan f.eks. kun medtage 2 udfald.

Chi^2 er en sandsynlighedsfordeling, i familie med normalfordelingen.

Man bruger den kummulerede sandsynlighed i chi^2 test. CDF - cummulative distribution function.

Fokusér på de områder du er skrap til.


Brugbart svar (0)

Svar #3
24. juni 2013 af Singlefyren (Slettet)

Forventede værdier skal helst være > 5. Dette skyldes at Chi^2 kun er en tilnærmelse.


Brugbart svar (0)

Svar #4
24. juni 2013 af peter lind

Du har n normalfordelte uafhængige variable  X1, X2, --- Xn med middelværdi 0 og varians 1 Heraf danner man en ny variabel Y = X12+X22+.... Xn2. Det ses let at middelværdien af Y er n. Fordelingen af Y kaldes χ2 fordelingen med n frihedsgrader..

I de fleste tilfælde tester man om en parameter er lig en anden for eks om antal stemmer på socialdemokraterne er den samme som ved sidste valg. Er den ikke det vil teststørrelsen blive for stor, så det er det man normalt tester for. Den kan imidlertid også blive for lille. I det tilfælde må der være noget galt med datasættet for eks. fusk


Brugbart svar (0)

Svar #5
11. marts 2018 af Theunknown141

Hvad fik du?


Skriv et svar til: Chi i anden uafhængighedstest

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.