Matematik

Stikprøve og hypotesetest?

05. oktober 2011 af Sheldorin (Slettet)

Hej med jer,

Hvis jeg indsamler data via et spørgeskema hvor jeg spørger:

"Kan du lide franskbrød?"

Hvor der er svarmulighederne "Ja" og "Nej. Så kan jeg hurtigt beregne andelen af ja og nej. Men ligge disse to andele nu tæt på hinanden, kunne det være interessant at se om den ene reelt med baggrund i statistik kan siges at være større end den anden. Til det havde jeg tænkt at lave en hypotesetest der tester for om der er en forskel i andele (altså hvor man siger med 95% sikkerhed er andelen af ja større end nej). Men giver det mening at lave en sådan test når begge andele jeg tester stammer fra samme stikprøve, eller bruger man kun testen når andelene stammer fra to forskellige stikprøver?

Altså giver det mening i dette tilfælde at bruge hypotesetesten?

På forhånd tak

Sheldorin


Svar #1
05. oktober 2011 af Sheldorin (Slettet)

Jeg undskyder dette emne er kommet et par gange, men det skyldes jeg sad på mobilt netværk og der sagde den at der skete en fejl og så har den postet det 3 gange, men der havde jeg allerede skrevet et nyt fra et stabilt netværk, så nu er mit enme faktisk oppe 4 gange, sorry sorry.... :S


Brugbart svar (0)

Svar #2
05. oktober 2011 af peter lind

Det er mulig. Du skal som 0 hypotese antage at der er lige mange der siger ja eller nej. Det giver en binomialfordeling med p = ½ og n antallrt af stikprøver. Hvis du vil teste på 95% signifikantsniveau skal du undersøge om antallet af observerede nej eller ja  n1 (den mindste af dem) gælder P{ X<n1} < 0,95. Er den det er der signifikant forskel.


Svar #3
05. oktober 2011 af Sheldorin (Slettet)

Super, så ser det ud til at de overflødige er blevet slettet af hjemmesidens personer, tak for det :)) Sikke et rod :S


Svar #4
05. oktober 2011 af Sheldorin (Slettet)

Okay, så du mener altså at det giver god nok mening?
Du skriver jeg skal tjekke om P(X<=n1) <0,95men i min bog står der bare at jeg skal tjekke at n_x*p_x*(1-p_x)>9 og n_y*p_y*(1-p_y)>9, men det er måske det samme?


Brugbart svar (0)

Svar #5
05. oktober 2011 af peter lind

Nej. men jeg er godt nok heller ikke klar over hvad størrelserne står for. Der er muligvis en tilnærmelse til normalfordelingen i spil.


Svar #6
05. oktober 2011 af Sheldorin (Slettet)

Jeg sender dig lige et billede af sætningen i min bog, så kan du selv læse den, men det bliver desværre først i morgen, for har ikke lige mulighed for det nu :)

Svar #7
06. oktober 2011 af Sheldorin (Slettet)

Hej igen Peter.

Jeg har vedhæftet et dokument hvor du kan se den sætning jeg snakker om.

Jeg har lige yderligere spørgsmål. For hvis jeg udvider mit eksempel med svarmulighederne: "Ja", "nej" og "ved ikke". Når jeg så fx har spurgt 10 mennesker så har jeg en stikprøve på n=10, kan jeg så godt tjekke om andelen af ja-sigere er større end nej-sigere ud fra den sætning jeg har henvist til, selv om det er to andele fra den samme stikprøve jeg sammenligner og selvom jeg faktisk slet ikke bruger andelen af dem der har svaret ved ikke?

Jeg glæder mig meget til dit svar

Sheldorin


Svar #8
06. oktober 2011 af Sheldorin (Slettet)

Nå filen var desværre for stor, men billedet kan ses her:

http://dl.dropbox.com/u/23166116/Photo%2006-10-11%2020.15.49.jpg


Brugbart svar (0)

Svar #9
06. oktober 2011 af peter lind

Det var korrekt da jeg gættede på at det er en tilnærmelse til normalfordelingen.

Når du skal tjekke om nx*px(1-px) > 9 og tilsvarende for y er det ikke en test for om der er forskel, men en test af om du kan bruge tilnærmelsen til normalfordelingen og dermed teststørrelsen z. Formlen for z og hvordan, der skal testes står så neden under.

I. gamle dage var det meget besværligt  at beregne værdierne i binomialfordelingen, hvorfor man brugte den nemme tilnærmelse til normalfordelingen. Med de regnemuligheder, der er i dag synes jeg at man skal bruge binomialfordelingen.

 


Svar #10
06. oktober 2011 af Sheldorin (Slettet)

Jeg er helt med på at jeg bruger formlen for z og så tester ud fra p-værdien, så det har jeg gjort. Men ved du om jeg kan bruge den i det udvidet tilfælde som jeg beskriver oven over?

Du skriver så:

"I. gamle dage var det meget besværligt  at beregne værdierne i binomialfordelingen, hvorfor man brugte den nemme tilnærmelse til normalfordelingen. Med de regnemuligheder, der er i dag synes jeg at man skal bruge binomialfordelingen."

Og det vil jeg helt bestemt kigge på, det kunne måske være lidt flottere :)


Brugbart svar (0)

Svar #11
06. oktober 2011 af peter lind

Med svarmulighederne ja, nej og ved ikke. ja det kan også testes men næppe hvis n er så lav som 10. selv med kun ja og nej bliver resultatet højst usikker med få svar.

Der er 2 muligheder

Du kan simpelthen fjerne ved ikke svarene.

Du kan' kan lave en multinomialfordeling. Det vil være det bedste; men den er bwsværlig at teste.


Svar #12
06. oktober 2011 af Sheldorin (Slettet)

Men jeg tænker at hvis jeg har svarene fx 50 ja, 40 nej 10 ved ikke, altså n=100 kan jeg så teste som at

n_x=100    x=50    p_x=50/100

n_y=100    y=40   p_y=40/100

 

Og ikke fratrække de sidste 10 fra ved ikke.

Forstår du hvad jeg mener?


Svar #13
06. oktober 2011 af Sheldorin (Slettet)

Hvor altså x er ja og y er nej


Brugbart svar (0)

Svar #14
06. oktober 2011 af peter lind

Nej nx =50   ny = 40       n = 90    px= py = 0,5


Svar #15
06. oktober 2011 af Sheldorin (Slettet)

Jeg prøver lige igen:

Jeg spørger 100 personer om de kan lide franskbrød. Jeg får svarene: 50 ja, 40 nej og 10 ved ikke. Jeg har så en stikprøve på 100 og punktestimaterne for andele fordeler sig som:

p1=50/100, p2=40/100 og p3=10/100

Jeg ønsker nu at tjekke om p1 er større end p2, til dette vil jeg bruge den sætning jeg har henvist til direkte. Da jeg i alt har udtaget en stikprøve på 100 må jeg også skulle bruge n_x=100 (altså antallet der er blevet spurgt om de kunne lide franskbrød) det viste sig så at der var 50 ud af de hundrede der svarede ja, altså x=50 (antallet af de adspurgte der  kunne lide franskbrød) I min samme stikprøve på 100 som jeg spurgte om de kunne lide franskbrød var der 40 ud af de hundrede der sagde nej, altså y=40 (antallet af de adspurgte der ikke kunne lide franskbrød)

Nu har jeg så følgende oplysninger:

n_x=100   , x=50    ,  p1=50/100

n_y=100   , y=40    ,  p2=40/100

 

i sætningen skal det siges at mine p1 og p2 er p hat x og p hat y.

Hvorfor er det ikke rigtigt?


Brugbart svar (0)

Svar #16
06. oktober 2011 af peter lind

OK Jeg tænkte på mit eget forslag hvor man testede i binomialfordelingen om at der var lige mange af hver hvilket svarer til at man tester om p =½ i binomialfordelingen


Svar #17
06. oktober 2011 af Sheldorin (Slettet)

Okay, så du mener godt jeg kan gøre som jeg har gjort? :)

Du må undskylde jeg fik forvirret dig, det er ikke altid lige let at udtrykke noget man ikke er helt sikker på, men din hjælp er som altid helt kanon.


Brugbart svar (0)

Svar #18
06. oktober 2011 af peter lind

Ja. Det kan du godt.

Jeg kan ikke se nogen grund til at du undskylder. Det er mindst lige så meget mig, der bare tænkte på min egen model-


Svar #19
06. oktober 2011 af Sheldorin (Slettet)

tja det ved jeg ikke, men i hvert fald mange tak, så er jeg sikker på at jeg ikke har gjort noget forkert, det er jo altid rart med den ekstra sikkerhed :)


Skriv et svar til: Stikprøve og hypotesetest?

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.