Matematik

spørgsmål i simpel statistik

06. januar 2011 af froekenmia (Slettet) - Niveau: B-niveau

Hej

Jeg er i min opgave blevet bedt om at beregne confidens intervaller ved 95 procent sikkerhed for at se om der er signifikant forskel mellem to talmængder.

Mere præcist skal jeg vurdere forskellen mellem et valgresultat for et parti og en meningsmåling for dette partis fremtid hvis der var valg i morgen.

Jeg kan godt finde ud af at lave udregningerne og tjekke om der er overlap mellem de fremkomne intervaller, som så angiver om der er signifikant forskel, men forståelsen halter ret meget.

Jeg er ikke helt med på hvad det er jeg måler, er der nogle her der kan forklare hvorfor det giver mening at bruge sådanne udregninger til at be- eller afkræfte om det er sandsynligt hvad man har fundet ud af i en undersøgelse set i forhold til et valgresultat?


Brugbart svar (1)

Svar #1
06. januar 2011 af NikolajOlsen

Når man udtrækker en stikprøve af populationen kan man ikke være sikker på, at den stikprøve er lige præcis et billede af populationen. Der er en usikkerhed, som man tager højde for, når man laver sikkerhedsintervaller. Det afhænger jo af, hvor stor stikprøven er, og hvor sikker, man vil være.
Når du laver et sikkerhedsinterval for en meningsmåling, så finder du ud af, hvordan fordelingen er i populationen med - i dit tilfælde - 95 % sikkerhed. Det vil ikke være nødvendigt at lave interval for valgresultatet, da det er en måling på populationen. Hvis valgresultatet ligger inden for det interval, du har fundet for meningsmålingen, så kan du med 95 % sikkerhed afvise, at partiet har fået flere eller færre stemmer end ved valget. Hvis valgresultatet ligger uden for intervallet for meningsmålingen, så kan du med 95 % sikkerhed sige, at partiet enten går frem eller tilbage.

Med andre ord, så laver man sikkerhedsintervallet, fordi man ikke kan være sikker på, at stikprøven giver et fuldstændigt retvisende billede af populationen. Derved laver man en fejlmargin, hvor man siger, at med 95 % sikkerhed ligger den sande andel i populationen inden for et interval. Og så har man jo et interval for, hvordan valgresultatet ville blive, hvis der var valg i morgen. Hvis det sidste valgresultat, som du sammenligner med, ligger inden for dette interval, så er det ikke sikkert, at partiet har fået flere eller færre stemmer, og omvendt, hvis valgresultatet ligger uden for, så er det sandsynligt, at partiet har fået større eller mindre tilslutning.


Svar #2
06. januar 2011 af froekenmia (Slettet)

Tusind  tak :-)

Kan man sige, at hvis der ikke er overlap mellem de to intervaller jeg skal sammenligne, ved konfidensniveau på 95 procent (hedder det signifikansniveau?) så er der ikke tale om en signifikant forskel?  og dermed kan vi med 95 procent sikkerhed antage, at partiet i meningsmålingen ikke er gået frem eller tilbage.

Denne form for beregning af konfindesintervaller, og metoden med at kigge på overlap i intervallerne, gælder den kun for stikprøver der er normalfordelte?

Hvordan et tal af en vis størrelse for et parti i en meningsmåling, kan forklare, hvor sandsynligt det er at denne fremgang eller nedgang er sandsynlig forstår jeg dog ikke helt, altså hvis et lille tal fremkommer i stikprøven, så er det mindre sandsynligt at der er tale om en lille op- eller nedgang, end hvis man fandt et større tal? vil det ikke give problemer med at vurdere en lille fremgang i en meningsmåling?


Brugbart svar (1)

Svar #3
06. januar 2011 af NikolajOlsen

Kan man sige, at hvis der ikke er overlap mellem de to intervaller jeg skal sammenligne, ved konfidensniveau på 95 procent (hedder det signifikansniveau?) så er der ikke tale om en signifikant forskel? og dermed kan vi med 95 procent sikkerhed antage, at partiet i meningsmålingen ikke er gået frem eller tilbage.

Jeg kalder det signifikansniveau, jeg ved ikke, om det andet bruges. Det er helt rigtigt, at hvis der ikke er overlap, så er der ikke signifikant forskel, og vi kan sige, at partiet hverken er gået frem eller tilbage.

Denne form for beregning af konfindesintervaller, og metoden med at kigge på overlap i intervallerne, gælder den kun for stikprøver der er normalfordelte?

Ved stikprøver på 30 eller flere cases, er det ikke nødvendigt, at populationen er normalfordelt, hvis stikprøven udtrækkes simpelt tilfældigt. Forklaringen er lidt teknisk, så den springer jeg over, medmindre du gerne vil have den :)

(hvordan et tal af en vis størrelse for et parti i en meningsmåling, kan forklare, hvor sandsynligt det er at denne fremgang eller nedgang er sandsynlig forstå jeg dog ikke helt, altså hvis et lille tal fremkommer i stikprøven, så er det mindre sandsynligt at der er tale om en lille op- eller nedgang, end hvis man fandt et større tal? vil det ikke give problemer med at vurdere en lille fremgang i en meningsmåling?

Jamen en lille fremgang vil jo ligge lige over sikkerhedsintervallet. Du skal huske, at hvis vi siger, at et parti har fået 13,9 % af stemmerne ved valget, og i en meningsmåling står til 15,7 % og sikkerhedsintervallet er [13,4;18,0], så kan vi ikke sige, at partiet er gået frem. Det ser umiddelbart ud til, at partiet går frem fra 13,9 % til 15,7 %, men når vi udregner sikkerhedsintervallet, så ser vi, at det ikke er sikkert, at partiet er gået frem.


Svar #4
06. januar 2011 af froekenmia (Slettet)

Okay jamen så er jeg nogenlunde med helt overordnet. Tak igen :-)

Du må gerne forklare det med de 30 cases eller derover, jeg ved godt hvad der menes med simpel tilfældig udtræk (at alle individer har lige stor chance for at blive udtrukket) vi har vist lært noget med at at der skal være fem i hver kategori eller sådan noget, ved ikke om det skulle være det samme som det med de 30 cases eller derover, når vi taler om denne omtalte metode kan bruges også i fordelinger som ikke er kendetegnet ved normalfordeling.


Brugbart svar (1)

Svar #5
06. januar 2011 af NikolajOlsen

Du må gerne forklare det med de 30 cases eller derover, jeg ved godt hvad der menes med simpel tilfældig udtræk (at alle individer har lige stor chance for at blive udtrukket) vi har vist lært noget med at at der skal være fem i hver kategori eller sådan noget, ved ikke om det skulle være det samme som det med de 30 cases eller derover, når vi taler om denne omtalte metode kan bruges også i fordelinger som ikke er kendetegnet ved normalfordeling.

Det med 5 cases i hver kategori har måske at gøre med Chi2-test. Jeg har i hvert fald ikke hørt om det i denne forbindelse. Forklaringen på, at en stor stikprøve ikke behøver at være normalfordelt, findes i den centrale grænseværdisætning. Den går ud på, at hvis man hypotetisk laver en hel masse stikprøver, så vil de stikprøvers gennemsnit være normalfordelt omkring gennemsnittet i populationen. Men det gælder altså kun, hvis der er tilstrækkeligt med cases i stikprøverne.


Svar #6
06. januar 2011 af froekenmia (Slettet)

okay mange tak


Skriv et svar til: spørgsmål i simpel statistik

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.