Matematik
Hypotesetestning
Jeg har et spørgsmål til en delopgave i statistik om hypotesetestning. Det man skal vide er:
Til en eksamen laves en stikprøve kontrol med 20 elever, hvor p er er sandsynligheden for at en elev har snydt.
I spørgsmål 2 bliver man bedt om at beregne hvad sandsynligheden er for at mindst 3 studerende har snydt, hvis p = 0,1.
Resultatet til det spørgsmål får jeg til 0,323.
Senere laver man så en større undersøgelse med 200 elever, hvor 45 elever havde snydt.
Sidste delopgave lyder:
Sandsynligheden som blev beregnet i punkt 2 kan fortolkes som et signifikansniveau. Hvad er i så fald hypoteserne, og hvad er testen?
Jeg er med på at man vælger at sige at alpha = 0,323, men jeg kunne godt bruge et hint til opstilling af hypoteser og valg af test, da jeg ikke helt forstår spørgsmålet :-)
Svar #1
26. november 2013 af peter lind
Man opstiller en 0 hypotese, som typisk er af formen p=a , hvor a er et eller andet tal. En anden mulighed er at sandsynligheden i flere grupper er ens. for eks. at der ikke er forskel på andelen af rygere i de enkelte klasser på skolen.
Man opstiller så en hypotese kaldet 0-hypotesen. I det første tilfælde vil det være p=a. I det andet tilfælde vil det være at grupperne er ens. Samtidig må man antage en eller anden fordeling. På grundlaget af 0 hypotesen og fordelingen finder man en teststørrelse, som naturligvis vil være afhængig af både hypotesen og fordelingen. Der er så mange muligheder for det at jeg ikke kan gennemgå al det. I gymnasiet er det koncentreret omkring binomialfordeling, multinomialfordeling og normalfordeling. For store værdier af observationsmaterialet kan man også i de 2 første tilfælde med rimelig sikkerhed bruge test fra normalfordeling.
Når man har opstillet en teststørrelse og dens sandsynlighedsfordeling skal man fastsætte et signifikantsniveau. det mest almindelige er 5%. Man laver ud fra dette et interval bestemt af at der er 95% sandsynlighed for at få et resultat i intervallet., 5% udenfor. Det udenfor kan være ensidig eller tosidig. Det betyder at forkastelsesintervallet kun ligger i den ene side for eks. at teststørrelsen mindre end det og det., eller der kan være både en opad og en nedadtil begrænsning. Hvis teststørrelsen giver en værdi der ligger i det usandsynlige område forkaster man hypotesen ellers accepterer man den. Man skal lige være opmærksom på at accept ikke er det samme som at 0 hypotesen er bevist,
Svar #2
27. november 2013 af AnneJensen91 (Slettet)
Jeg er med på den grundlæggende teori. Mit spørgsmål går mere på det konkrete tilfælde. I opgave 2 betragter man en binomisk forsøgsrække, hvor sandsynligheden for hver hændelse er 0,1. Man får da at sandsynligheden for at 3 eller flere studerende ud af 20 har snydt til eksamen er 0,323.
Mit dilemma går på hvad sammenhængen er mellem dette også så opgaven, hvor man bliver bedt om at betragte den ovenstående sandsynlighed som et signifikansniveau.
At man får benytter en sandsynlighed som signifikansniveau, hvad siger det om hypoteserne?
Er hypoteserne så
H0: Max. 2 elever har snydt (p<=0,1)
H1: Min. 3 elever har snydt (p>0,1) ?
Og testen en almindelig test af sandsynligheden p (omskrevet Z-test)?
Svar #3
27. november 2013 af peter lind
Det ser mærkeligt ud. Man kan ikke på den måde beregne sig til et signifikansniveau. Det er noget man fastsætter inden man begynder at regne på de observerede data. Hvis du mener at det er de 0,323 altså 32,23% er det usandsynligt højt og det kan faktisk også være højere end det. Hvor kommer undersøgelsen af de 200 elever ind i billedet ? Har du ikke den ordrette opgavetest ?
Svar #4
28. november 2013 af AnneJensen91 (Slettet)
Det er netop det, der undrer mig - hvad er lige pointen med at benytte en beregnet sandsynlighed som signifikansniveau - og hvad siger det om hypoteserne...?
Jeg har ikke den originale svenske opgavetekst, men den danske oversættelse er:
Ved tidligere års eksaminer har der ikke været nogen formel kontrol af eventuel snyd til eksamen. I år er det derfor blevet bestemt, at man skal foretage en stikprøvekontrol for at få en oversigt over, i hvilket omfang snyd foregår. Man vil starte med en pilotundersøgelse, hvor man bare undersøger 20 tilfældigt valgte studenter. Hvis 3 eller flere af disse har snydt, vil man sætte gang i en større undersøgelse, hvor man undersøger 200 studenter. Lad X være antallet af studenter i pilotundersøgelsen, som blev taget i at snyde. Vi må antage at X er binomisk fordelt med parametre n = 20 og p, hvor p er sandsynligheden for at en tilfældig studerende har snydt.
1.Hvilke krav skal være opfyldt for at X er binomisk fordelt?
2.Hvis p = 0,1, hvad er sandsynligheden for at mindst 3 af de studerende i pilotundersøgelsen har snydt?
Antag nu at man bestemte sig for at gennemføre en undersøgelse på 200 studerende. Man opdagede at 45 af disse 200 havde forsøgt at snyde.
3.Find en estimator for p. Estimer standardafvigelsen for estimatoren.
4.Udled og beregn et tilnærmet 95%-konfidensinterval for p.
5.Bestem forkastningsområdet for en test af følgende hypoteser når signifikansniveauet er sat til 5%:
6.Beregn signifikanssandsynligheden (p-værdien).
7.Sandsynligheden som blev beregnet i punkt 2 kan fortolkes som et signifikansniveau. Hvad er i så fald hypoteserne, og hvad er testen?
Svar #5
28. november 2013 af peter lind
Hypotesen vil være at p=0,1 altså at hver tiende snyder. (lyder voldsomt). Signifikantsniveauet vil ligge mellem P(X≤3) og P(X<4) Du skal så nok finde en eller anden pæn værdi i det interval
Skriv et svar til: Hypotesetestning
Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk?
Klik her for at oprette en bruger.
