Matematik

Paremterestimationer

08. maj 2015 af aaaaaz (Slettet) - Niveau: Universitet/Videregående

Jeg ser på statistik og har lidt svært ved at forstå notation, terminologi og generelt det intuitive forståelse bag paremterestimationer. Mere konkret har jeg svært ved at se hvad forholdet er mellem paremterestimator $\hat{\Theta }$ og paramter $\Theta$ . Skal $\Theta$ her blive betragtet som et udfald en stokastisk variabel?

Eksempler vil muligvis gøre underværker.

Tak :)

Svar #1
08. maj 2015 af aaaaaz (Slettet)

... jeg har gennemgået elementær sandsynlighedsregning på Uni.

Brugbart svar (1)

Svar #2
08. maj 2015 af peter lind

Skal [\Theta] her blive betragtet som et udfald en stokastisk variabel? ja

Det simpleste du kan komme ud for er et ja/nej mulighed som for eksempel, hvor stor en andel af den danske befolkning er blåøjet. Parameteren er andelen af blåøjet i Danmark Estimatoren er her andel af blå øjne i en tilfældig udvalgt gruppe. Den estimerede parameter er så det konkrete resultat af en sådan måling.

Brugbart svar (1)

Svar #3
08. maj 2015 af Krable (Slettet)

Nu har du ikke forklaret din notation, så jeg prøver at forklarer det ud fra hvad jeg tror du spørger om. Hvis det er noget andet du er interesseret i må du sige det.

Altså ${\circleddash}$ beskriver mængden af alle værdier din parameter kan antage. .f eks hvis du har bin(n,p) vil $p \in \circleddash=[0,1]$ . Jeg vil forklarer forståelsen af $p, \hat{p}$ ud fra binomial fordelingen da den er simplest.

Betragt likelihoodfunktionen

$L_x : \circleddash \rightarrow [0,1] \\ L_x(p)= \binom{x}{n} p^x(1-p)^{n-x}, \quad p \in \circleddash$

Den er det samme som sandsyngligheds funktionen vi ser nu bare p som variable og ikke x. Du vil så gerne finde værdien af den estimeret parameter $\hat{p}$ . Altså den parameter der gør din data mest sandsynlig. dvs $\hat{p}$ opfylder

$L_x(\hat{p}) \geq L_x(p), \quad p\in \circleddash$ .

Dvs. operationen "Hat" er altså altid et estimat. Det kan vises at $\hat{p} (x)=x/n$ hvilket ikke er særlig overraskende.

Svar #4
08. maj 2015 af aaaaaz (Slettet)

Tak for inputs. Sådan som jeg forstå det vi det give mening at konkludere:

$E[\Theta ]=\hat{\Theta }$ .

Svar #5
08. maj 2015 af aaaaaz (Slettet)

Lad os betragte følgende eksmpel. Et hold bestående af 9 elever har følgende karakterer
02: 1 elev
4: 2 elerver
7: 3 elever
10: 2 elever
12: 1 elev

$(Y_{1}=02, Y_{2,3}=4, Y_{4,5,6}=7, Y_{7,8}=10, Y_{9}=12 )$

Gennemsnittet er så

$\frac{1}{9}\sum_{i=0}^{n}Y_{i}=6,78$

Hvordan kan jeg inddrage teorien om estimationer ind over her og beregne en $\Theta$ og $\hat{\Theta}$ ? :)

Brugbart svar (0)

Svar #6
08. maj 2015 af Therk

#4
Tak for inputs. Sådan som jeg forstå det vi det give mening at konkludere:

$E[\Theta ]=\hat{\Theta }$ .

Det giver ikke mening. Hvad du siger her er at vores forventede værdi af vores parameter er hvad vi har estimeret. Men hvis vores estimat er dårligt (parametriser fx en ternings udfald og find et estimat med kun to terningekast), så går ovenstående jo helt galt!

Derimod da $\widehat \Theta$ er en (oftest maksimum likelihood) estimator af $\Theta$ , må det være fornuftigt at have at

$E\big[\widehat \Theta\big] = \Theta$

hvis estimatoren, $\widehat \Theta$ , er central. Det er dog mere et krav vi oftest stiller vores estimator end noget vi er sikre på. Hvis estimatoren ikke er central, vil der i det lange løb ske det at vi gætter ved siden af. Derfor er ovenstående en god egenskab ved en estimator.

Brugbart svar (1)

Svar #7
08. maj 2015 af Therk

#5
Lad os betragte følgende eksmpel. Et hold bestående af 9 elever har følgende karakterer
02: 1 elev
4: 2 elerver
7: 3 elever
10: 2 elever
12: 1 elev

$(Y_{1}=02, Y_{2,3}=4, Y_{4,5,6}=7, Y_{7,8}=10, Y_{9}=12 )$

Gennemsnittet er så

$\frac{1}{9}\sum_{i=0}^{n}Y_{i}=6,78$

Hvordan kan jeg inddrage teorien om estimationer ind over her og beregne en $\Theta$ og $\hat{\Theta}$ ? :)

Så hvad du siger her er at du prøver at finde den forventede værdi:

$E\bigg[\sum_{i = 0}^n Y_i\bigg]$

Hvis vi parametriserer ovenstående har vi altså at vi ønsker at finde middelværdisparameteren

$\mu = E_\mu[X]$

hvor er den sande parameter.

Med dine observationer kan vi finde et estimat for parameteren, dvs. vi vil finde

$\widehat \mu = E\bigg[\sum_{i = 0}^n Y_i\bigg] = Y_0\, p_0 + Y_1\, p_1 + \ldots Y_n \, p_n \quad \quad \color{blue}(1)$

hvor er sandsynligheden for at få udfaldet . Med antagelsen om at der er lige stor sandsynlighed for de forskellige udfald, bliver dette dog netop bare gennemsnittet:

$\widehat \mu = E\bigg[\sum_{i = 0}^n Y_i\bigg] = \frac 1n \sum_{i = 0}^n Y_i$

men ovenstående, , kunne gælde også for skæve karakterfordelinger.

Ved de store tals lov har vi at

$\widehat \mu \stackrel{P}{\rightarrow} \mu \quad \text{for } n \rightarrow \infty$

altså med nok observationer (uendeligt mange) vil vi ramme den rigtige parameter.

Brugbart svar (0)

Svar #8
08. maj 2015 af Therk

Her er fx et eksempel på hvordan de store tals lovs indvirkning på middelværdiestimatoren for terningekast.

Brugbart svar (0)

Svar #9
10. maj 2015 af Therk

Jeg håber ikke det var sort snak.

Svar #10
10. maj 2015 af aaaaaz (Slettet)

Bestemt ikke. Jeg fik besvaret en række opgaver udfra dine forklaringer. Så tak :)

Skriv et svar til: Paremterestimationer

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.