Matematik

Sandsynlighed/statistik! Middelværdi og simultan fordeling af en statistisk model

08. februar 2017 af pure07 - Niveau: Universitet/Videregående

Hvad er den simultane fordeling af:

(Y_{1},Y_{2},...,Y_n} )

når

 Y_{i}=\mu +(e+\theta x_{i})+\epsilon_i , -1<x_i<1, \varepsilon_i \sim N(0,1). x'erne er kendte tal i modellen.

ALtså, hvis den simulatne fordeling skal forståes som "joint distribution" så vil jeg jo definere den som  P(Y_1,...,Y_n)=Y_1*Y_2*...*Y_n

Fordi opgaven bruger betegnelsen \mu gætter jeg på at den skal være middelværdier af Y'erne, men jeg kan ikke få det til at gå op. Kan jeg vise at 

\widehat{\mu}=\overline{Y} 

når

 -1<\theta <1 


Brugbart svar (0)

Svar #1
08. februar 2017 af Therk

Nu er det ikke for at være pedantisk, og jeg ved godt at det ikke er det du har spurgt om, men vi er her trods alt for at lære: Udtrykket P(Y_1,\ldots, Y_n) er vrøvl. En sandsynlighed er en mængde, men Yi'erne er stokastiske variable. Den simultane fordeling skrives op

P(Y_1\leq y_1,\ldots, Y_n\leq y_n)

\rule{7cm}{0.4pt}

Er \varepsilon_i er uafhængige? Der gælder nemlig at den simultane fordeling af uafhængige normalfordelte variable følger en multivariat normalfordeling.

Hvis θ er stokastisk, så kan dette ikke direkte bruges.

\rule{7cm}{0.4pt}

For at finde de marginale parametre er det letteste nok at bemærke at

\varepsilon_i \sim \mathcal N(0,1) \quad\Rightarrow\quad \varepsilon_i + \mu+e+\theta x_i \sim \mathcal N(\mu+e+\theta x_i,1)


Svar #2
08. februar 2017 af pure07

\varepsilon _i'erne er uafhængige, og \theta er ikke stokastisk variabel. Hvordan vil du så skrive et udtryk for den simultane fordeling? Jeg går vel udfra at Y_1*Y_2*...*Y_n ikke er en korrekt måde at gøre det på? 


Brugbart svar (0)

Svar #3
08. februar 2017 af Therk

Det er super. I så fald er den simultane fordeling en multivariate normalfordeling. Jeg ville skrive

(Y_1,\ldots, Y_n)^T \sim \mathcal N_n(\boldsymbol \mu, \boldsymbol \Sigma)

Hvor \boldsymbol \mu = (\mu_1,\ldots, \mu_n)^T og \boldsymbol \Sigma er en n x n diagonalmatrice med 1'er på diagonalen. Find μi i bunden af svar #1.

Med (a)T menes "a transponeret"


Svar #4
08. februar 2017 af pure07

hmm, \mu er en konstant i vores sammenhæng så vekotren må se således:.({\mu},{\mu},{\mu},{\mu},...,{\mu})

Sådan som jeg forstår det, så er {\mu} gennemsnittet for hele alle Y'er. Altså {\mu}=1/n \sum Y_i


Brugbart svar (0)

Svar #5
10. februar 2017 af Therk

Nej, det er ikke rigtigt. \mu er en del af middelværdien. Jeg har muligvis brugt et dårligt symbol for den simultane fordelings (multivariate) middelværdi.

Som jeg har skrevet nederst i #1, så er

\varepsilon_i \sim \mathcal N(0,1) \quad \Rightarrow \quad Y_i = \mu + e+\theta x_i + \varepsilon_i \sim \mathcal N({\color{red}\mu+e+\theta x_i}, 1)

Med andre ord er fordelingen af Yi'erne udelukkende styret af \varepsilon_i'erne, da de er de eneste stokastiske i hvert led. Det vil sige at \mu (og e) er den faktor alle Yi'erne har tilfælles.

Måske kan et eksempel gøre det mere klart: Lad Yi være hvor langt en bil kan køre (samme biltype for alle i). Alle biler har en middelværdi for hvor langt den kan køre i alt (\mu), men hvor langt den kører afhænger af hvor meget brændstof, der er i tanken fra start (\theta x_i). Du ved hvor meget brændstof bilen har på fra start, hvorfor det ikke er stokastisk.


Skriv et svar til: Sandsynlighed/statistik! Middelværdi og simultan fordeling af en statistisk model

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.