Matematik

Regressionsanalyse

10. april 2007 af Madsst (Slettet)
Hejsa. Jeg sidder her med noget statistik jeg har kigget mig lidt blind på. Jeg har lavet en multipel regression på et datasæt og bliver nu bedt om at plotte residualerne fra regressionen mod de predikterede værdier for den afhængige variabel for at undersøge hvorvidt Var(U|X) er konstant.
Umiddelbart kan jeg ikke komme frem til hvad jeg burde se på plottet såfremt denne varians er konstant. Det jeg efterlyser her er altså et udtryk for Var(u(hat)|y(hat). Det er klart at Var(u(hat)|y(hat))
=Var(Y-Y(hat)|Y(hat))=Var(Y-Xb(hat)|Xb(hat))
=Var(Y-X*(X'X)^-1X'|X*(X'X)^-1X'), men her strander jeg.
For klarheds skyld er X en m x k+1 matrix, hvor k+1 er antallet er koefficienter og m er antallet af observationer. Y er en m x 1 vektor.
På forhånd tak!

Svar #1
11. april 2007 af Madsst (Slettet)

Hov. Jeg skylder vist lige at fortæller at min lineære regressionsmodel er Y=Xb+u, hvor u (fejlleddet) er en vektor med samme dimensioner som Y. Samtidig at der i modellen er antaget: E(U|X)=0, rang(X)=k+1, data er opnået ved tilfældig stikprøve.
Samtidig kan jeg godt komme lidt videre.
Var(Y-Xb(hat)|Xb(hat))=Var(u+X(b-b(hat))|Xb(hat))
= Var(u|Xb(hat)) + Var(X(b-b(hat)|Xb(hat))´
-2Cov(u,X(b-b(hat)|Xb(hat), hvor Cov leddet må være 0 pr. antagelsen E(U|X)=0.
Nu har jeg et led der hedder
Var(u|Xb(hat)), som ligner noget jeg kan bruge, men der er stadig det med Var(X(b-b(hat))|Xb(hat)). Kan jeg sige noget om det?

Brugbart svar (0)

Svar #2
11. april 2007 af sheaf (Slettet)

Som tidligere nævnt er statistik og sandsynlighedsteori ikke mit gebet. Så jeg kan kun synge en halvkvædet vise.

Ideen med at lave et scatterplot af residualerne mod de predikterede værdier af den afhængige variabel, er at det vil afsløre homoscedasitet [tvivlsom stavemåde] - altså om residuerne er spredt tilfædligt udover værdiområdet for den predikterede afhængige. Det er det samme som at sige, at variansen af residualerne skal være konstant for alle værdier af den predikterede afhængige. Hvis det ikke er tilfældet, kan det nemlig tænkes, at modellen er utilstrækkelig og at væsentlige uafhængige variable er udeladt.

Homoscedasitet vil kunne genkendes på scatterplottet som en rektangulær form altså hvis plottet har samme bredde for alle værdier af den predikterede afhængige. Hvis plottet ser anderledes ud er der ikke tale om homo - så hedder det vist heteroscedasitet. Det viser sig typisk som en punktklynge der bliver bredere og bredere for større værdier af den afhængige.

Hvis jeg ikke husker meget galt findes der en test for homoscedasitet kaldet Breusch-Pagan. Prøv evt. at google den.


Svar #3
11. april 2007 af Madsst (Slettet)

ja okay - tak!

Skriv et svar til: Regressionsanalyse

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.