Matematik

best linear predictor

15. september 2019 af bokaj123 - Niveau: Universitet/Videregående

Hej

Nogen der kan forklare hvorfor man vil minimere  E(Y-a-βX)2


Brugbart svar (0)

Svar #1
16. september 2019 af AMelev

Man må besluttte sig for, hvad ordet "bedst" betyder i "bedste" rette linje.
Umiddelbart kunne man mene den linje, hvor afstanden fra datapunkterne til linjen totalt eller gennemsnitligt er midst. Problemet er bare, at det bliver meget omstændeligt at regne med den egentlige (vinkelrette) afstand til linjen, så man beslutter, at det skal betyde mindste lodrette afstand mellem datapunkter og linje.
Det er imidlertid også besværligt at regne med numerisk værdi, som man jo skulle for at få afstanden, så både punkter over og under linjen bidrager, men afstanden er mindst, når kvadratafstanden er mindst, og det er netop denne lodrette kvadratafstand mellem y-værdi og modelværdi, du har i (Y - α - βX)2, og den skal altså være mindst mulig.
I DK ville vi skrive f(x) = a·x + b og få (y - f(x))2 = (y - a·x - b)2, men i USA er standarden for en lineær funktion f(x) = a + b·x eller som her f(x) = α + β·x.


Svar #2
16. september 2019 af bokaj123

ja, men hvorfor flytte man det hele til venstre side? y=ax+b -> y-ax-b. forstår heller ikke helt det beta stjerne er lig med ?


Brugbart svar (0)

Svar #3
16. september 2019 af Eksperimentalfysikeren

4. og 5. line fra neden er to ligninger med to ubekendte. Dem løser man og kommer frem til de to sidste linier.


Svar #4
16. september 2019 af bokaj123

men hvorfor ændre man y=ax+b til y-ax+b=0 


Svar #5
16. september 2019 af bokaj123

hvordan viser jeg:

Show that the best linear predictor of Y given X, i.e.

Y_hat = aX + b


Brugbart svar (0)

Svar #6
16. september 2019 af Eksperimentalfysikeren

Jeg plejer at gå en lidt anden vej, men princippet er det det samme jeg gør, dog med en enkelt vigtig forskel, som jeg vender tilbage til:

Jeg har N par (xn,yn), n = 1,...,N, af observerede værdier, som formodes at have en lineær sammenhæng af formen y=a+bx. Afsætter man værdiparene i et koordinatsystem, kan man se, at de ikke ligger på en ret linie. Derfor indfører jeg størrelsen dn, der er forskellen mellem den aflæste y-værdi og den y-værdi, der kan beregnes ud fra den tilhørende x-værdi og de endnu ukendte konstanter a og b:

dn = yn - (a+bxn) = yn - a - bxn

De to konstanter, a og b, vi søger skal fastlægges, så alle dn'erne skal blive numerisk mindst mulige.

Numerisk værdi er upraktisk at regne med, fordi den ikke er differentiabel i 0. Derfor vælger man i stedet at benytte dn2, som er differentiabel. Betingelse "alle" opfyldes hos mig ved at jeg tager summen af dn2, men man kan også benytte E(d2).

Den måde, de efterfølgende udregninger sker på, afhænger af dette valg, men grundprincipperne er de samme.

Jeg kan ikke længere huske den statistiske sprogbrug, så jeg kan desværre ikke besvare dit sidste spørgsmål.


Skriv et svar til: best linear predictor

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.