Matematik

Lineær regression med flere punkter Excel

17. marts 2018 af marc414 (Slettet) - Niveau: B-niveau

Hej 

jeg er igang med en opgave med linær regression med flere punkter, og har lavet tabellen i Excel + diagram og fået den til at komme med ligningen. 

Men herfra har jeg brug for hjælp til at forstå resten...

opgaven: Bestem en lineær model N(t) ved hjælp af regression der beskriver udviklingen 

Har vedhæftet det som jeg er nået frem til =) 

VH Marcus


Svar #1
17. marts 2018 af marc414 (Slettet)

Synes ligningen ser lidt sjov ud, den er lavet på bagrund af de her oplysninger (vedhæftet) 


Brugbart svar (1)

Svar #2
17. marts 2018 af Mathias7878

Jeg tror, at du har glemt at sætte x = 0 = 2005, x = 1 = 2006 osv.. Se vedhæftede fil

- - -

 

 

Vedhæftet fil:linear regression.PNG

Svar #3
17. marts 2018 af marc414 (Slettet)

Forstår det ikke helt, hvorfor kan man ikke bruge årstallene?

Brugbart svar (2)

Svar #4
17. marts 2018 af Mathias7878

Nu har du jo ikke vedhæftet hele opgaven, men der står formentlig at x angiver antal årstal (målt i år EFTER 2005), dvs. år = 0 = 2005, år = 1 = 2006 osv..

- - -

 

 


Svar #5
17. marts 2018 af marc414 (Slettet)

her er hele opgaven ( vedhæftet ) 

Men udfra den ændring du har lavet, hvordan vil du så bruge den til at beregne medlemstallet i år 2012? 


Svar #6
17. marts 2018 af marc414 (Slettet)

Bruge den ligning til at beregne/ bevise hvad det forventet medlemstal vil være i 2012


Brugbart svar (1)

Svar #7
17. marts 2018 af guuoo2

#3 Forstår det ikke helt, hvorfor kan man ikke bruge årstallene?

Det kan man også godt, resten af opgaven giver det rigtige selvom b-tallet bliver voldsomt.

#6 Bruge den ligning til at beregne/ bevise hvad det forventet medlemstal vil være i 2012

Hvis x = 0 svarer til 2005, så finder du den forventet værdi for 2012 i x = 7, da 2012-2005 = 7.


Svar #8
17. marts 2018 af marc414 (Slettet)

Synes også b tallet er stort, det er længe siden jeg har brugt alt det her sidst så er lidt væk??

Havde fundet frem til de "7" som vel bare skal sættes ind på x plads i ligningen. Og så håbe på at det passer med det tabellen har fået det til?

Brugbart svar (1)

Svar #9
17. marts 2018 af Mathias7878

#8

Det vil det ikke gøre i nogle af tilfældene. Det vil dog forhåbentligt ligge tættest på, når du bruger n(t). Når man har fået angiver mere end to y- og x-værdier, laver man altid regression. Problemet er, at hvis man blot tager to tilfælde y- og x-værdier, så vil man få et fejlagtigt resultat. Det vil du opleve med begge funktioner g og h. Derimod, ved at lave regression, får man den funktion, der passer bedst på de opgivne data. De vil dog stadigvæk afvige en smule. Hvis du ser på R2-værdien i mit billede i #3, er den næsten 1, hvilket vil sige, at der er minimale afvigelser i forhold til de opgivne data. Hvis R2-værdien var præcis 1, ville der ingen afvigelser være overhovedet. Det oplver man dog sjældent, når man har med sådan noget data at gøre.

Hvis du nu lavede regression på følgende:

x  1   2   3   4   5

y  5  10 15 20 25

så ville du nok få en R2-værdien på præcis 1.

- - -

 

 


Svar #10
17. marts 2018 af marc414 (Slettet)

Mange tak for hjælpen, jeg kan ikke få dig til at kigge på min udregning.

På hvordan jeg fandt frem til min g(t) og h(t)

Hvor det er den rette linje ud fra 2 opgivet punkter, har brugt maple til at regne det.

Brugbart svar (1)

Svar #11
17. marts 2018 af Mathias7878

g)

Forskriften for g:

  \small a = \frac{y_2-y_1}{x_2-x_1} = \frac{8638-7540}{2-0} = 549

samt

  \small b = y_1-ax_1 = 7540-549\cdot 0 = 7540

dvs

  \small g(x) = 549+7540

Forskriften for h:

  \small a = \frac{y_5-y_3}{x_5-x_3} = \frac{11216-9441}{5-3} = \:887.5

samt

  \small b = y_3-a\cdot x_3 = 9441- \:887.5\cdot 3 = 6778.5

dvs

  \small h(x) = 887.5x+6778.5

  

- - -

 

 


Svar #12
17. marts 2018 af marc414 (Slettet)

Mange tak har fundet min fejl, havde sat 2007 ind i stedet for 0 da jeg skulle finde b og samme fejl ved H. Så jeg fik nogle meget høje tal??

Du har reddet min fucking weekend

Brugbart svar (1)

Svar #13
17. marts 2018 af Mathias7878

Så lidt makker :)
 

- - -

 

 


Svar #14
17. marts 2018 af marc414 (Slettet)

Du har ikke et mobilnr så jeg kan sende dig lidt på mobilepay, som mange tak for hjælpen.

Vh Marcus

Brugbart svar (0)

Svar #15
17. marts 2018 af Mathias7878

Haha - det er sgu ikke nødvendigt ! :=)

- - -

 

 


Svar #16
17. marts 2018 af marc414 (Slettet)

Det er da ellers det mindste jeg kan gøre,
Men mange tak for hjælpen, så vil jeg ønske dig en maga fantastisk weekend??

Brugbart svar (0)

Svar #17
17. marts 2018 af Mathias7878

I lige måde! :=)
 

- - -

 

 


Brugbart svar (0)

Svar #18
17. marts 2018 af AMelev

#3 Forstår det ikke helt, hvorfor kan man ikke bruge årstallene?

Den første grund er, at hvis du bruger årstallene, fører du jo modellen tilbage til Kr. fødsel, og det giver ikke mening. Agility er en temmelig ny sport, og hverken apostlene eller andre på den tid dyrkede den elller var medlemmer af DGI.
Det gælder alle modeller af denne type, at de ikke kan føres så langt tilbage.

Den anden grund er, at der direkte kræves i opgaven, at x skal være antal år efter 2005, dvs. at x = Årstal - 2005.


Brugbart svar (0)

Svar #19
17. marts 2018 af guuoo2

#18 Den anden grund er, at der direkte kræves i opgaven, at x skal være antal år efter 2005, dvs. at x = Årstal - 2005.

Det står der jo ikke.

I opgaveteksten står der:
 - "den rette linje gennem datapunkterne (2005;7540) og (2007;8638) har ligningen y = g(t)"
og
 - "bestem forskriften for g"

Hvis man bruger x-værdier mellem 2005 og 2012 så bliver modellens gyldighedsområde bare x-værdierne mellem 2005 og 2012 i stedet for x-værdierne mellem 0 og 7.

I så fald fører modellen kun tilbage til Kr. fødsel, hvis man fejlagtigt betragter x=0 som værende med i gyldighedsområdet.

Grunden til at mange opgaver beder om at man flytter x-værdierne (og dermed gyldighedsområdet) hen omkring 0, er
  1. At b-tallet kan fortolkes som estimatet for et bestemt år i gyldighedsområdet
  2. Af hensyn til stabiliteten af de numeriske algoritmer der beregner regressions forskriften

Årsag 2 kan gøre det nødvendigt men ikke i det her tilfælde.


Brugbart svar (0)

Svar #20
17. marts 2018 af AMelev

#18 Du har ganske ret. Det var mig, der var forblændet af normal modellering, og jeg syntes faktisk, jeg havde set det.
For at kunne sammenligne de forskellige modeller, bør det være de samme størrelser, der optræder som uafhængige variable, så hvis der er brugt årstal i de første to, bør det også være det i regressionen, selv om værdien i 2012 kan beregnes uanset.


Skriv et svar til: Lineær regression med flere punkter Excel

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.