Matematik

Kan multiple regressionsanalyse laves?

01. januar 2011 af hetican (Slettet) - Niveau: Universitet/Videregående

Jeg har været igang med en eksamensopgave i statistik, som skal om en lille uges tid. Den sidste opgave i projektet gik ud på selv at lave flere analyser ud fra et givent datasæt, som byggede på en spørgeskemaundersøgelse bla. om holdninger i befolkningen i forskellige lande.

Jeg endte med en Chi-Square test, idet jeg ikke syntes at min multiple regressionsanalyse gav mig nogle tilfredsstillende resultater.
Det jeg godt kunne tænke mig at undersøge var, om der var nogen sammenhæng mellem folks alder og deres tillid til hhv. EC (Europa Kommisionen) og EP (Europa Parlamentet) - og om der var sammenhæng imellem disse - altså hvis der er tillid til EC er der så også til EP, og omvendt? Jeg kunne nemlig godt forestille mig, at folk ikke kan skelne mellem disse to parametre, og derfor i vid udstrækning svare det samme. Der var 3 svarmuligheder inden for hver, som bliver angivet med 1, 2 eller 3.

En korrelationsmatrix (fra Megastat) giver mig en værdi på 0,746, hvis jeg laver den på EC og EP. Laver jeg en regressionsanalyse i Megastat får jeg nedenstående (håber det giver lidt mening)

R² 0.004
Adjusted R² 0.003
n 1395
R 0.065
k 2
Std. Error 18.060
Dep. Var. alder

ANOVA table 
Source                  SS                      df           MS                  F                p-value
Regression        1,934.3710        2            967.1855      2.97           .0519
Residual             454,017.7552   1392     326.1622
Total                     455,952.1262   1394

Regression output                                                                                          confidence interval
variables      coefficients      std. error      t (df=1392)     p-value           95% lower 95% upper
Intercept       47.8905            1.2189         39.288            8.45E-228      45.4994     50.2817
till EP             2.3965              0.9950         2.409              .0161                 0.4447       4.3484
till EC             -1.4987            0.9625         -1.557             .1197                -3.3868       0.3894

Det der undrer mig, er at korrelationen imellem de to værdier synes stor, men i regressionsanalysen bliver R-værdierne meget lave. Jeg tænker på, om jeg gør et eller andet forkert - eller om jeg simpelthen ikke kan lave analysen på denne måde?
Jeg har også forsøgt at lave analysen med tillid til EC/EP som den afhængige variabel(x) og alder, land, køn og område som de uafhængige(y), men også her får jeg meget lave R-værdier (R-kvadreret = 0,003 og justeret R-kvadreret til 0,000) med en standardfejl på 0,754. Det synes jeg så bare slet ikke kan passe - eller...?

Jeg er absolut ikke stærk i det her - og skal formentlig ikke bruge det ret meget fremover, men derfor ville det da alligevel være rart at forstå det, og kunne bruge det! Og det kunne være spændende at prøve at fremlægge denne del af opgaven i forbindelse med eksamen. Men når jeg ikke er sikker på værdier og sammenligninger er korrekte, så er jeg nu ikke meget for det.

Håber der er nogen, som kan vejlede lidt ;-)

Mvh
Tina


Brugbart svar (0)

Svar #1
01. januar 2011 af NikolajOlsen

Jeg går ud fra, at du laver lineær regression? I så tilfælde skulle jeg mene, at der er krav om, at den afhængige variabel er intervalskaleret eller rekodet til dummyvariabel.



Svar #2
01. januar 2011 af hetican (Slettet)

Ja, det er lineær regression.

Og jeg har ikke haft den afhængige variable i intervaller til denne opgave, så det vil jeg da lige afprøve om ikke det kan give nogle bedre resultater, som ser lidt mere anvendelige ud.

Tak for svar indtil videre - flere svar ønskes gerne ;-)


Brugbart svar (0)

Svar #3
01. januar 2011 af NikolajOlsen

Jamen var din afhængige variabel ikke tillid til EC og EP med 3 svarkategorier?


Svar #4
01. januar 2011 af hetican (Slettet)

Arghh... nu er jeg lige totalt forvirret omkring afhængige og uafhængige...

Det jeg vil sammenligne er:
Alder (som jeg ikke har brugt i intervaller) (Det må være den uafhængige??)

Tillid til EP (svarmuligheder: 1=Tend to trust - 2=tend not to trust - 3=Don't know)
Tillid til EC (do.)
Dem kan jeg vel ikke lige laver intervaller på?


Brugbart svar (1)

Svar #5
01. januar 2011 af Andersen11 (Slettet)

En mere anvendelig afhængig variabel her er vel den relative tillid inden for hver aldersgruppe, dvs. den andel af det samlede antal svarere i en gruppe, der udtrykte tillid.


Brugbart svar (1)

Svar #6
01. januar 2011 af NikolajOlsen

Det kan være I kalder en intervalskaleret variabel for en kontinuert variabel - alder i sin rene form (hvor gammel er du?) er intervalskaleret. Alder er selvfølgelig uafhængig. Den ene af tillidsvariablerne må være afhængig. Du bliver nødt til at erklære værdi 3 Don't know som missing, hvis det skal give mening. Så har du en variabel med to kategorier tilbage, og så skal du enten lave logistisk regression eller rekode til dummyvariabel, så vidt jeg ved, i hvert fald.


Brugbart svar (1)

Svar #7
01. januar 2011 af NikolajOlsen

At dømme ud fra din Regression output tabel, så tror jeg, du har begge tillidsvariabler som uafhængige.


Svar #8
01. januar 2011 af hetican (Slettet)

Okay, det er nok der, den går galt!

Men hvad #5 skriver giver også god mening, så nu er der da i hvertfald lidt mere at prøve at arbejde videre med ;-) Dejligt! Rart lige at få nogle andre vinkler på.


Brugbart svar (0)

Svar #9
02. januar 2011 af Sendai (Slettet)

Det du vil er vel at undersøge om Alder har en indflydelse på tillid til EP og EC ikke? 

Hvis du har en variable som direkte hedder tillid til EP/EC, vil jeg bare smide alder + de andre variable ind i mit regressionmodel og se om alder er significant, hvis den er har alder selvfølgelig indflydelse.

Hvis du har to variable hvor den ene fortæller om tillid til EP og den anden til EC, vil jeg vælge og måle på den ene kun. Derefter vil jeg sætte tillid til den anden variable ind i regressionen og igen se på p-værdier.

Vil du ikke prøve og skrive din regression model op herinde? Det giver mig bedre mulighed for at se om du gør det rigtigt. 

Og tilsidst vil jeg lige sige du kan ikke bruge R^2 til at vurdere om din model er god, det er ikke nogen generel regel omkring hvad din R^2 skal være før du kan sige du har en god model. Men i dit tilfælde er der noget helt galt.

Du skulle ikke ligge inde med SPSS eller Eviews, to virkelig gode statistikprogrammer. 


Svar #10
02. januar 2011 af hetican (Slettet)

Hej René

Vil du ikke sende mig en mail på "slet dette"[email protected], så vil jeg prøve at sende mit data til dig. Jeg har forsøgt forskellige muligheder - men det kom åbenbart lidt an på "Megastats humør" om jeg kan trække det data jeg vil ;-), for i går ville det absolut ikke komme med det, jeg gerne ville have - i dag er det ikke noget problem :-P

Hilsen
Tina


Brugbart svar (0)

Svar #11
02. januar 2011 af Sendai (Slettet)

Min mail er: [email protected]


Brugbart svar (0)

Svar #12
03. juni 2015 af naw1234 (Slettet)

Hej, jeg sidder med en eksamen opgave i statistik, og er lost. Har virkelig brug for hjælp til megastat anyone

Skriv et svar til: Kan multiple regressionsanalyse laves?

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.