Matematik
R^2 og korrelation
Hej!
jeg sidder med en model som afhænger af flere variable. min models forklaringsgrad (R^2) er på 0.94 svarende til at 94% af variationen i modellen er forklaret, hvilket jeg synes er rigtig højt i forhold til hvad jeg har fået at arbejde med i tidligere modeller. En af de variable i modellen har en korrelation på .96 med responsvariablen som jo ligeledes er højt. derfor vil jeg høre om der er nogen som kan forklare mig sammenhængen mellem R^2 værdien og korrelationen.
håber der er en som kan hjælpe :)
Svar #1
05. december 2013 af lfdahl (Slettet)
I mange tilfælde er R simpelthen lig med korrelationen (Pearsons korrelationskoefficient). Denne tager udgangspunkt i kovariansen, som er defineret ved:
Problemet med denne størrelse er, at den returnerer et skalaafhængigt tal, som kan være svært at fortolke.
Man definerer derfor korrelationen, som er kovariansen skaleret med spredningerne for x og y-variablene:
Der gælder da: -1 ≤ Corr(x,y) ≤ +1. De to yderligheder ±1 angiver en perfekt voksende (+1) hhv. aftagende (-1) sammenhæng mellem x og y.
Grunden til at man bruger R2 ∈ [0;1] i stedet for er vel, at denne størrelse på samme måde udtrykker korrelationsgraden, men det er her uvæsentligt om y aftager eller vokser med voksende x. Man er slet og ret interesseret i, hvorvidt x og y følges ad eller ej. Der gælder selvfølgelig: R2 ≤ |R|. Hvis altså R2 er meget tæt på 1 er |R| endnu tættere på 1, og dermed er R2 en stærk og generel indikator for korrelationen i datasættet.
Der er meget udførlige forklaringer af sammenhængen mellem R2 og korrelation på internettet.
Her er nogle af dem:
http://web.sdu.dk/ejstrud/studier/statistik/korrelation.html
http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient
Skriv et svar til: R^2 og korrelation
Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk?
Klik her for at oprette en bruger.
