Matematik
Definition af varians
Hvorfor er definitionen af varians forskellig for en stokastisk variabel og for et observationssæt?
For en stokastisk variabel er variansen defineret som
.
For et observationssæt med middelværdi er den empiriske varians defineret ved
.
Hvorfor dividerer de ikke med i stedet for ?
Svar #1
09. december 2018 af peter lind
Det er fordi man har antaget at middelværdien er beregnet ud fra samme datasæt. Så er det jo sikkert at ∑xi-middelværdien er 0. Hvis middelværdien er fremkommet teoretisk skal man også dividere med n ikke n-1
Svar #2
09. december 2018 af dolittle
Jeg kan godt følge, at ikke nødvendigvis er 0. Men hvorfor skal vi så dividere med , når vi finder variansen? Det må betyde, at variansen bliver større, men hvorfor skal den være det?
Svar #3
09. december 2018 af peter lind
det betyder at variansen bliver for lille hvis du dividerer med n. Det sidste led kan jo regnes ud af de n-1 første
Svar #4
09. december 2018 af peter lind
Du kan se en nærmere beregning på https://en.wikipedia.org/wiki/Variance under sample variance
Svar #5
09. december 2018 af oppenede
Hvis det er en normalfordeling der ligger til grund for et observationssæt, så benyttes oftest den variansformel du nævner hvor man dividerer med n-1. Selv om n-1 ser mærkeligt ud, så kan man bevise at det er det rigtige at gøre hvis man insisterer på at formlen i gennemsnit skal give den rigtige varians.
Man kan dog opstille massere af andre ønskværdige egenskaber end gennemsnitlig korrekt estimation.
Hvis man vælger at gå efter en anden egenskab kan det sagtens betyde at man skal dividere med noget andet, f.eks. n - 1/3, n eller n - 2.
Skriv et svar til: Definition af varians
Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk?
Klik her for at oprette en bruger.