Matematik

Definition af varians

09. december 2018 af dolittle - Niveau: B-niveau

Hvorfor er definitionen af varians forskellig for en stokastisk variabel og for et observationssæt?

For en stokastisk variabel X er variansen defineret som

\operatorname{Var}(X)=E\left(\left(X-E(X)\right)^2\right).

For et observationssæt {x_1,\dots,x_n} med middelværdi \overline{x} er den empiriske varians defineret ved

s^2=\frac{\sum_{i=1}^n(x_i-\overline{x})^2}{n-1}.

Hvorfor dividerer de ikke med n i stedet for n-1?


Brugbart svar (0)

Svar #1
09. december 2018 af peter lind

Det er fordi man har antaget at middelværdien er beregnet ud fra samme datasæt. Så er det jo sikkert at ∑xi-middelværdien er 0. Hvis middelværdien er fremkommet teoretisk skal man også dividere med n ikke n-1


Svar #2
09. december 2018 af dolittle

Jeg kan godt følge, at \sum_{i=1}^n(x_i-\overline{x}) ikke nødvendigvis er 0. Men hvorfor skal vi så dividere med n-1, når vi finder variansen? Det må betyde, at variansen bliver større, men hvorfor skal den være det?


Brugbart svar (1)

Svar #3
09. december 2018 af peter lind

det betyder at variansen bliver for lille hvis du dividerer med n. Det sidste led kan jo regnes ud af de n-1 første 


Brugbart svar (1)

Svar #4
09. december 2018 af peter lind

Du  kan se en nærmere beregning på https://en.wikipedia.org/wiki/Variance  under sample variance


Brugbart svar (1)

Svar #5
09. december 2018 af oppenede

Hvis det er en normalfordeling der ligger til grund for et observationssæt, så benyttes oftest den variansformel du nævner hvor man dividerer med n-1. Selv om n-1 ser mærkeligt ud, så kan man bevise at det er det rigtige at gøre hvis man insisterer på at formlen i gennemsnit skal give den rigtige varians.

Man kan dog opstille massere af andre ønskværdige egenskaber end gennemsnitlig korrekt estimation.
Hvis man vælger at gå efter en anden egenskab kan det sagtens betyde at man skal dividere med noget andet, f.eks.  n - 1/3,  n eller  n - 2.


Svar #6
09. december 2018 af dolittle

Tak for svarene.

#4 Er det rigtigt forstået, at du mener, at vi af \overline{x}=\frac{1}{n}\sum_{i=1}^nx_i kan slutte, at x_n=n\overline{x}-\sum_{i=1}^{n-1}x_i? Hvis ja, så kan jeg godt se, at vi på en måde kun har n-1 observationer, selvom det stadig virker lidt underligt.

#5 Tak for referencen. Det var sådan noget, jeg var ude efter.


Skriv et svar til: Definition af varians

Du skal være logget ind, for at skrive et svar til dette spørgsmål. Klik her for at logge ind.
Har du ikke en bruger på Studieportalen.dk? Klik her for at oprette en bruger.