為什么樣本方差除以n-1?

開始來點基本背景

總體方差(variance):總體中變量離其平均值距離的平均。一組數(shù)據x_{1} ,x_{2} ,x_{3} ...x_{N}

\sigma^2  = \frac{\sum_{i =1}^N(x_i-\mu ) ^2}{N}

樣本方差(variance):樣本中變量離其平均值距離的平均。一組數(shù)據x_{1} ,x_{2} ,x_{3} ...x_{n}

S^2  = \frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n-1}

到這你可能會想:為什么樣本方差中分母是n-1而不是n,好我們假設是n看看會怎樣:

\frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n}  =\frac{1}{n}\sum_{i=1}^n [(x_i-\mu ) +(\mu -\bar{x} )]^2

=\frac{1}{n}\sum_{i=1}^n (x_i-\mu ) ^2 +\frac{1}{n}\sum_{i=1}^n (\mu -\bar{x} )^2 +\frac{2}{n}\sum_{i=1}^n (x_i-\mu )  (\mu -\bar{x} )

=\frac{1}{n}\sum_{i=1}^n (x_i-\mu ) ^2  +2(\bar{x} -\mu )(\mu -\bar{x} ) + (\mu -\bar{x} )^2

=\frac{1}{n}\sum_{i=1}^n (x_i-\mu ) ^2  -(\bar{x}-\mu)^2

從上式可以看出除非:\mu =\bar{x} 。否則一定有:

\frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n} <\sigma^2  = \frac{\sum_{i =1}^N(x_i-\mu ) ^2}{N}

再想為什么除以n-1
而不是n-2,n-3???請看:

E(\bar{x} ) = E(\frac{1}{n } \sum_{i=1}^nx_{i} ) = \frac{1}{n } \sum_{i=1}^nE(x_{i} )  = \mu

E(\bar{x}-\mu)^2 = E(\bar{x}-E(\bar{x} ))^2 = var(\bar{x} )

\frac{1}{n^2 }  var( {\sum_{i=1}^nx_i }) = \frac{1}{n^2 } {\sum_{i=1}^nvar(x_i )} = \frac{n\sigma ^2}{n^2 }

=\frac{\sigma ^2}{n }

E(\frac{1}{n}\sum_{i=1}^n (x_i-\mu ) ^2  -(\bar{x}-\mu)^2)=\sigma ^2 - \frac{1}{n}\sigma ^2

=\frac{n-1}{n}\sigma ^2

所以有\frac{n}{n-1}E( \frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n}) = E( \frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n-1})  = \sigma ^2

S^2  = \frac{\sum_{i =1}^n(x_i-\bar{x}  ) ^2}{n-1}

而且我們可以直觀的看到隨著樣本總量n的增大,S^2會越接近\sigma ^2

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容