在開始的時(shí)候,我們要先明白一個問題。
什么叫做數(shù)學(xué)期望?
在概率論和統(tǒng)計(jì)學(xué)中,數(shù)學(xué)期望(mean)(或均值,亦簡稱期望)是試驗(yàn)中每次可能結(jié)果的概率乘以其結(jié)果的總和,是最基本的數(shù)學(xué)特征之一。它反映隨機(jī)變量平均取值的大小。
大數(shù)定律規(guī)定,隨著重復(fù)次數(shù)接近無窮大,數(shù)值的算術(shù)平均值幾乎肯定地收斂于期望值。
方差是這樣定義的:
在概率論和統(tǒng)計(jì)中,方差是衡量隨機(jī)變量或一組數(shù)據(jù)離散程度的度量。

意思其實(shí)就是:
若D(X)較小意味著X的取值比較集中在E(X)的附近,反之,則 X 的取值較分散。
方差和標(biāo)準(zhǔn)差之間的關(guān)系

標(biāo)準(zhǔn)差是 離均差 平方和 平均后 的方根,用σ表示。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。
現(xiàn)在有個問題:
既然有了方差來描述變量與均值的偏離程度,
標(biāo)準(zhǔn)差的意義何在?
舉個例子:一個班級里有60個學(xué)生,平均成績是70分,標(biāo)準(zhǔn)差是9,方差是81,成績服從正態(tài)分布,那么我們通過方差不能直觀的確定班級學(xué)生與均值到底偏離了多少分,通過標(biāo)準(zhǔn)差我們就很直觀的得到學(xué)生成績分布在[61,79]范圍的概率為0.6826,即約等于下圖中的34.2%*2

標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤差
標(biāo)準(zhǔn)誤全稱:樣本均值的標(biāo)準(zhǔn)誤(Standard Error for the Sample Mean), 顧名思義,標(biāo)準(zhǔn)誤是用于衡量樣本均值和總體均值的差距。
(1)用于衡量樣本均值和總體均值的差距有多大?
(2)標(biāo)準(zhǔn)誤越小----樣本均值和總體均值差距越小
(3)標(biāo)準(zhǔn)誤越大----樣本均值和總體均值差距越大
標(biāo)準(zhǔn)誤用于預(yù)測樣本數(shù)據(jù)準(zhǔn)確性 ,標(biāo)準(zhǔn)誤越小,樣本均值和總體均值差距越小,樣本數(shù)據(jù)越能代表總體數(shù)據(jù)。
對一個總體多次抽樣,每次樣本大小都為n,那么每個樣本都有自己的平均值,這些平均值的標(biāo)準(zhǔn)差叫做標(biāo)準(zhǔn)誤。
標(biāo)準(zhǔn)差是單次抽樣得到的,用單次抽樣得到的標(biāo)準(zhǔn)差可以估計(jì)多次抽樣才能得到的標(biāo)準(zhǔn)誤差
標(biāo)準(zhǔn)誤計(jì)算例子:

但是為了得到標(biāo)準(zhǔn)誤,我們不可能做很多次科學(xué)實(shí)驗(yàn)。實(shí)際上我們可以做一次樣本實(shí)驗(yàn),然后采用估算公式:

我們用第一組樣本估算真實(shí)標(biāo)準(zhǔn)誤,此樣本標(biāo)準(zhǔn)差除以根號n,結(jié)果為7.16, 然后把7.16約等為真實(shí)的標(biāo)準(zhǔn)誤6.33。
一個小問題,我現(xiàn)在也沒懂!
為什么計(jì)算標(biāo)準(zhǔn)差的時(shí)候,要除以 n-1。
如果是算總體的標(biāo)準(zhǔn)偏差,分母就用n,這就是真實(shí)的標(biāo)準(zhǔn)偏差,屬于描述統(tǒng)計(jì)。
如果是算樣本的標(biāo)準(zhǔn)偏差,無偏估計(jì)是n-1,有偏估計(jì)是n。畢竟樣本只是用來估量總體的情況,屬于推論統(tǒng)計(jì),所以利用樣本計(jì)算總體個體差異性時(shí)候通常會保守估計(jì),除以n-1得出來的標(biāo)準(zhǔn)偏差會比除以n的標(biāo)準(zhǔn)偏差來得大。
當(dāng)然,當(dāng)樣本數(shù)量逐步逼近總體數(shù)量時(shí),標(biāo)準(zhǔn)偏差的有偏估計(jì)和無偏估計(jì)的差別就會越來越小,這也符合統(tǒng)計(jì)學(xué)的本義。