1、邊際誤差
(1)一般置信區(qū)間表示為(參數估計值+/-邊際誤差)這一形式。所謂邊際誤差,是因為樣本與總體總是有一定差異的,在進行總體參數估計時需要把這一差異考慮進來。
(2)根據中心極限定理可以知道,從任何分布中抽樣,只要樣本量足夠大,其統(tǒng)計量終會服從正態(tài)分布。
(3)邊際誤差通常用對應一定正態(tài)分位數的Z值(標準差倍數)再乘以表示抽樣誤差的標準誤來表示。
(4)實際中一般習慣計算的是95%置信區(qū)間,因此一般表示為“參數估計值+/-1.96x標準誤"(1.96是95%置信區(qū)間下的分位數)
2、什么是標準誤呢?
已知某學校有初三學生共200名,這200名學生的平均身高為160cm 。我們以這200名初三學生作為總體,欲通過抽樣調查來了解所有初三學生的平均身高?,F(xiàn)在假定我們共做了10次抽樣,每次抽樣的樣本量都是100人。此時我們可以分別計算出每次抽樣樣本的身高均數和標準差。

image.png
這里10個均數和標準差都是樣本統(tǒng)計量,如果我們把10 個樣本的均數作為原始數據,然后計算這10個值的標準差,那么我們得到的指標就是標準誤。也就是說,標準誤是樣本統(tǒng)計量的標準差,它反映了每次抽樣樣本之間的差異。如果標準誤小,則說明多次重復抽樣得到的統(tǒng)計量差別不大,提示抽樣誤差較??;反之,如果標準誤大,則說明樣本統(tǒng)計量之間差別較大,提示抽樣誤差較大。
之前我們已經討論過標準誤和標準差,再總結下:
第一,標準誤的英文是Standard Error, 是一種誤差;而標準差的英文是Standard Deviation, 只是一種對均數的偏離而已。偏離和誤差根本不是一個概念。
第二,標準差只是一個描述性指標,只是描述原始數據的波動情況;而標準誤是跟統(tǒng)計推斷有關的指標。描述性指標和推斷性指標根本不是一個層次上的概念。
第三,它們針對計算的對象不同。標準差是根據某次抽樣的原始數據計算的;而標準誤是根據多次抽樣的樣本統(tǒng)計量(如均數、率等)計算的。理論上,計算標準差只需要一個樣本,而計算標準誤需要多個樣本。
3、現(xiàn)實中標準誤計算方式
(1)盡管從理論上來講,標準誤的計算是通過多次抽樣的多個樣本統(tǒng)計量而獲得的,但在實際中僅靠一次抽樣來計算標準誤也是可行的。事實上,在絕大多數情況下,我們也別無選擇,只能利用一次抽樣數據來計算標準誤。此時標準誤的計算公式為:

image.png
其中,s表示樣本標準差, n為樣本例數。不難看出,樣本例數越大,標準誤越小,即抽樣誤差越小。(這個計算的推導,我不清楚)
4、置信區(qū)間的計算
(1)不同指標的標準差的計算過程不同,因此其標準誤也不同。對于均數的置信區(qū)間,如果例數較小,那么此時t分布與正態(tài)分布有一定差異,因此其置信區(qū)間為:

image.png
具體的t值大小取決于樣本例數??偟膩碚f,例數越小,或t值越大,置信區(qū)間越寬。