概述:
三個定義:
1.個體是收集數(shù)據(jù)的基本單位
2.總體是所有感興趣的個體的集合
3.樣本是總體的一個子集
選取樣本是為了收集推斷所需的數(shù)據(jù),并且回答關(guān)于總體的研究問題。利用恰當(dāng)?shù)某闃臃椒?,抽樣結(jié)果可以給出關(guān)于總體特征的一個“好”的估計。
抽樣
從有限總體的抽樣
簡單隨機抽樣:從容量為N的有限總體中抽取一個容量為n的樣本,如果容量為n的每一個可能的樣本都以相等的概率被抽出,則稱該樣本為簡單隨機抽樣。
- 無放回抽樣
- 有放回抽樣
從無限總體的抽樣
隨機樣本,需要滿足的條件
抽取的每個個體來自同一總體
每個個體的抽取是獨立的
點估計
點估計是以抽樣得到的樣本指標(biāo)作為總體指標(biāo)的估計量,并以樣本指標(biāo)的實際值直接作為總體未知參數(shù)的估計值的一種推斷方法
為了估計總體參數(shù),計算相應(yīng)的樣本特征-樣本統(tǒng)計量

樣本均值?? ?為總體均值??的點估計量
抽樣分布
總體服從正態(tài)分布:任何樣本容量下x ?的抽樣分布都是正態(tài)分布
總體不服從正態(tài)分布:中心極限定理-從總體中抽取容量為n的簡單隨機抽樣,當(dāng)樣本容量很大時,樣本均值x ?的抽樣分布近似服從正態(tài)分布
應(yīng)用角度:一般性而言,樣本容量大于等于30時, x ?的抽樣本部可用正態(tài)分布近似。當(dāng)總體是嚴(yán)重偏態(tài)或者出現(xiàn)異常點時,樣本容量可能需要達(dá)到50
實際應(yīng)用:提供樣本均值x ?和總體均值的值之間差異的概率信息

總體均值的區(qū)間估計:

不同置信水平得到的置信區(qū)間,想要達(dá)到較高的置信水平,必須加大邊際誤差,即加大置信區(qū)間的寬度
應(yīng)用中的建議:
如果總體服從正態(tài)分布,公式給出的置信區(qū)間是精確的
絕大部分情況下,樣本容量n>=30已經(jīng)足夠。
標(biāo)準(zhǔn)正太分布表:https://wenku.baidu.com/view/cd811b103a3567ec102de2bd960590c69fc3d849.html
總體均值的區(qū)間估計:總體標(biāo)準(zhǔn)差未知的情形
- 利用同一樣本估計??和??兩個未知參數(shù)。當(dāng)利用s估計??時,邊際誤差和總體均值的區(qū)間估計都已t分布的概率分布為依據(jù)進(jìn)行的。
- t分布是由一類相似的概率分布組成的分布族,某個特定的t分布依賴于成為自由度的參數(shù)。隨著自由度的增大,t分布與標(biāo)準(zhǔn)正太分布之間的差異越來越小
- 給t加上下表以表明其在t分布上側(cè)的面積。z_0.025 表示在t分布該值上側(cè)的面積為0.025.一般地,用記號t_(??/2)
- t分布查表計算http://www.360doc.com/content/12/0307/17/7598058_192529468.shtml
邊際誤差和區(qū)間估計:
image.png - s是樣本標(biāo)準(zhǔn)差,區(qū)別于之前均值的標(biāo)準(zhǔn)差??
