統(tǒng)計學(xué)筆記(一):抽樣

概述:

三個定義:
1.個體是收集數(shù)據(jù)的基本單位
2.總體是所有感興趣的個體的集合
3.樣本是總體的一個子集

選取樣本是為了收集推斷所需的數(shù)據(jù),并且回答關(guān)于總體的研究問題。利用恰當(dāng)?shù)某闃臃椒?,抽樣結(jié)果可以給出關(guān)于總體特征的一個“好”的估計。

抽樣

從有限總體的抽樣
簡單隨機抽樣:從容量為N的有限總體中抽取一個容量為n的樣本,如果容量為n的每一個可能的樣本都以相等的概率被抽出,則稱該樣本為簡單隨機抽樣。

  • 無放回抽樣
  • 有放回抽樣

從無限總體的抽樣
隨機樣本,需要滿足的條件
抽取的每個個體來自同一總體
每個個體的抽取是獨立的

點估計

點估計是以抽樣得到的樣本指標(biāo)作為總體指標(biāo)的估計量,并以樣本指標(biāo)的實際值直接作為總體未知參數(shù)的估計值的一種推斷方法
為了估計總體參數(shù),計算相應(yīng)的樣本特征-樣本統(tǒng)計量



樣本均值?? ?為總體均值??的點估計量

抽樣分布

總體服從正態(tài)分布:任何樣本容量下x ?的抽樣分布都是正態(tài)分布
總體不服從正態(tài)分布:中心極限定理-從總體中抽取容量為n的簡單隨機抽樣,當(dāng)樣本容量很大時,樣本均值x ?的抽樣分布近似服從正態(tài)分布
應(yīng)用角度:一般性而言,樣本容量大于等于30時, x ?的抽樣本部可用正態(tài)分布近似。當(dāng)總體是嚴(yán)重偏態(tài)或者出現(xiàn)異常點時,樣本容量可能需要達(dá)到50
實際應(yīng)用:提供樣本均值x ?和總體均值的值之間差異的概率信息

image.png

總體均值的區(qū)間估計:

image.png

不同置信水平得到的置信區(qū)間,想要達(dá)到較高的置信水平,必須加大邊際誤差,即加大置信區(qū)間的寬度

應(yīng)用中的建議:
如果總體服從正態(tài)分布,公式給出的置信區(qū)間是精確的
絕大部分情況下,樣本容量n>=30已經(jīng)足夠。
標(biāo)準(zhǔn)正太分布表:https://wenku.baidu.com/view/cd811b103a3567ec102de2bd960590c69fc3d849.html

總體均值的區(qū)間估計:總體標(biāo)準(zhǔn)差未知的情形

  • 利用同一樣本估計??和??兩個未知參數(shù)。當(dāng)利用s估計??時,邊際誤差和總體均值的區(qū)間估計都已t分布的概率分布為依據(jù)進(jìn)行的。
  • t分布是由一類相似的概率分布組成的分布族,某個特定的t分布依賴于成為自由度的參數(shù)。隨著自由度的增大,t分布與標(biāo)準(zhǔn)正太分布之間的差異越來越小
  • 給t加上下表以表明其在t分布上側(cè)的面積。z_0.025 表示在t分布該值上側(cè)的面積為0.025.一般地,用記號t_(??/2)
  • t分布查表計算http://www.360doc.com/content/12/0307/17/7598058_192529468.shtml
    邊際誤差和區(qū)間估計:
    image.png
  • s是樣本標(biāo)準(zhǔn)差,區(qū)別于之前均值的標(biāo)準(zhǔn)差??
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容