《深入淺出統(tǒng)計(jì)學(xué)》3

第10章 統(tǒng)計(jì)抽樣的運(yùn)用

1.抽樣方法

1)簡單隨機(jī)抽樣--重復(fù)和不重復(fù)

  方法:抽簽、隨機(jī)編號(hào)生成器

2)分層抽樣

3)整群抽樣:總體劃分為多個(gè)群,群與群之間相似,對(duì)群進(jìn)行簡單隨機(jī)抽樣

4)系統(tǒng)抽樣:總體分成k組,每組選相同位置的樣本

第11章 總體和樣本的估計(jì)

1.比例的抽樣分布

樣本比例Ps=X/n,

E(Ps)=p

D(Ps)=pq/n

n>30時(shí),有近似,Ps~N(p, pq/n),連續(xù)性修正:±1/(2n)

2.均值的抽樣分布

E(\bar{X})=μ
D(\bar{X})= \frac{\sigma^{2}}{n}

中心極限定理:如果n很大(n>30)且X不符合正態(tài)分布,則:
\bar{X}\sim N(\mu,\frac{\sigma^{2}}{n} )

第12章 置信區(qū)間的構(gòu)建

考慮不確定性的方法

1.求解置信區(qū)間4步驟

1)選擇總體統(tǒng)計(jì)量

2)求出其抽樣分布

3)決定置信水平

4)求出置信上下限

2.t分布

當(dāng)樣本很小時(shí),\bar{X}符合t分布

T~t(v) ,v=n-1
T=\frac{\bar{X}-\mu}{s/\sqrt{n}}

為什么用t分布而不是正態(tài)分布?
基于小樣本估計(jì)σ^2可能無法精確反映總體方差的真實(shí)值,需要讓置信區(qū)間變寬以留出誤差空間。n很小時(shí),t分布給出的置信區(qū)間比正態(tài)分布的更寬。(t分布的形狀隨著v值變化,由于考慮了樣本的大小,即使σ^2的估計(jì)精度存在各種足以讓人覺察的不確定性,t分布也能忽略不計(jì))

第13章 假設(shè)檢驗(yàn)的運(yùn)用

1.假設(shè)檢驗(yàn)6步驟

1)確定要進(jìn)行檢驗(yàn)的假設(shè)

2)選擇檢驗(yàn)統(tǒng)計(jì)量

3)確定用于做決策的拒絕域(顯著性水平?jīng)Q定)

顯著性水平用α表示,表示你希望在觀察結(jié)果的不可能程度達(dá)到多大程度時(shí)拒絕H0。(小概率事件發(fā)生時(shí)拒絕 H0,你認(rèn)為概率多小為小概率事件)

4)求出檢驗(yàn)統(tǒng)計(jì)量的p值

p值是取得樣本中的各種結(jié)果或取得拒絕域方向上的更極端的結(jié)果的概率。

5)查看樣本結(jié)果是否位于拒絕域內(nèi)

6)做出決策

2.錯(cuò)誤類型

一、第一類錯(cuò)誤:原假設(shè)為真,錯(cuò)誤的拒絕;

發(fā)生第一類錯(cuò)誤的概率等于結(jié)果位于拒絕域的概率,=α

二、第二類錯(cuò)誤:原假設(shè)為假,錯(cuò)誤的接受。

發(fā)生第二類錯(cuò)誤的概率=β,計(jì)算更復(fù)雜

計(jì)算步驟:

  1)檢查是否擁有H1的特定數(shù)值

  H1必須規(guī)定確切的P值,否則無法計(jì)算概率。

  2)求檢驗(yàn)拒絕域以外的數(shù)值范圍

  通過H0的拒絕域進(jìn)行逆標(biāo)準(zhǔn)化得到--接收域的數(shù)值范圍

  3)假定H1為真,求得到這些數(shù)值的概率

  利用H1重新標(biāo)準(zhǔn)化,得到數(shù)值對(duì)應(yīng)的概率。

  這個(gè)概率就是第二類錯(cuò)誤的概率。

3.假設(shè)檢驗(yàn)的功效

在H0為假的情況下拒絕H0的概率=1-β

第14章 {\chi}^2分布

1.兩個(gè)主要用途

1)檢驗(yàn)擬合優(yōu)度,檢驗(yàn)一組給定的數(shù)據(jù)與指定的分布的吻合程度。

2)檢驗(yàn)兩個(gè)變量的獨(dú)立性。

2.檢驗(yàn)統(tǒng)計(jì)量

{\chi}^2=\sum \frac{(O-E)^2}{E}

O為觀察頻數(shù),E為期望頻數(shù)。

3.自由度v

X^2 \sim {\chi}^2(v)
當(dāng)v=1或2,圖形類似1/x
當(dāng)v>2時(shí),圖形先增后減;當(dāng)v很大時(shí),圖形接近正態(tài)分布。
v=組數(shù)-限制數(shù)

4.顯著性水平

{\chi}_{\alpha }^{2}(v)

5.假設(shè)檢驗(yàn)6步驟:

1)確定要進(jìn)行檢驗(yàn)的假設(shè)以及備擇假設(shè)

原假設(shè):**符合某分布

2)求出期望頻數(shù)和自由度

3)確定用于做決策的拒絕域

根據(jù)v和α確定拒絕域

4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 {\chi}^2

5)查看檢驗(yàn)統(tǒng)計(jì)量是否位于拒絕域以內(nèi)

6)做出決策

6. {\chi}^2分布適用于二項(xiàng)分布、泊松分布、正態(tài)分布等,需要根據(jù)參數(shù)已知或未知調(diào)節(jié)v的數(shù)值,

7.獨(dú)立性檢驗(yàn)

其中期望頻數(shù)=行合計(jì)*列合計(jì)/總和

v=(h-1)*(k-1), h為行,k為列

第15章 相關(guān)與回歸

1.誤差平方和

SSE=\sum (y-\hat{y})^2

2.相關(guān)系數(shù):

y=a+bx

公式1:

r=\frac{bs_x}{s_y}

{bs_x}為x的樣本標(biāo)準(zhǔn)差,{bs_y}為y的樣本標(biāo)準(zhǔn)差。

公式2:
r^2=\frac{\sum (y-\hat{y})^2}{\sum (y-\bar{y})^2}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容