假設(shè)檢驗(yàn)也叫顯著性檢驗(yàn),是以小概率反證法的邏輯推理,判斷假設(shè)是否成立的統(tǒng)計(jì)方法,它首先假設(shè)樣本對(duì)應(yīng)的總體參數(shù)(或分布)與某個(gè)已知總體參數(shù)(或分布)相同,然后根據(jù)統(tǒng)計(jì)量的分布規(guī)律來分析樣本數(shù)據(jù),利用樣本信息判斷是否支持這種假設(shè),并對(duì)檢驗(yàn)假設(shè)做出取舍抉擇,做出的結(jié)論是概率性的,不是絕對(duì)的肯定或否定。
1、T檢驗(yàn)的概念
T檢驗(yàn)是用于兩個(gè)樣本(或樣本與群體)平均值差異程度的檢驗(yàn)方法。它是用T分布理論來推斷差異發(fā)生的概率,從而判定兩個(gè)平均數(shù)的差異是否顯著。
T檢驗(yàn)的適用條件為樣本分布符合正態(tài)分布。
T檢驗(yàn)的應(yīng)用條件:
- 當(dāng)樣本例數(shù)較小時(shí),要求樣本取自正態(tài)總體;
- 做兩樣本均數(shù)比較時(shí),還要求兩樣本的總體方差相
等。
T檢驗(yàn)的用途:(1)樣本均數(shù)與群體均數(shù)的比較;(2)兩樣本均數(shù)的比較。
2、假設(shè)檢驗(yàn)的步驟
假設(shè)檢驗(yàn)可以分為三步:(1)建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn);(2)選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量;(3)確定P值和做出推斷結(jié)論。
2.1 建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)
檢驗(yàn)假設(shè)是針對(duì)總體特征而言,包括相互對(duì)立的兩個(gè)方面,即兩種假設(shè):一種是無效假設(shè)或稱原假設(shè)、零假設(shè),符號(hào)為H0,它是要否定的假設(shè);另一種是備擇假設(shè),記為H1,它是H0的對(duì)立面。二者是從反證法的思想提出的, H1和H0是相互聯(lián)系、又相互對(duì)立的假設(shè)。
假設(shè)檢驗(yàn)還需根據(jù)不同研究目的事先設(shè)置是否拒絕原假設(shè)的判斷標(biāo)準(zhǔn),即檢驗(yàn)水準(zhǔn)。檢驗(yàn)水準(zhǔn)也稱顯著性水準(zhǔn),它指無效假設(shè)H0為真,但被錯(cuò)誤地拒絕的一個(gè)小概率值,一般取檢驗(yàn)水準(zhǔn)α =0.05。
單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)
? 在進(jìn)行t檢驗(yàn)時(shí),如果其目的在于檢驗(yàn)兩個(gè)總體均數(shù)是否相等,即為雙側(cè)檢驗(yàn)。 例如檢驗(yàn)?zāi)撤N新降壓藥與常用降壓藥效力是否相同?就是說,新藥效力可能比舊藥好,也可能比舊藥差,或者力相同,都有可能。
? 如果我們已知新藥效力不可能低于舊藥效力,例如磺胺藥+磺胺增效劑從理論上推知其效果不可能低于單用磺胺藥,這時(shí),無效假設(shè)為H0:μ1=μ2, 備擇假設(shè)為H1: μ1>μ2 , 統(tǒng)計(jì)上稱為單側(cè)檢驗(yàn)。
2.2 選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量
要根據(jù)研究設(shè)計(jì)的類型和統(tǒng)計(jì)推斷的目的選用不同的檢驗(yàn)方法。如成組設(shè)計(jì)的兩樣本均數(shù)的比較用t檢驗(yàn),多個(gè)樣本均數(shù)的比較用F檢驗(yàn)。
檢驗(yàn)統(tǒng)計(jì)量是用于抉擇是否拒絕H0的統(tǒng)計(jì)量(因此在我們確定檢驗(yàn)假設(shè)H0,H1時(shí),檢驗(yàn)方法和檢驗(yàn)統(tǒng)計(jì)量就已經(jīng)確定了),其統(tǒng)計(jì)分布在統(tǒng)計(jì)推斷中是至關(guān)重要的,不同的檢驗(yàn)方法要用不同的方式計(jì)算現(xiàn)有樣本的檢驗(yàn)統(tǒng)計(jì)量值。
2.3 確定P值和做出推斷結(jié)論
這里的P值是指由H0成立時(shí)的檢驗(yàn)統(tǒng)計(jì)量出現(xiàn)在由樣本計(jì)算出來的檢驗(yàn)統(tǒng)計(jì)量的末端或更末端處的概率值。
當(dāng)P≤ α?xí)r,結(jié)論為按所取檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,這樣做出結(jié)論的理由是:在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值的概率P≤ α ,是小概率事件,這在一次抽樣中是不大可能發(fā)生的,即現(xiàn)有樣本信息不支持H0因而拒絕它;若P>α,即樣本信息支持H0,就沒有理由拒絕它,此時(shí)只好接受它。
假設(shè)檢驗(yàn)的兩類錯(cuò)誤
Ⅰ型錯(cuò)誤,第一類錯(cuò)誤、假陽性錯(cuò)誤,就是在假設(shè)檢驗(yàn)作推斷結(jié)論時(shí),拒絕了實(shí)際上是正確的原假設(shè)H0,其概率用α表示。(拒絕正確)
Ⅰ型錯(cuò)誤是針對(duì)原假設(shè)而言的, α就是事先規(guī)定 的 允 許 犯 Ⅰ 型 錯(cuò) 誤 的 概 率 值 , 如 規(guī) 定α=0.05,意味著在某特定總體抽樣, 100次拒絕H0的假設(shè)檢驗(yàn)中,最多有5次允許發(fā)生第一類錯(cuò)誤。與此相應(yīng),推斷正確的可能性為1-α, 1-α又稱為可信度。
Ⅱ型錯(cuò)誤,第二類錯(cuò)誤、假陰性錯(cuò)誤, 即接受實(shí)際上是不成立的H0。就是無效假設(shè)原本是不正確的,但所算得的統(tǒng)計(jì)量不足以拒絕它,錯(cuò)誤地得出了無差別的結(jié)論。(接受錯(cuò)誤)
Ⅱ型錯(cuò)誤是針對(duì)備擇假設(shè)而言的,其概率值用β表示。β值的大小一般未知,只有在不
同總體特征已知的基礎(chǔ)上,按預(yù)定的α和n才能做出估算。
| H0 | H0 | |
|---|---|---|
| True | False | |
| Accept | OK | II Error |
| Reject | I Error | OK |
3 T檢驗(yàn)例子
3.1 樣本與總體均數(shù)的比較
大量檢測(cè)已知正常人血漿載脂蛋白E( apo E)總體平均水平為4.15mmol/L。某醫(yī)師經(jīng)抽樣測(cè)得41例陳舊性心機(jī)梗死患者的血漿載脂蛋白E平均濃度為5.22mmol/L,標(biāo)準(zhǔn)差為1.61mmol/L。據(jù)此能否認(rèn)為陳舊性心肌梗死患者的血漿載脂蛋白E平均濃度與正常人的平均濃度不一致?
(1)建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)。H0: μ=μ0,H1: μ≠μ0,α=0.05,雙側(cè)檢驗(yàn);


3.2 配對(duì)設(shè)計(jì)定量資料的t 檢驗(yàn)
? 配對(duì)設(shè)計(jì)的t檢驗(yàn)研究的是差值均數(shù)(樣本均數(shù))與理論上的差值總體均數(shù)的比較。
? 可將配對(duì)設(shè)計(jì)資料的假設(shè)檢驗(yàn)視為樣本均數(shù)與總體均數(shù)μd=0的比較。據(jù)定理:
? 首先計(jì)算出各對(duì)差值d的均數(shù)。當(dāng)兩種處理結(jié)果無差別或某種處理不起作用時(shí),理論上差值d的總體均數(shù)μd=0。
將大白鼠配成8對(duì),每對(duì)分別飼以正常飼料和缺乏維生素E飼料,測(cè)得兩組大白鼠肝中維生素A的含量,試比較兩組大白鼠中維生素A的含量有無差別。
| 大白鼠配對(duì)號(hào) | 正常飼料組 | 維生素E缺乏組 | 差數(shù)d |
|---|---|---|---|
| 1 | 3550 | 2450 | 1100 |
| 2 | 2000 | 2400 | -400 |
| 3 | 3000 | 1800 | 1200 |
| 4 | 3950 | 3200 | 750 |
| 5 | 3800 | 3250 | 550 |
| 6 | 3750 | 2700 | 1050 |
| 7 | 3450 | 2500 | 950 |
| 8 | 3050 | 1750 | 1300 |
| Mean | 3318.75 | 2506.25 | 812.5 |
(1)建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)。H0: μd=0,H1: μd≠0,α=0.05,雙側(cè)檢驗(yàn);

量有差別。正常飼料組比缺乏維生素E飼料組的含量要高。
4、T檢驗(yàn)類型
t檢驗(yàn)有多種類型,可以分為只有一組樣本的單體檢驗(yàn)和有兩組樣本的雙體檢驗(yàn)。單體檢驗(yàn)用于檢驗(yàn)樣本的分布期望是否等于某個(gè)值。雙體檢驗(yàn)用于檢驗(yàn)兩組樣本的分布期望是否相等,又分為配對(duì)雙體檢驗(yàn)和非配對(duì)雙體檢驗(yàn)。配對(duì)雙體檢驗(yàn)的兩組樣本數(shù)據(jù)是一一對(duì)應(yīng)的,而非配對(duì)雙體檢驗(yàn)的兩組數(shù)據(jù)則是獨(dú)立的。比如藥物實(shí)驗(yàn)中,配對(duì)雙體檢驗(yàn)適用于觀察同一組人服用藥物之前和之后,非配對(duì)雙體檢驗(yàn)適用于一組服用藥物而一組不服用藥物。
1、單體檢驗(yàn)
單體檢驗(yàn)是針對(duì)一組樣本的假設(shè)檢驗(yàn)。零假設(shè)為H0: μ=μ0。統(tǒng)計(jì)量服從自由度為n-1的 T 分布。

2、配對(duì)雙體檢驗(yàn)

3、非配對(duì)雙體檢驗(yàn)
非配對(duì)雙體檢驗(yàn)針對(duì)獨(dú)立的兩組樣本。非配對(duì)雙體檢驗(yàn)假設(shè)兩組樣本是從不同的正態(tài)分布采樣出來的。根據(jù)兩個(gè)正態(tài)分布的標(biāo)準(zhǔn)差是否相等,非配對(duì)雙體檢驗(yàn)又可以分兩類。一種是分布標(biāo)準(zhǔn)差相等的情況。零假設(shè)是兩組樣本的分布期望相等,統(tǒng)計(jì)量 T 服從自由度為 n1+n2-2的T分布。

另一種是分布標(biāo)準(zhǔn)差不相等的情況。零假設(shè)也是兩組樣本的分布期望相等,統(tǒng)計(jì)量 T 服從 T 分布。


思考
由于每次抽樣的樣本平均值都是圍繞著群體期望值分布,因此我們認(rèn)為只要某次抽樣平均值在接受零假設(shè)的區(qū)間內(nèi),我們便接受零假設(shè)。
