一、假設(shè)檢驗(yàn)的兩種方式
- 拒絕域檢驗(yàn)
依據(jù)顯著性水平α和構(gòu)造統(tǒng)計量的分布形態(tài),確定拒絕域范圍。計算樣本統(tǒng)計值,看是否落在拒絕域內(nèi),如果落在拒絕域內(nèi),則拒絕原假設(shè)。 - P值檢驗(yàn)
P值為,當(dāng)假設(shè)原假設(shè)(H0)為真時,所得到的樣本觀測結(jié)果或更極端結(jié)果出現(xiàn)的概率。如果該值小于顯著性水平,則拒絕原假設(shè)。
P值的3個影響因素:
1)樣本觀測值與總體參數(shù)的差異
2)樣本的個數(shù)
3)被假設(shè)參數(shù)的總體分布 - 拒絕域檢驗(yàn)和P值檢驗(yàn)比較
1)拒絕域的優(yōu)點(diǎn)是進(jìn)行決策的邊界明顯,但是進(jìn)行決策面臨的風(fēng)險也是籠統(tǒng)的
2)P值檢驗(yàn)反映了樣本觀測值和總體參數(shù)不一致的概率,可以提供更豐富的信息。同時,可以依據(jù)不同的P值和顯著性水平,決定是否拒絕原假設(shè)。
二、兩類錯誤
- α錯誤或棄真錯誤:原假設(shè)H0為真,我們卻拒絕了原假設(shè)。
- β錯誤或取偽錯誤:原假設(shè)H0為假,我們卻接受了原假設(shè)。
注意:α+β≠1。在樣本量一定的情況下,不可能同時減小兩類錯誤;如果想同時減小兩類錯誤,只能增加樣本量;一般情況下,首先控制α錯誤,主要原因是,原假設(shè)H0是什么常常是明確的。
三、兩類錯誤與貝葉斯公式
例子:現(xiàn)研發(fā)了一種用于臨床上治療癌癥的藥物,為了檢測該藥物對癌癥治療是否有效果,抽取樣本通過臨床試驗(yàn)來觀察該藥物的效果。假設(shè)該藥物在實(shí)際無效的情況下,由于樣本的隨機(jī)性通過試驗(yàn)判斷藥物為有效的概率為5%;藥物在實(shí)際有效的情況下,通過試驗(yàn)可以正確識別出藥物為有效的概率是90%。假設(shè)由于醫(yī)藥水平所限,一般用于治療癌癥的藥物有效性在10%。那么,如果該藥物在試驗(yàn)過程中被判定為有效,它實(shí)際對治療癌癥確實(shí)有效的概率是多少?
分析:通過假設(shè)檢驗(yàn)的方式來判定一種藥物是否有效,原假設(shè)為:該藥物對治療癌癥無效果;備擇假設(shè)為:該藥物對治療癌癥有效果。由下表可知,在原假設(shè)為真的情況下,結(jié)果為顯著(即判定藥物有效)的概率為5%,這也是第一類錯誤α(醫(yī)學(xué)上稱假陽);在備注假設(shè)為真的情況下,結(jié)果不顯著(即判定藥物無效)的概率是10%,這就是對應(yīng)的第二類錯誤β(醫(yī)學(xué)上稱假陰)。

在試驗(yàn)結(jié)果顯著(即判定藥物是有效的)的條件下,它實(shí)際藥物效果有效的概率計算采用貝葉斯公式:
最終得到結(jié)果為66.7%??梢姡绻ㄟ^試驗(yàn)判定為有治療效果的100種藥物中,只有不到67種是真正有效果的。這是因?yàn)橐环N藥物它本身對治療癌癥有實(shí)際效果的概率太低了,即先驗(yàn)概率p(實(shí)際藥物有效)太小了,即使似然概率p(結(jié)果顯著|實(shí)際藥物有效)很大,整體概率也偏小。