假設(shè)檢驗(yàn)的兩種方式及兩類錯誤

一、假設(shè)檢驗(yàn)的兩種方式

  • 拒絕域檢驗(yàn)
    依據(jù)顯著性水平α和構(gòu)造統(tǒng)計量的分布形態(tài),確定拒絕域范圍。計算樣本統(tǒng)計值,看是否落在拒絕域內(nèi),如果落在拒絕域內(nèi),則拒絕原假設(shè)。
  • P值檢驗(yàn)
    P值為,當(dāng)假設(shè)原假設(shè)(H0)為真時,所得到的樣本觀測結(jié)果或更極端結(jié)果出現(xiàn)的概率。如果該值小于顯著性水平,則拒絕原假設(shè)。
    P值的3個影響因素:
    1)樣本觀測值與總體參數(shù)的差異
    2)樣本的個數(shù)
    3)被假設(shè)參數(shù)的總體分布
  • 拒絕域檢驗(yàn)和P值檢驗(yàn)比較
    1)拒絕域的優(yōu)點(diǎn)是進(jìn)行決策的邊界明顯,但是進(jìn)行決策面臨的風(fēng)險也是籠統(tǒng)的
    2)P值檢驗(yàn)反映了樣本觀測值和總體參數(shù)不一致的概率,可以提供更豐富的信息。同時,可以依據(jù)不同的P值和顯著性水平,決定是否拒絕原假設(shè)。

二、兩類錯誤

  • α錯誤或棄真錯誤:原假設(shè)H0為真,我們卻拒絕了原假設(shè)。
  • β錯誤或取偽錯誤:原假設(shè)H0為假,我們卻接受了原假設(shè)。
    注意:α+β≠1。在樣本量一定的情況下,不可能同時減小兩類錯誤;如果想同時減小兩類錯誤,只能增加樣本量;一般情況下,首先控制α錯誤,主要原因是,原假設(shè)H0是什么常常是明確的。

三、兩類錯誤與貝葉斯公式

例子:現(xiàn)研發(fā)了一種用于臨床上治療癌癥的藥物,為了檢測該藥物對癌癥治療是否有效果,抽取樣本通過臨床試驗(yàn)來觀察該藥物的效果。假設(shè)該藥物在實(shí)際無效的情況下,由于樣本的隨機(jī)性通過試驗(yàn)判斷藥物為有效的概率為5%;藥物在實(shí)際有效的情況下,通過試驗(yàn)可以正確識別出藥物為有效的概率是90%。假設(shè)由于醫(yī)藥水平所限,一般用于治療癌癥的藥物有效性在10%。那么,如果該藥物在試驗(yàn)過程中被判定為有效,它實(shí)際對治療癌癥確實(shí)有效的概率是多少?

分析:通過假設(shè)檢驗(yàn)的方式來判定一種藥物是否有效,原假設(shè)為:該藥物對治療癌癥無效果;備擇假設(shè)為:該藥物對治療癌癥有效果。由下表可知,在原假設(shè)為真的情況下,結(jié)果為顯著(即判定藥物有效)的概率為5%,這也是第一類錯誤α(醫(yī)學(xué)上稱假陽);在備注假設(shè)為真的情況下,結(jié)果不顯著(即判定藥物無效)的概率是10%,這就是對應(yīng)的第二類錯誤β(醫(yī)學(xué)上稱假陰)。


在試驗(yàn)結(jié)果顯著(即判定藥物是有效的)的條件下,它實(shí)際藥物效果有效的概率計算采用貝葉斯公式:
P(實(shí)際藥物有效 | 結(jié)果顯著) = \frac{P(實(shí)際藥物有效)* P(結(jié)果顯著 | 實(shí)際藥物有效)}{P(實(shí)際藥物有效)* P(結(jié)果顯著 | 實(shí)際藥物有效)+ P(實(shí)際藥物無效)* P(結(jié)果顯著 | 實(shí)際藥物無效)}
最終得到結(jié)果為66.7%??梢姡绻ㄟ^試驗(yàn)判定為有治療效果的100種藥物中,只有不到67種是真正有效果的。這是因?yàn)橐环N藥物它本身對治療癌癥有實(shí)際效果的概率太低了,即先驗(yàn)概率p(實(shí)際藥物有效)太小了,即使似然概率p(結(jié)果顯著|實(shí)際藥物有效)很大,整體概率也偏小。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容