多重假設(shè)檢驗(yàn)的三種常見方法計(jì)算

一般來說,當(dāng)p.value < 0.05時(shí),我們認(rèn)為犯錯(cuò)誤的概率很低,可以否定原假設(shè)。但是假如我們做了很多次實(shí)驗(yàn),比如10000次,那么犯錯(cuò)誤的次數(shù)可能能達(dá)到500次,我們要規(guī)避這么多的假陽性結(jié)果,就需要考慮多重假設(shè)檢驗(yàn)。

1. Bonferroni法

Bonferroni是最粗暴簡(jiǎn)單的方法,當(dāng) P value ≤ α/N時(shí),拒絕H0。理念是將閾值降低,盡量杜絕假陽性的存在,弊端就是可能會(huì)由于閾值太嚴(yán)格而導(dǎo)致陽性結(jié)果太少。

比如,有10000次實(shí)驗(yàn)時(shí),當(dāng) P value為0.05/10000 = 5e-6的時(shí)候,才有統(tǒng)計(jì)顯著性。

2. Holm法

其公式為:



target alpha level一般為0.05,橫軸中的rank是從小到大排序之后的序號(hào)。

比如:


圖中第四列alpha/m是Bonferroni法,第五列就是Holm法。圖中的k就是排名,當(dāng)原始p值 < alpha / (m - k + 1) 的值時(shí),我們認(rèn)為Holm校正之后仍然顯著。即原始p為0.003,0.005,0.012時(shí)顯著。

在R中調(diào)用Holm方法:

p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058), method = 'holm')

輸出:0.015 0.020 0.036 0.080 0.080

R中的結(jié)果是由于要直觀的與0.05 (alpha) 比較,所以輸出的值其實(shí)就是 p * (m - k + 1);當(dāng)出現(xiàn)第一個(gè)不顯著的p值時(shí)(0.080),則后邊的結(jié)果都是這個(gè)值了。

3. BH法

公式為:p * (n/i)。n是總數(shù),i是從小到大排序的名次。

p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058), method = 'BH')

輸出:0.0125 0.0125 0.0200 0.0500 0.0580 ; 前四位顯著。

另外有時(shí)候會(huì)出現(xiàn)相同p值的情況,比如:

p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058, 0.06), method = 'BH')

輸出: 0.015 0.015 0.024 0.060 0.060 0.060
前兩位數(shù)和后兩位數(shù)一樣。這是因?yàn)樽詈笠晃挥?jì)算出來為0.060, 但是倒數(shù)第二位直接計(jì)算是0.0696,如果數(shù)值比最后一位還要大的話,則賦值為上一位,即0.060。前兩位數(shù)也是同理 (避免出現(xiàn)原始p值更小但是校正后更大的情況)。

參考:http://www.compbio.dundee.ac.uk/user/mgierlinski/talks/p-values1/p-values8.pdf

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容