生統(tǒng)筆記5-多重檢驗(yàn)矯正

1. Bonferroni 矯正:

原理:將顯著性水平(α)除以檢驗(yàn)的數(shù)量 m。每個(gè)檢驗(yàn)的閾值為α/m。這種方法簡(jiǎn)單,但在檢驗(yàn)數(shù)量較多時(shí)可能過(guò)于保守。

2. Holm-Bonferroni 方法:

原理:對(duì) p 值進(jìn)行排序,并逐個(gè)檢驗(yàn)。第 i 個(gè) p 值的顯著性水平為 α/(m?i+1)。與 Bonferroni 方法相比,它更加靈活,減少了對(duì)顯著性水平的過(guò)度保守。

3. False Discovery Rate (FDR) 控制方法

  • FDR(錯(cuò)誤發(fā)現(xiàn)率,F(xiàn)alse Discovery Rate)指的是在多個(gè)假設(shè)檢驗(yàn)中,被錯(cuò)誤拒絕的零假設(shè)所占的比例。具體來(lái)說(shuō),它衡量的是在所有被認(rèn)為顯著的結(jié)果中,實(shí)際上是錯(cuò)誤的結(jié)果所占的比例。

  • 舉例:比如有1000個(gè)統(tǒng)計(jì)檢驗(yàn),其中800個(gè)檢驗(yàn)是顯著的,但實(shí)際上真正顯著的只有700個(gè),有100個(gè)是錯(cuò)誤的發(fā)現(xiàn),則FDR = 1/8

一般用Benjamini-Hochberg (BH) 方法:

  1. 進(jìn)行m個(gè)假設(shè)檢驗(yàn),得到m個(gè) p 值

  2. 將 p 值按從小到大排列

  3. 設(shè)定期望的假發(fā)現(xiàn)率(FDR)水平 α,通常是 0.05

  4. 對(duì)于排序后的p值,計(jì)算其對(duì)應(yīng)的閾值。例如對(duì)于第i個(gè)p值,閾值為 i/m×α

  5. 對(duì)排序后的每個(gè)p值及其對(duì)應(yīng)閾值進(jìn)行比較,小于閾值的認(rèn)為是顯著

FDR與p值的相互轉(zhuǎn)換

為了在同一閾值下控制FDR,可以對(duì)每個(gè)p值計(jì)算其對(duì)應(yīng)q值:qi = pi * m/i,再將q值與α進(jìn)行比較即可

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容