3 顯著性檢驗(yàn)

3.1 p值和z值

一般性假設(shè)檢驗(yàn)構(gòu)建拒絕域R_\alpha使得
Pr_ 0 \{ x \in R_\alpha \} = \alpha
對(duì)應(yīng)的p值為:


(R_\alpha是根據(jù)顯著性水平\alpha構(gòu)建的,而顯著的p(x)則根據(jù)包含x的最小區(qū)域計(jì)算的)

顯然p(x)越小越確定存在顯著差異,p值引入了更多信息。

Fisher’s scale of evidence for interpreting p-values

在H0下,p值服從均勻分布
H_0:P = p(x) \sim U(0, 1)
接下來將主要使用Z值而不是P值z(x) = \Phi^{-1}(p(x))
H_0:z(x) \sim \mathcal N(0, 1 )
z 值使我們能夠?qū)⒄龖B(tài)理論的力量用于解決大規(guī)模推理問題。
DTI數(shù)據(jù)例子

3.2 修正的p值和FWER

FWER = Pr \{ Reject\ any\ true\ H_ { 0 i } \}
控制流程目標(biāo)FWER \leq \alpha,經(jīng)典做法是Bonferroni邊界p_i \leq \alpha / N
如果我們認(rèn)為這是一種p值修正,則
\widetilde{p}_i = \{ min( Np_i, 1 ) \}
我們通過\widetilde{p}_i來判斷是否顯著。
如果x是測(cè)試數(shù)據(jù),FWER_\alpha(x)\alpha為目標(biāo)的控制流程,則
\widetilde{p}_i(x)= inf_\alpha \{ H_{0i} \ rejected \ by\ FWER_\alpha(x) \ \}
Holm控制過程為將p值排序后p_{(j)} \leq \frac{\alpha}{N - j + 1}
對(duì)應(yīng)修正后的p值為\widetilde{p}_i = \max_{ j \leq i }\{min((N - j + 1)p_{(j)}, 1) \}

從修正后的p值可以明顯看出,Holm過程優(yōu)于Bonferroni過程。

3.3 逐步算法

介紹幾種控制FWER的逐步算法。
step-down過程會(huì)現(xiàn)將p值排序p_{(1)} \leq p_{(2)}...\leq p_{(N)}。因此如果p_{i}被拒絕,則前面的p值也都會(huì)被拒絕。Holm方法是最早的例子之一。
通過closure principle可以將Bonferroni’s bound擴(kuò)展為Holm’s procedure
如果假設(shè)p值間獨(dú)立,可以得到Simes’ inequality,當(dāng)全為H0時(shí):
Pr \{ p_{(i)} \geq \frac{\alpha i }{N}\ for\ i = 1 ,2,..., N \} \geq 1 - \alpha
基于Simes’ inequality,Hochberg優(yōu)化Holm’s adjusted p-values為
\widetilde{p}_i = min( min_{j \geq i} \{ (N - i + 1 ) p_{(j)} \}, 1)
此方案要基于獨(dú)立前提,它是step-up過程

3.4 排列算法

Bonferroni bound的好處是不用關(guān)心p值得相關(guān)性,但是如果我們已知了相關(guān)性,這就變成了劣勢(shì)。Westfall和Young將相關(guān)性考慮后對(duì)Holm的過程進(jìn)行了優(yōu)化。
如果將p值排序p_{(1)} \leq p_{(2)} \leq...\leq p_{(N)},用r_1, r_2,...,r_N代表原始的下標(biāo):p_{(j)} = p_{r_j}
定義R_j = \{ r_j, r_{j+1} ,..., r_N \}(比p_{j}大的p值的原始下標(biāo)集合),且
\pi(j) = Pr_0 \{ \min_{ k \in R_j}(P_k) \leq p_{(j)} \}
此處(P_1, P_2, ...,P_N)表示在H0(complete null hypothesis)下觀測(cè)到(p_1, p_2, ...,p_N)的概率
Westfall–Young step-down min-p定義為
\widetilde{p}_i = \max_{j \leq i} \{ \pi(j) \}
根據(jù)Boole’s inequality
\pi_{(j)} \leq \sum_ {k \in R_j} Pr_0 \{ P_k \leq p_{(j)} \} = (N-j+1) p_{(j)}
說明效果好于Holm法。
由于p值計(jì)算相對(duì)麻煩,也可以用t值替換
\pi(j) = Pr_0 \{ \max_{ k \in R_j} (T_k) \geq t_{(j)} \} (3.38)

現(xiàn)在問題的關(guān)鍵是,如何計(jì)算(P_1, P_2, ...,P_N)?
帶回第2章的例子,X是一個(gè)6033 * 102的矩陣,X^*是對(duì)它重排列后的矩陣。
定義J^* = (j_1^*, j_2^*, ...,j_n^*),是一個(gè)將參加實(shí)驗(yàn)人員隨機(jī)排列后的順序,對(duì)應(yīng)的
x_{ij}^* = x_{iJ^*(j)}\ \ for\ \ j=1,2,...,n\ \ and \ \ i=1,2,...,N
仍然取前50個(gè)與后52個(gè)進(jìn)行計(jì)算,得到
T^* = (T_1^*,T_2^*,...,T_N^*)
重復(fù)上述過程B(較大的數(shù))輪,可以得到 (3.38)的估計(jì)值
\hat{\pi}(j) = \#\{ \max_{ k \in R_j} (T_k^*) \geq t_{(j)} \}/B
這種評(píng)估比較科學(xué)的原因:

  • 隨機(jī)排列X使計(jì)算的T來及相同的混合分布
  • 由于每次按病人隨機(jī)排列,保留了基因之間的相關(guān)性


3.5 其它控制標(biāo)準(zhǔn)

FWER是傳統(tǒng)多重檢驗(yàn)控制規(guī)則,但是還有其它,比如:
per comparison error rate: PCER = E{ 錯(cuò)誤拒絕數(shù) } / N
excepcted error rate: EER = E{錯(cuò)誤決策數(shù)(包含兩類錯(cuò)誤)} / N

Lehmann and Romano’s k-FWER criteria是FWER的變種,目標(biāo)是控制錯(cuò)誤拒絕零假設(shè)數(shù)不超過k,當(dāng)k等于1時(shí)等于傳統(tǒng)FWER。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容