總 I 類錯誤率(Family-Wise Error Rate, FWER)是統(tǒng)計分析中一個重要的概念,通常用于多重假設檢驗中。它指的是在進行了一組多個比較或測試時,至少出現(xiàn)一個 I 類錯誤的概率。
I 類錯誤(Type I error)是指錯誤地拒絕了真實的零假設(即錯誤地認為有顯著性)。

FWER 的定義
假設我們在進行 m?次假設檢驗,每次檢驗的顯著性水平為 α???I 類錯誤率 FWER 可以用以下公式表示:
FWER=P(至少一個原假設被錯誤拒絕)=1?P(所有原假設均未被拒絕)
如果每個假設檢驗都是獨立的,且每個檢驗的顯著性水平均為 α,那么可以表示為:
FWER=1?(1?α)^m
在這里,P(所有原假設均未被拒絕)=(1?α)^m,即所有檢驗均未出現(xiàn) I 類錯誤的概率。
舉例說明
例1:假設你是一名藥物開發(fā)人員,正在測試一種新藥對三種不同疾病的療效。你進行以下三個假設檢驗:
a、對疾病 A 的治療效果檢驗(假設檢驗 1)
b、對疾病 B 的治療效果檢驗(假設檢驗 2)
c、對疾病 C 的治療效果檢驗(假設檢驗 3)
假設每個檢驗的顯著性水平 α?設置為 0.05。你會想知道在這些比較中,是否會產(chǎn)生至少一個 I 類錯誤。
計算 FWER
1、每個檢驗均未拒絕原假設的概率是:
P(原假設未被拒絕)=1?α=1?0.05=0.95
2、所有三個檢驗均未拒絕原假設的概率是:
P(所有原假設均未被拒絕)=(1?α)^3=0.95^3≈0.8574
3、至少一個原假設被錯誤拒絕的概率(即 FWER)為:
FWER=1?P(所有原假設均未被拒絕)=1?0.8574≈0.1426
因此,這組檢驗中,總 I 類錯誤率 FWER 約為 0.1426,也就是說在這些檢驗中,約有 14.26% 的概率至少會出現(xiàn)一次 I 類錯誤。
例2:假設你正在開發(fā)一種新藥?藥物 X?用于治療高血壓,并想要將其與已有的?藥物 Y?進行比較。研究的主要目的是評估藥物 X 的療效是否優(yōu)于藥物 Y。
試驗設計
? ??目標:比較藥物 X 和藥物 Y 的療效。
? ??研究對象:招募 100 名高血壓患者,隨機分為兩組:
????????組 A:接受藥物 X (50 名患者)
????????組 B:接受藥物 Y (50 名患者)
? ??觀察期:試驗持續(xù) 12 周,每周評估患者的血壓水平
? ??主要終點:12 周后兩組的收縮壓(SBP)變化。
期中分析
為了評估藥物 X 的早期療效或者安全性,計劃在試驗進行到 6 周時進行一次期中分析。此時將檢查兩個組之間的療效差異。
統(tǒng)計分析方法
? ??假設檢驗:
? ??????零假設(H0):藥物 X 的療效不優(yōu)于藥物 Y(即兩者的效果相同)。
? ??????備擇假設(H1):藥物 X 的療效優(yōu)于藥物 Y。
? ??????顯著性水平:設定為?α = 0.05。如果期中分析的p值小于 0.05,則可以拒絕零假設。
樣本量計算:
設定期中分析也會對最終分析的樣本量產(chǎn)生影響,期中分析可能需要進行 Bonferroni 校正,假設我們進行一次期中分析和最終分析。那么新的顯著性水平可以設定為α'=0.05/2=0.025
數(shù)據(jù)分析:
在6周時收集兩組的 SBP 數(shù)值,進行 t 檢驗或 Mann-Whitney U 檢驗(根據(jù)數(shù)據(jù)分布情況)來比較兩組之間的差異。
假設結(jié)果
假設期中分析后,研究結(jié)果如下:
組 A(藥物 X):平均 SBP 變化是 -20 mmHg
組 B(藥物 Y):平均 SBP 變化是 -10 mmHg
統(tǒng)計檢驗結(jié)果的 p 值為 0.015。
結(jié)果解釋
由于 p 值(0.015)小于調(diào)整后的顯著性水平(0.025),因此在期中分析中拒絕零假設,表明藥物 X 在六周的療效明顯優(yōu)于藥物 Y。
研究后續(xù)
繼續(xù)試驗:基于期中分析的正面結(jié)果,研究小組決定繼續(xù)進行整個 12 周的研究以觀察長期效果和安全性。
監(jiān)測安全性:同時高度關(guān)注藥物的副作用,在后續(xù)的每次隨訪中繼續(xù)評估藥物的安全性。
這種通過期中分析的設計,允許研究者在試驗進行到一半時對初步的數(shù)據(jù)結(jié)果進行評估。這為必要的調(diào)整提供了機會,并且可以根據(jù)早期效果決定是否繼續(xù)或調(diào)整研究方向。同時,期中分析的設計需要考慮多重檢驗問題,以避免 I 類錯誤的發(fā)生。通過這種方式,藥物開發(fā)的效率和安全保障得以提高。
FWER 的控制
在多個假設檢驗中,控制 FWER 是非常重要的,以減少由于多重比較引起的偽陽性結(jié)果。常用的方法有:
Bonferroni 校正:將每個個別檢驗的顯著性水平調(diào)整為 α/m,以控制 FWER。
Holm 法:一種更靈活的方法,在保留檢驗的靈活性同時控制 FWER。
總 I 類錯誤率 FWER 是多重假設檢驗中用于評估整體錯誤概率的一個重要指標。通過適當?shù)恼{(diào)整和控制方法,可以有效降低在多個比較中因隨機性造成的錯誤拒絕現(xiàn)象。