臨床試驗統(tǒng)計學之——總 I 類錯誤率(FWER)解讀

總 I 類錯誤率(Family-Wise Error Rate, FWER)是統(tǒng)計分析中一個重要的概念,通常用于多重假設檢驗中。它指的是在進行了一組多個比較或測試時,至少出現(xiàn)一個 I 類錯誤的概率。

I 類錯誤(Type I error)是指錯誤地拒絕了真實的零假設(即錯誤地認為有顯著性)。

https://i-blog.csdnimg.cn/blog_migrate/9aa613686cfde27a4e888162b1a9f919.jpeg

FWER 的定義

假設我們在進行 m?次假設檢驗,每次檢驗的顯著性水平為 α???I 類錯誤率 FWER 可以用以下公式表示:

FWER=P(至少一個原假設被錯誤拒絕)=1?P(所有原假設均未被拒絕)

如果每個假設檢驗都是獨立的,且每個檢驗的顯著性水平均為 α,那么可以表示為:

FWER=1?(1?α)^m

在這里,P(所有原假設均未被拒絕)=(1?α)^m,即所有檢驗均未出現(xiàn) I 類錯誤的概率。


舉例說明

例1:假設你是一名藥物開發(fā)人員,正在測試一種新藥對三種不同疾病的療效。你進行以下三個假設檢驗:

a、對疾病 A 的治療效果檢驗(假設檢驗 1)

b、對疾病 B 的治療效果檢驗(假設檢驗 2)

c、對疾病 C 的治療效果檢驗(假設檢驗 3)

假設每個檢驗的顯著性水平 α?設置為 0.05。你會想知道在這些比較中,是否會產(chǎn)生至少一個 I 類錯誤。

計算 FWER

1、每個檢驗均未拒絕原假設的概率是:

P(原假設未被拒絕)=1?α=1?0.05=0.95

2、所有三個檢驗均未拒絕原假設的概率是:

P(所有原假設均未被拒絕)=(1?α)^3=0.95^3≈0.8574

3、至少一個原假設被錯誤拒絕的概率(即 FWER)為:

FWER=1?P(所有原假設均未被拒絕)=1?0.8574≈0.1426

因此,這組檢驗中,總 I 類錯誤率 FWER 約為 0.1426,也就是說在這些檢驗中,約有 14.26% 的概率至少會出現(xiàn)一次 I 類錯誤。


例2:假設你正在開發(fā)一種新藥?藥物 X?用于治療高血壓,并想要將其與已有的?藥物 Y?進行比較。研究的主要目的是評估藥物 X 的療效是否優(yōu)于藥物 Y。

試驗設計

? ??目標:比較藥物 X 和藥物 Y 的療效。

? ??研究對象:招募 100 名高血壓患者,隨機分為兩組:

????????組 A:接受藥物 X (50 名患者)

????????組 B:接受藥物 Y (50 名患者)

? ??觀察期:試驗持續(xù) 12 周,每周評估患者的血壓水平

? ??主要終點:12 周后兩組的收縮壓(SBP)變化。

期中分析

為了評估藥物 X 的早期療效或者安全性,計劃在試驗進行到 6 周時進行一次期中分析。此時將檢查兩個組之間的療效差異。

統(tǒng)計分析方法

? ??假設檢驗

? ??????零假設(H0):藥物 X 的療效不優(yōu)于藥物 Y(即兩者的效果相同)。

? ??????備擇假設(H1):藥物 X 的療效優(yōu)于藥物 Y。

? ??????顯著性水平:設定為?α = 0.05。如果期中分析的p值小于 0.05,則可以拒絕零假設。

樣本量計算

設定期中分析也會對最終分析的樣本量產(chǎn)生影響,期中分析可能需要進行 Bonferroni 校正,假設我們進行一次期中分析和最終分析。那么新的顯著性水平可以設定為α'=0.05/2=0.025

數(shù)據(jù)分析

在6周時收集兩組的 SBP 數(shù)值,進行 t 檢驗或 Mann-Whitney U 檢驗(根據(jù)數(shù)據(jù)分布情況)來比較兩組之間的差異。

假設結(jié)果

假設期中分析后,研究結(jié)果如下:

組 A(藥物 X):平均 SBP 變化是 -20 mmHg

組 B(藥物 Y):平均 SBP 變化是 -10 mmHg

統(tǒng)計檢驗結(jié)果的 p 值為 0.015。

結(jié)果解釋

由于 p 值(0.015)小于調(diào)整后的顯著性水平(0.025),因此在期中分析中拒絕零假設,表明藥物 X 在六周的療效明顯優(yōu)于藥物 Y。

研究后續(xù)

繼續(xù)試驗:基于期中分析的正面結(jié)果,研究小組決定繼續(xù)進行整個 12 周的研究以觀察長期效果和安全性。

監(jiān)測安全性:同時高度關(guān)注藥物的副作用,在后續(xù)的每次隨訪中繼續(xù)評估藥物的安全性。

這種通過期中分析的設計,允許研究者在試驗進行到一半時對初步的數(shù)據(jù)結(jié)果進行評估。這為必要的調(diào)整提供了機會,并且可以根據(jù)早期效果決定是否繼續(xù)或調(diào)整研究方向。同時,期中分析的設計需要考慮多重檢驗問題,以避免 I 類錯誤的發(fā)生。通過這種方式,藥物開發(fā)的效率和安全保障得以提高。


FWER 的控制

在多個假設檢驗中,控制 FWER 是非常重要的,以減少由于多重比較引起的偽陽性結(jié)果。常用的方法有:

Bonferroni 校正:將每個個別檢驗的顯著性水平調(diào)整為 α/m,以控制 FWER。

Holm 法:一種更靈活的方法,在保留檢驗的靈活性同時控制 FWER。

總 I 類錯誤率 FWER 是多重假設檢驗中用于評估整體錯誤概率的一個重要指標。通過適當?shù)恼{(diào)整和控制方法,可以有效降低在多個比較中因隨機性造成的錯誤拒絕現(xiàn)象。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容