??????針對一個三階段的成組序貫設(shè)計,計劃在受試者分別入組30%、60%時進行第一次、第二次期中分析,受試者全部入組隨訪完成后進行最終分析。顯著性水平α設(shè)定為雙側(cè)0.05,檢驗效能β為0.2。通過SAS軟件計算(采用O'Brien-Fleming類型的α消耗函數(shù)),得到累計α消耗如下表所示:

???????首先需要明確,SAS輸出的是累計α消耗(Cumulative Alpha Spending)。根據(jù)alpha spending function的定義,各次分析時實際消耗的α計算如下:
??????????- ?? 第一次期中分析消耗的α: 0.00004 * 2 = 0.00008
??????????- ?? 第二次期中分析消耗的α: (0.00381 * 2) - (0.00004 * 2) = 0.00754
??????????- ?? 最終分析消耗的α: (0.02500 * 2) - (0.00381 * 2) = 0.04238
???????各次分析消耗的alpha分別為(0.00008, 0.00754, 0.04238)。此時,一個關(guān)鍵問題是:我們是否可以直接將(0.00008, 0.00754, 0.04238)作為判斷標準,與每次分析所得的P值進行比較?
???????這里就需要明確名義檢驗水平(nominal alpha)和 實際α消耗水平(actual alpha spending)的區(qū)別。
* 實際α消耗水平 (Actual Alpha Spending)
???????實際α消耗水平是指根據(jù)預先設(shè)定的α消耗函數(shù)計算得到的、每次分析時允許消耗的總體α的一部分。其統(tǒng)計學定義是,在H?為真的條件下,到第k次分析時首次拒絕H?的概率。
在成組序貫設(shè)計中,總體一類錯誤的定義為:
????????P(任意一次分析時拒絕H? | H?) = α,即:
??? ??? P(第一次分析時拒絕H?) + P(第二次分析拒絕H? & 第一次分析不拒絕H?) + ... =α
那么每次分析時消耗的α為:
第一次分析實際消耗的α = P(第一次分析時拒絕H? | H?) = 0.00008
第二次分析實際消耗的α = P(第一次分析未拒絕H? ∩ 第二次分析拒絕H? | H?) = 0.00754
最終分析時實際消耗的α = PP(前兩次分析均未拒絕H? ∩ 第三次分析拒絕H? | H?)= 0.04238
這三部分之和嚴格等于預先定義的總的α水平(0.00008 + 0.00754 + 0.04238 = 0.05)。
* 名義檢驗水平(Nominal Alpha)
???????名義檢驗水平(名義α)是我們在實際進行統(tǒng)計檢驗時,用于與P值直接比較的臨界值。它是一個基于累計α消耗和統(tǒng)計量的聯(lián)合分布反推出來的界值所對應的顯著性水平。
???????假設(shè)三次分析對應的檢驗統(tǒng)計量為Z?, Z?, Z?,對應的臨界界值分別為u?, u?, u?。則有:
- 第一次分析時實際消耗的α = P(第一次期中分析時拒絕H0 | H0)
= P(|Z? | > u?) = 0.00008 → 可反算出u?
(想象一下定義一類錯誤為0.05之后,對應的標準正態(tài)分布上的界值即為1.96)
- 第二次分析時實際消耗的α = P(第一次分析未拒絕H? ∩ 第二次分析拒絕H? | H?)
= P(|Z?| ≤ u? ∩ |Z?| > u?) = 0.00754 → 在已知u?的前提下,可反算出u?
- 最終分析時實際消耗的α = P(最終分析時拒絕H? ∩ 前兩次分析均不拒絕H? | H? ) = 0.04238
= P(|Z?| ≤ u? ∩ |Z?| ≤ u? ∩ |Z?| > u?) = 0.04238 → 在已知u?和u?的前提下,可反算出u?
???????這些臨界界值(u?, u?, u?)可以轉(zhuǎn)換為不同的尺度,SAS軟件通常提供Z值、P值等尺度的輸出,它們本質(zhì)上是等價的,可以相互轉(zhuǎn)換。
Z值尺度 (Z Scale) :
用于與統(tǒng)計量比較的臨界Z值
P值尺度 (P-Value Scale) :
這才是分析時實際用于與P值比較的名義α水平。例如,第一次期中分析時,我們需將計算得到的P值與0.0000427(而不是0.00008)進行比較。:

總結(jié):
- 實際α消耗是一個概率累加的概念,用于試驗設(shè)計初期控制總Ⅰ類錯誤率。它回答的是“到這次分析為止,我們最多已經(jīng)用了多少α”。
- 名義α水平是一個臨界值的概念,是進行統(tǒng)計推斷時的判斷尺度。它回答的是“這次分析,我的P值要小到什么程度才能拒絕H?”。
???????我們根據(jù)預先定義的α消耗函數(shù)計算出每次分析時的累計α消耗水平,再計算出各次分析時實際消耗的α,之后通過聯(lián)合概率分布推導出每次分析時使用的名義α水平。SAS等統(tǒng)計軟件都可以給出各個尺度下的界值水平。