在科學(xué)的道路上,我們并非總能得到預(yù)期的結(jié)果,失望與沮喪也時(shí)常來(lái)擾。本來(lái)滿心歡喜地期待某項(xiàng)藥物試驗(yàn)可以得出有效的研究結(jié)果,然而經(jīng)過(guò)統(tǒng)計(jì)分析后卻發(fā)現(xiàn)P>0.05,心情瞬間低落。這就是我們通常所說(shuō)的陰性結(jié)果。
可能導(dǎo)致假陰性結(jié)果的原因
當(dāng)?shù)玫揭粋€(gè)陰性結(jié)果時(shí),研究者的第一反應(yīng)通常是:哪里出錯(cuò)了?治療措施是否真的無(wú)效?其實(shí),主要結(jié)局的P值大于0.05時(shí),試驗(yàn)結(jié)果是否一定無(wú)意義,還需要根據(jù)具體情況來(lái)區(qū)別對(duì)待。除試驗(yàn)結(jié)果確為陰性的情況以外,還有兩種與研究本身相關(guān)的情況可能導(dǎo)致出現(xiàn)陰性結(jié)果。
研究的設(shè)計(jì)或?qū)嵤┐嬖趩?wèn)題
研究的設(shè)計(jì)和實(shí)施過(guò)程對(duì)結(jié)局的影響至關(guān)重要,如果不合理,很有可能造成藥物的真實(shí)療效被稀釋、甚至被完全掩蓋。研究對(duì)象的納入標(biāo)準(zhǔn)不合適、治療方案不合理(如劑量過(guò)低或過(guò)高)、患者依從性較差、主要結(jié)局指標(biāo)定義不合理或不準(zhǔn)確等,這些都可能造成主要結(jié)局的陰性結(jié)果(案例1)。
案例1
CHAMPION PLATFORM試驗(yàn)比較了坎格雷洛和氯吡格雷對(duì)于接受經(jīng)皮冠狀動(dòng)脈介入治療(PCI)患者術(shù)后缺血性并發(fā)癥的預(yù)防效果,主要結(jié)局為48小時(shí)內(nèi)死亡、心肌梗死或因缺血行血管重建。中期分析顯示兩組差異無(wú)統(tǒng)計(jì)學(xué)意義,試驗(yàn)因無(wú)效而被提前終止。
然而,對(duì)于生物標(biāo)志物陽(yáng)性的急性冠脈綜合征患者,圍手術(shù)期心肌梗死的定義并不能有效識(shí)別PCI后不久發(fā)生的心肌梗死。因此,在隨后的CHAMPION PHOENIX試驗(yàn)中,研究者將主要結(jié)局事件定義為48小時(shí)內(nèi)死亡、心肌梗死、支架內(nèi)血栓形成或缺血導(dǎo)致的血管重建。結(jié)果坎格雷洛組的主要結(jié)局事件發(fā)生率下降了22%(風(fēng)險(xiǎn)比0.78,P = 0.005),最終促成了美國(guó)與歐洲藥品管理機(jī)構(gòu)批準(zhǔn)該藥物的臨床使用。
樣本量不足
研究者通常基于前人研究結(jié)果進(jìn)行樣本量估計(jì),所以對(duì)于陰性結(jié)果,首先要看其是否有樣本量估計(jì)依據(jù),并根據(jù)實(shí)際結(jié)果計(jì)算研究的把握度(又稱(chēng)為檢驗(yàn)效能)是否足夠。如果未達(dá)到足夠的把握度,則該結(jié)果可能只是假陰性結(jié)果,將樣本量增至足夠大時(shí),可能會(huì)出現(xiàn)陽(yáng)性結(jié)果。
一般來(lái)說(shuō),當(dāng)試驗(yàn)樣本量太小而不能檢驗(yàn)出治療效果時(shí),宜將結(jié)果描述為不確定而不是否定。此時(shí),可以通過(guò)招募更多高風(fēng)險(xiǎn)患者、延長(zhǎng)隨訪時(shí)間、定義發(fā)生數(shù)較多的結(jié)局(如使用復(fù)合結(jié)局指標(biāo)來(lái)代替單一結(jié)局指標(biāo)、使用中間結(jié)局指標(biāo)代替臨床硬終點(diǎn)結(jié)局等),或?qū)⒁陨蠋追N方式組合,來(lái)滿足達(dá)到把握度所需要的樣本量。當(dāng)然,還需要考慮大型試驗(yàn)發(fā)現(xiàn)的有統(tǒng)計(jì)學(xué)意義的療效是否真的有臨床意義。
研究主要結(jié)局陰性、亞組分析陽(yáng)性的情況
我們經(jīng)常會(huì)看到一些研究的主要結(jié)局顯示為陰性,但亞組分析卻為陽(yáng)性。例如,在所有入組的研究對(duì)象中,干預(yù)措施較對(duì)照措施統(tǒng)計(jì)學(xué)并無(wú)顯著性差異,但干預(yù)措施在某些亞組人群(如某種基因突變、某個(gè)種族、某些病情較重、伴有某些并發(fā)癥)中卻呈現(xiàn)顯著效果。
亞組分析真的有化腐朽為神奇的功能嗎?一種可能的情況是亞組分析的結(jié)果為真陽(yáng)性,即干預(yù)措施并非適用于所有人,確實(shí)只對(duì)具有某些特征的人有效;但更多的情況是亞組分析的結(jié)果為假陽(yáng)性,由于亞組分析通常經(jīng)過(guò)多次比較,從而增大了Ⅰ型錯(cuò)誤(即假陽(yáng)性錯(cuò)誤)概率。因此,即使亞組分析中出現(xiàn)了陽(yáng)性結(jié)果,這些發(fā)現(xiàn)仍然僅能用于提出假設(shè),而不能作為確證性結(jié)論。
利用亞組分析在一項(xiàng)結(jié)果為陰性的試驗(yàn)中發(fā)現(xiàn)某一陽(yáng)性結(jié)果,并在隨后試驗(yàn)中得到證實(shí),雖然并不多見(jiàn),但還是會(huì)發(fā)生的(案例2)。
案例2
SYNTAX研究比較了冠狀動(dòng)脈旁路移植術(shù)(CABG)和PCI對(duì)于冠狀動(dòng)脈三支病變和(或)左主干病變患者的治療效果,結(jié)果顯示兩組全因死亡率和卒中發(fā)生率無(wú)顯著差異;然而亞組分析發(fā)現(xiàn),對(duì)于左主干病變亞組(解剖結(jié)構(gòu)低至中度復(fù)雜的患者)而言,PCI似乎可以成為CABG的替代方法,且療效可能更佳。
在SYNTAX試驗(yàn)亞組分析發(fā)現(xiàn)的線索的基礎(chǔ)上,研究者設(shè)計(jì)了EXCEL試驗(yàn)進(jìn)行驗(yàn)證,結(jié)果顯示PCI組患者術(shù)后3年主要結(jié)局(全因死亡率、卒中或心肌梗死的復(fù)合終點(diǎn))的發(fā)生率與CABG組的發(fā)生率相當(dāng)(非劣效性P =0.02),且PCI組次要結(jié)局(術(shù)后30天圍手術(shù)期死亡、卒中或心肌梗死的復(fù)合終點(diǎn))發(fā)生率更低。據(jù)此,研究者得出結(jié)論:對(duì)于上述特征的患者,PCI可作為CABG的首選替代方案。
正確運(yùn)用薈萃分析
在倫理和經(jīng)濟(jì)層面都不允許開(kāi)展大規(guī)模臨床試驗(yàn)的情況下,系統(tǒng)綜述和薈萃分析不失為一種較好的方法。薈萃分析可以通過(guò)對(duì)符合納入標(biāo)準(zhǔn)原始研究的合并分析來(lái)回答干預(yù)措施是否有效,大大增加樣本量,因而增加了研究的把握度,也增加了結(jié)果的精確性和穩(wěn)定性。
但需要注意的是,在未達(dá)到足夠樣本量的情況下,不斷更新原始研究而進(jìn)行反復(fù)、多次統(tǒng)計(jì)學(xué)檢驗(yàn)同樣會(huì)增加Ⅰ類(lèi)錯(cuò)誤的風(fēng)險(xiǎn),即假陽(yáng)性概率明顯升高,造成療效的夸大;而對(duì)于已經(jīng)有確切療效的干預(yù)措施,或已被證實(shí)無(wú)效的干預(yù)措施,如不及時(shí)停止試驗(yàn)則會(huì)造成醫(yī)療資源的浪費(fèi),也不符合倫理學(xué)要求。
為解決此類(lèi)問(wèn)題,波格(Pogue)等首次提出將序貫分析的方法引入薈萃分析,即試驗(yàn)序貫分析法(Trial Sequential Analysis,TSA)。該方法一方面保證了在不增加Ⅰ類(lèi)錯(cuò)誤的前提下,可以更早得出確切的結(jié)論;另一方面提供了接受無(wú)效假設(shè)的終止標(biāo)準(zhǔn),可以告訴我們某項(xiàng)干預(yù)措施究竟是確實(shí)無(wú)效(evidence of absence effect),還是因把握度不夠尚不能得出確切結(jié)論(absence of evidence)。
總之,當(dāng)主要結(jié)局為陰性結(jié)果時(shí),研究者需要謹(jǐn)慎解讀?!缎掠⒏裉m醫(yī)學(xué)雜志》也于2016年發(fā)表了一篇綜述(The Primary Outcome Fails-What Next?),列舉了試驗(yàn)的主要結(jié)局為陰性時(shí),應(yīng)該考慮的12個(gè)問(wèn)題,希望可以對(duì)大家有所啟發(fā)。
■鏈接 主要結(jié)局為陰性時(shí),應(yīng)考慮的12個(gè)問(wèn)題
是否有潛在獲益的跡象?
把握度是否足夠?
主要結(jié)局的定義是否合理、準(zhǔn)確?
研究對(duì)象是否合適?
治療方案是否合理?
研究實(shí)施過(guò)程中有無(wú)缺陷?
是否可以得到非劣效的結(jié)論?
亞組分析的結(jié)果是否陽(yáng)性?
次要結(jié)局是否陽(yáng)性?
選用其他的分析方法是否有幫助?
是否存在其他外部陽(yáng)性的證據(jù)?
是否有強(qiáng)有力的生物學(xué)理論支持干預(yù)措施是有效的?