原因:今天科內(nèi)小講課,講課內(nèi)容提到:諾欣妥可以對(duì)心衰患者全覆蓋,包括:HFrEF、HFmrEF、HFpEF。由今年ESC發(fā)布的研究PARALLAX證實(shí)。這個(gè)觀點(diǎn)和我的認(rèn)知有沖突,晚上有空查了一下這個(gè)研究,還沒有發(fā)布全文。但是查到了兩篇解讀,如下:
1.https://www.sohu.com/a/415812582_732020
作者是:諾華新見解。顯而易見這個(gè)是諾華的宣傳號(hào)。該篇文章在寫結(jié)論時(shí)竟然把post hoc分析的結(jié)果放在第一位,而把主要終點(diǎn)、次要終點(diǎn)放在后面。讓讀者產(chǎn)生諾欣妥有明確改善終點(diǎn)事件的錯(cuò)覺,真是本末倒置。
2.http://news.medlive.cn/all/info-progress/show-172046_129.html
作者是安貞的醫(yī)生,這篇解讀就說的很中肯。
有兩個(gè)概念復(fù)合重點(diǎn)和事后分析值得注意一下:
1.復(fù)合終點(diǎn)
2017-11-15 19:17
有人說搞研究其實(shí)就是搞數(shù)據(jù),沒數(shù)據(jù)的時(shí)候,你會(huì)愁咋寫文章,但是有了數(shù)據(jù)以后你可能會(huì)更愁,因?yàn)閿?shù)據(jù)太多了,該咋整。當(dāng)然,你可以考慮做N多個(gè)圖表來展示所有的結(jié)果,不過還是要考慮如何選擇合適的結(jié)果放在最終的paper中。
問題來了,如何確保在這樣一個(gè)“微縮版”的研究報(bào)告里把事兒說對(duì)了,說明白了,避免出現(xiàn)我們常說的“選擇性報(bào)告”(即陽(yáng)性結(jié)果通通放在文章里,陰性結(jié)果就當(dāng)沒看見),這就需要下一番功夫。
Stuart J. Pocock在《Journal of the American College of Cardiology》上發(fā)表了系列文章,介紹了臨床研究報(bào)告的一些統(tǒng)計(jì)學(xué)考慮[1]。接下來一起聊聊臨床研究中容易被錯(cuò)誤解讀的終點(diǎn)事件。
復(fù)合終點(diǎn)
臨床研究的療效評(píng)價(jià)指標(biāo)通常被分為主要終點(diǎn)和次要終點(diǎn),其中主要終點(diǎn)是研究者最感興趣的,它的選擇事關(guān)整個(gè)臨床研究的成敗,一般會(huì)選擇那些能夠客觀量化、操作性強(qiáng)、可以重復(fù)驗(yàn)證的指標(biāo),當(dāng)然,這些指標(biāo)通常也是某個(gè)研究領(lǐng)域公認(rèn)的“金標(biāo)準(zhǔn)”。
然而,理想很豐滿,現(xiàn)實(shí)卻很殘酷,有時(shí)候臨床上很難找到這樣一個(gè)能綜合評(píng)價(jià)療效的金標(biāo)準(zhǔn)。這種情況下,往往會(huì)出現(xiàn)多個(gè)療效評(píng)價(jià)指標(biāo),帶來的結(jié)果就是主要終點(diǎn)不再是單一指標(biāo)。
此時(shí),比較常用的處理方法是構(gòu)建一個(gè)綜合反映多個(gè)主要終點(diǎn)的“復(fù)合終點(diǎn)”。問題也瞬間簡(jiǎn)單了,直接比較不同治療組“復(fù)合終點(diǎn)”有無差異,就可以得出研究結(jié)論了。例如,心血管領(lǐng)域的臨床研究多采用復(fù)合終點(diǎn)作為主要終點(diǎn)。但是,采用復(fù)合終點(diǎn)作為主要結(jié)局指標(biāo)有時(shí)會(huì)掩蓋各個(gè)終點(diǎn)事件間的巨大差別。
SYNTAX研究[2,3]比較了冠脈旁路移植術(shù)(CABG)與Taxus藥物涂層支架(DES)用于治療3支血管病變或冠脈左主干病變患者的獲益。主要結(jié)局為復(fù)合終點(diǎn),包括全因死亡、卒中、心梗及再次血運(yùn)重建。隨訪1年時(shí),DES組心腦血管事件(MACCE)的發(fā)生風(fēng)險(xiǎn)顯著高于CABG組(P=0.002)。如果只盯著這個(gè)數(shù)據(jù),顯而易見,DES要劣于CABG。
但是,如果再仔細(xì)觀察復(fù)合終點(diǎn)中各個(gè)終點(diǎn)事件的發(fā)生情況,結(jié)論就沒有那么簡(jiǎn)單了。兩組主要的區(qū)別集中在再次血運(yùn)重建上,尤其是重復(fù)PCI(4.7% vs. 11.4%, P<0.001)。再比如,在隨訪1年時(shí),CABG組卒中的發(fā)生率明顯高于DES組(P=0.003),但是兩組全因死亡、卒中或心梗的復(fù)合終點(diǎn)卻沒有顯著差異(RR=1.00, 95%CI: 0.72-1.38)。因此,復(fù)合終點(diǎn)可能無法很好地反映出兩組實(shí)際獲益情況。(表1)
表1. SYNTAX研究隨訪1年和5年結(jié)果
另外,重要的組間療效差異可能需要隨訪足夠的時(shí)間才能觀察到。SYNTAX研究在隨訪第5年時(shí),DES組心梗發(fā)生率出現(xiàn)顯著升高。與此同時(shí),復(fù)合終點(diǎn)的結(jié)果也支持采用CABG治療。
盡管復(fù)合終點(diǎn)在臨床試驗(yàn)中常被廣泛使用,但是無法回避的是,有時(shí)候復(fù)合終點(diǎn)的結(jié)果并不好解讀。研究者會(huì)宣稱某某治療措施的療效覆蓋了所有的終點(diǎn)事件,但是仔細(xì)分析才發(fā)現(xiàn)療效可能更多地集中在某一個(gè)終點(diǎn)事件,比如上述提到的SYNTAX研究結(jié)果。
因此,復(fù)合終點(diǎn)的使用需要注意以下內(nèi)容:
1.復(fù)合終點(diǎn)的發(fā)生例數(shù)是指經(jīng)歷一個(gè)或多個(gè)終點(diǎn)事件的患者總數(shù);
2.復(fù)合終點(diǎn)的有效性取決于各終點(diǎn)事件對(duì)患者是否同等重要,治療對(duì)各終點(diǎn)事件的影響是否相同,各終點(diǎn)事件發(fā)生的次數(shù)是否相近;
3.當(dāng)各終點(diǎn)事件之間差異較大時(shí),應(yīng)放棄采用復(fù)合終點(diǎn)。
次要終點(diǎn)
正如前面聊到的,主要終點(diǎn)是研究者最關(guān)心,也是一項(xiàng)研究最終要回答的問題,研究假設(shè)的建立、樣本量計(jì)算以及最終的研究結(jié)論都要依據(jù)主要終點(diǎn);次要終點(diǎn)也是研究者感興趣的,通常作為整個(gè)研究的支持性證據(jù),在研究報(bào)告中也是緊跟主要終點(diǎn)結(jié)果出現(xiàn)。
舉個(gè)例子,PEGASUS-TIMI54試驗(yàn)[4]比較了替格瑞洛兩種不同劑量聯(lián)合低劑量阿司匹林或安慰劑聯(lián)合低劑量阿司匹林在有心梗病史患者中的療效。主要結(jié)局是心血管死亡、心梗及卒中的復(fù)合終點(diǎn)。
結(jié)果顯示,替格瑞洛60mg和90mg均能夠顯著降低有心梗病史患者主要心血管事件的發(fā)生。除了替格瑞洛90mg組未觀察到全因死亡風(fēng)險(xiǎn)降低(HR=1.00)外,次要終點(diǎn)方面也觀察到相似的趨勢(shì),即替格瑞洛可降低各心血管事件發(fā)生風(fēng)險(xiǎn)(HR<1)。(表2)
表2. 主要終點(diǎn)和次要終點(diǎn)示例(PEGASUS-TIMI 54試驗(yàn))
相信研究者都會(huì)羨慕上面的例子,主要終點(diǎn)有意義,次要終點(diǎn)還有意義,簡(jiǎn)直太完美了!但是,搞研究還是要踏實(shí)點(diǎn)、不急不躁,尤其是面對(duì)意想不到的結(jié)果。比如說,一項(xiàng)臨床研究主要終點(diǎn)沒啥意義,但是次要終點(diǎn)卻發(fā)現(xiàn)顯著差異,怎么下結(jié)論?
來看一個(gè)實(shí)例,PROactive研究[5]比較了吡格列酮與安慰劑在治療T2DM合并大血管病變高?;颊叩寞熜?,共納入5238名T2DM患者,平均隨訪3年。主要結(jié)局為復(fù)合終點(diǎn),包括全因死亡、心梗、卒中、急性冠脈綜合征、心臟介入、下肢血管重建或者截肢。
結(jié)果顯示,吡格列酮可降低10%的主要終點(diǎn)事件發(fā)生風(fēng)險(xiǎn)(HR=0.90,95%CI:0.80-1.02, P=0.095),但是組間差異沒有統(tǒng)計(jì)學(xué)意義;而在次要終點(diǎn)(死亡、心梗及卒中)卻達(dá)到了顯著性差異(HR=0.84, 95%CI: 0.72-0.98, P=0.027)。
該研究據(jù)此宣稱:吡格列酮降低了心血管高風(fēng)險(xiǎn)的T2DM患者的全因死亡、心梗和卒中的綜合發(fā)生率(圖1)。結(jié)論一出瞬間引起軒然大波,爭(zhēng)議滿天飛:研究主要終點(diǎn)為陰性結(jié)果,僅僅依靠次要終點(diǎn)的證據(jù)能否支持該研究的結(jié)論?借用一句評(píng)論“The glass is half full”,顯然PROactive研究還需要提供更多的證據(jù)來支持其結(jié)論。
圖1. PROactive研究
來看另外一個(gè)相反的例子,MATRIX研究[6]比較了比伐盧定和肝素對(duì)于接受PCI治療的急性冠脈綜合癥患者的獲益,包含兩個(gè)主要終點(diǎn),分別為主要心血管事件(全因死亡、心梗或卒中)和凈不良事件(出血并發(fā)癥或主要心血管事件)。
根據(jù)研究結(jié)果,研究者認(rèn)為比伐盧定相較于肝素并沒有顯著降低患者主要心血管事件(10.3% vs. 10.9%: RR=0.94, 95%CI: 0.81-1.09; P=0.44)和凈不良事件(11.2% vs. 12.4%; RR=0.89, 95%CI: 0.78-1.03; P=0.12) (圖2)。
圖2. MATRIX研究
主要終點(diǎn)是陰性結(jié)果,下結(jié)論認(rèn)為兩組沒有什么差異,似乎理所當(dāng)然,沒什么毛病,但是次要終點(diǎn)確實(shí)妥妥地被忽略了。雖說次要終點(diǎn)因?yàn)椤按我?,解讀往往需要謹(jǐn)慎,尤其是存在多個(gè)次要結(jié)局指標(biāo)的時(shí)候,但是使用比伐盧定后會(huì)出現(xiàn)更多的支架內(nèi)血栓(HR=1.71, 95%CI: 1.00-2.93; P=0.048),卻是不得不打起十二分注意,小心對(duì)待。
次要終點(diǎn)如果發(fā)現(xiàn)新的治療措施對(duì)于患者存在潛在危害,爭(zhēng)議就不可避免會(huì)出現(xiàn)。SAVOR-TIMI 53研究[7]評(píng)估了沙格列汀用于T2DM患者的心血管安全性,患者平均隨訪2.1年。主要終點(diǎn)是由心血管死亡、心肌梗死、卒中組成的復(fù)合終點(diǎn)。
結(jié)果顯示,沙格列汀相較于安慰劑主要終點(diǎn)事件發(fā)生風(fēng)險(xiǎn)并未顯著降低(7.3% vs. 7.2%; HR=1.00, 95% CI: 0.89-1.12)。然而,沙格列汀組因心衰住院的患者比例卻顯著高于安慰劑組(3.5% vs. 2.8%; HR=1.27, 95%CI:1.07-1.51, P=0.007)。關(guān)鍵是沙格列汀組僅出現(xiàn)1例因心衰住院的患者,是偶然誤差,還是真實(shí)情況?That’s a question!
EXAMINE[8]和TECOS[9]兩項(xiàng)研究分別評(píng)價(jià)了阿格列汀和西格列?。ㄅc沙格列汀同為DPP-4抑制劑類藥物)在T2DM患者中的心血管安全性,發(fā)現(xiàn)接受治療的患者因心衰住院的風(fēng)險(xiǎn)并沒有顯著差別(結(jié)論與SAVOR-TIMI 53研究并不一致)。
然而,為什么同類藥物的不同品種之間存在差異?針對(duì)該問題進(jìn)行Meta分析,合并HR=1.13(固定效應(yīng)模型,P=0.04)和1.12(隨機(jī)效應(yīng)模型,P=0.18),進(jìn)一步異質(zhì)性檢驗(yàn),仍然未發(fā)現(xiàn)統(tǒng)計(jì)學(xué)意義(P=0.16)(圖3)。
Meta分析結(jié)果闡明這樣一個(gè)邏輯:3個(gè)研究同質(zhì)性較好,且合并HR提示DPP-4抑制劑類藥物并不會(huì)增加患者因心衰住院的風(fēng)險(xiǎn),那么SAVOR-TIMI 53研究的結(jié)果是偶然誤差導(dǎo)致的可能性就比較大,但是因?yàn)槿狈ο鄳?yīng)生物學(xué)證據(jù),該問題仍沒有完全的定論。
圖3. DPP-4抑制劑類藥物因心衰住院的發(fā)生風(fēng)險(xiǎn)meta分析
總之,研究者面對(duì)的一個(gè)重大挑戰(zhàn)就是如何對(duì)研究發(fā)現(xiàn)做出一個(gè)恰當(dāng)?shù)慕忉尅o論是主要終點(diǎn)(復(fù)合終點(diǎn)),還是次要終點(diǎn)的解讀都需要謹(jǐn)慎,避免以偏概全。此外,研究設(shè)計(jì)之初還應(yīng)該制定詳細(xì)科學(xué)的統(tǒng)計(jì)分析計(jì)劃(SAP),明確主要終點(diǎn)和次要終點(diǎn),闡明結(jié)果解讀的優(yōu)先順序,例如一般是主要終點(diǎn)、次要終點(diǎn)(包括安全性考慮)以及探索性分析(例如亞組分析)。
2.post hoc 分析(事后分析)
為什么要預(yù)設(shè)分組,post-hoc 分析又是啥
通常,臨床研究的統(tǒng)計(jì)分析方案需要在設(shè)計(jì)階段就制定完成,為了保證研究結(jié)論科學(xué)、真實(shí)、可靠,在統(tǒng)計(jì)分析方案中往往預(yù)先指定研究的分組情況,提出研究假設(shè),并基于此進(jìn)行樣本量的估計(jì)。簡(jiǎn)單理解,只有基于假設(shè)檢驗(yàn)和足夠樣本量所分析得到的 P 值才是「真 P 值」。
而 Post-hoc 分析,即事后分析,是指在數(shù)據(jù)收集完畢后,根據(jù)數(shù)據(jù)本身特點(diǎn)額外設(shè)定分組,提出研究假設(shè),并進(jìn)行統(tǒng)計(jì)分析。
比如,某臨床研究發(fā)現(xiàn),試驗(yàn)藥物相比對(duì)照組能顯著延長(zhǎng)患者的生存時(shí)間。而研究者是個(gè)「星座控」,突發(fā)奇想把試驗(yàn)人群又基于星座進(jìn)行了分組與分析。結(jié)果發(fā)現(xiàn):射手座的患者應(yīng)用試驗(yàn)藥物顯著延長(zhǎng)生存時(shí)間(P<0.05);而處女座的患者應(yīng)用試驗(yàn)藥物與對(duì)照差異不顯著(P>0.05)。于是得出結(jié)論:射手座患者比處女座患者應(yīng)用該藥的生存獲益更大。
上述情況,顯然不科學(xué)。因?yàn)榉纸M情況非預(yù)設(shè),且研究假設(shè)是在觀察完數(shù)據(jù)的特征后提出,所以分析也就不具有統(tǒng)計(jì)學(xué)意義??梢院?jiǎn)單認(rèn)為此時(shí)得到的 P 值是「假 P 值」,無論是否小于 0.05,都不代表是否有「統(tǒng)計(jì)學(xué)差異」,只能視為體現(xiàn)某種趨勢(shì),可為后續(xù)預(yù)設(shè)研究設(shè)計(jì)提供思路。
事實(shí)上,事后分析常被稱為數(shù)據(jù)疏浚(data dredging)或數(shù)據(jù)捕魚(data fishing),其動(dòng)機(jī)往往是為了得到陽(yáng)性的結(jié)果。因此,事后分析結(jié)果一般不被各國(guó)藥品監(jiān)管部分接受作為藥物有效性的證據(jù)。