傾向性評(píng)分(propensity score, PS)

隨機(jī)對(duì)照實(shí)驗(yàn)是推斷因果關(guān)系的金標(biāo)準(zhǔn),即通過隨機(jī)化過程對(duì)所有的基線因素進(jìn)行平衡。也就是說,在滿足入選條件的病人中,他們是否接受治療是通過完全隨機(jī)化決定的。 因此觀察到的病人結(jié)局的差異一定是與治療與否所導(dǎo)致的。在觀察性隊(duì)列研究中,是否接受治療并非隨機(jī)化決定的,即病人是否接受治療可能是由于病人基線水平或者其預(yù)后所決定的。 因此直接比較不同治療組病人的結(jié)局并不能推導(dǎo)出治療與病人預(yù)后的因果關(guān)系,即分析中引入了混雜因素。

定義:
傾向性評(píng)分就是運(yùn)用病人的基線條件來評(píng)估其接受治療的概率,即根據(jù)患者的特征、治療醫(yī)師和臨床環(huán)境,患者接受感興趣治療的概率。那么如果兩個(gè)病人具有相同的PS,那么他們的基線情況就是相近的,是否接受治療就是‘隨機(jī)’的。 通過這樣的方式選擇出來的病人就可以當(dāng)作是接近于隨機(jī)化實(shí)驗(yàn)的。進(jìn)而病人預(yù)后的比較就更加接近于因果關(guān)系的推倒。

'基線因素' :在時(shí)間順序上是發(fā)生在接受治療之前的因素

※目的:
PS的最終目的是消除混雜因素(confounding factors),因此基線因素的選擇一定是要以其對(duì)實(shí)驗(yàn)結(jié)果 (endpoint) 的影響為主要依據(jù),而并非是否接受治療
相應(yīng)的,由于我們的最終目的是找到在兩個(gè)治療組中PS相似的病人,因此 PS model 的選擇并非以 high predictive value 作為主要依據(jù)。通常 PS model 的 AUC 以0.6-0.8 為宜。Perfect treatment distinction 意味著兩種病人沒有可比性。

※變量選擇:
因變量自然就是病人接受了何種治療方式
自變量要選擇與相關(guān)結(jié)局事件有關(guān)的變量。一般分為兩種方式:研究者定義 和 數(shù)據(jù)主導(dǎo) 的方式。對(duì)于研究者定義的方式,若實(shí)驗(yàn)數(shù)據(jù)來自臨床實(shí)驗(yàn)或者臨床注冊(cè)研究,那么基線數(shù)據(jù)通常是實(shí)驗(yàn)收集的變量,若來自真實(shí)世界數(shù)據(jù),可以通過因果關(guān)系圖(DAG)的方式來定義。對(duì)于數(shù)據(jù)主導(dǎo)的變量選擇,可以通過 High-dimensional PS (Hd PS) 的方式來對(duì)各種變量根據(jù)其對(duì)實(shí)驗(yàn)結(jié)局的關(guān)聯(lián)程度進(jìn)行排序和選擇。因?yàn)閜ropensity score本質(zhì)上是指樣本被施加treatment的概率,因此也有理論證明只需要包含影響treatment assignment的變量即可。
一般包含以下四個(gè)方面:
(1)所有測量的基線協(xié)變量
(2)所有與治療分配相關(guān)的基線協(xié)變量
(3)影響結(jié)果的所有協(xié)變量 (潛在的混雜因素)
(4)所有影響治療分配和結(jié)果的協(xié)變量 (真正的混雜因素)

※方法:

1.傾向評(píng)分匹配(propensity score matching,PSM):
是使用最廣泛的一種傾向性評(píng)分方法,又以1:1近鄰匹配被使用最廣泛。一般在篩選好人群之后或者在數(shù)據(jù)庫挖掘人群信息使用傾向性評(píng)分匹配。
以最常使用的1:1近鄰匹配(亦被稱為greedy 貪婪匹配)為例,每名接受治療A的患者逐一與傾向性評(píng)分最為接近的接受治療B的患者匹配,在這個(gè)范圍內(nèi)沒有匹配的患者被排除在外。
缺點(diǎn):當(dāng)我們以暴露組的樣本量去匹配對(duì)照組,而對(duì)照組的樣本量又是暴露組的好幾倍,此時(shí)往往會(huì)在匹配后造成樣本量的損失。如果損失的病例數(shù)太多,則不能排除匹配造成的選擇性偏移。此外還有匹配的變量必須是已知的等等。
實(shí)現(xiàn)細(xì)節(jié):
(1)采樣手段:可重復(fù)和不可重復(fù):without replacement v.s. with replacement
在可重復(fù)模式下,同一個(gè)對(duì)照組樣本可能會(huì)出現(xiàn)在多個(gè)pair對(duì)中,即我們構(gòu)造的數(shù)據(jù)中存在大量重復(fù)樣本,此時(shí)需要考慮方差估計(jì)的問題(是否會(huì)出現(xiàn)過擬合);在不可重復(fù)模式下,對(duì)照組樣本一旦被某個(gè)實(shí)驗(yàn)組樣本匹配后便不再使用。
(2)匹配方式:貪婪greedy v.s. 最佳optimal
貪婪匹配時(shí)實(shí)驗(yàn)組樣本是隨機(jī)選擇的,然后從對(duì)照組中選擇與當(dāng)前實(shí)驗(yàn)組樣本score最接近的樣本,即使這個(gè)對(duì)照組樣本與后面某個(gè)實(shí)驗(yàn)組樣本更合適。
最佳匹配形成pair的過程是minimize the total within-pair difference of propensity score最小化傾向性得分的配對(duì)內(nèi)總差異,即全局優(yōu)化。
但是這兩者在生成平衡匹配樣本(balanced matched samples)上效果基本相當(dāng)。
(3)相似度度量:Nearest Neighbor v.s Caliper distance
nearest neighbor matching就是在選擇score與當(dāng)前treated樣本最接近的untreated樣本,當(dāng)有多個(gè)同距離的untreated樣本時(shí),隨機(jī)選擇一個(gè)即可。但是這種方法并沒有對(duì)最大可接受的距離做限制,因此無法保證選出的untreated樣本就是好的。
nearest neighbor matching within a specified caliper distance相比于前者就是增加了一個(gè)caliper distance的限制,即對(duì)于給定的treated樣本,先圈定這個(gè)樣本的caliper distance范圍,接著在這個(gè)范圍中去尋找score最近的untreated樣本,如果沒有的話,當(dāng)前treated樣本就被丟棄。可以看到caliper distance的方法更注重樣本的質(zhì)量。
對(duì)于caliper width(即我們最多能接大能接受的距離范圍)的設(shè)定目前還沒有統(tǒng)一的標(biāo)準(zhǔn)。有一種方法是選擇和logit of propensity score的標(biāo)準(zhǔn)差成比例的caliper distance(有理論證明logit of propensity score大概率是服從正態(tài)分布的)。假設(shè)treated和untreated樣本中的propensity score同方差,使用總體樣本的標(biāo)準(zhǔn)差*0.2作為caliper width可以減少confounders帶來的bias。
(4)匹配數(shù)量:一對(duì)一vs多對(duì)一(m:1)
m個(gè)untreated樣本與1個(gè)treated樣本匹配,對(duì)于不同的treated樣本,m也是可變的;相比于固定的m,動(dòng)態(tài)的m值可以帶來bias reduction。
Full matching指一個(gè)treated和至少一個(gè)untreated,或者一個(gè)untreated和至少一個(gè)treated樣本。

2.傾向性評(píng)分加權(quán)法(propensity score weighting,PSW):
逆處理概率加權(quán)法( Inverse Probability of Treatment Weighting Using the Propensity Score,IPTW):是使用propensity score來對(duì)樣本進(jìn)行加權(quán)從而生成同分布的synthetic sample.傾向性評(píng)分加權(quán)法是一種基于個(gè)體化的標(biāo)準(zhǔn)化法。

3.傾向評(píng)分的分層(Stratification on the Propensity Score,SPS):
SPS指的就是根據(jù)樣本的propensity score進(jìn)行分層。先對(duì)樣本的propensity score進(jìn)行排序,然后對(duì)樣本分桶。常見的一種做法是等頻分成5個(gè)桶。當(dāng)然,隨著分桶數(shù)的增多,桶內(nèi)樣本的相似度會(huì)增大,桶間樣本的相似度會(huì)減少,可以帶來進(jìn)一步bias reduction的收益。

4.使用傾向評(píng)分進(jìn)行協(xié)變量調(diào)整(Covariate Adjustment Using the Propensity Score)
是這四種方法中唯一一個(gè)需要額外建模的方法。它本質(zhì)上是做了一個(gè)線性回歸(outcome是binary時(shí)候使用邏輯回歸),模型的X是treatment status+propensity score,Y是outcome。此時(shí)treatment的效應(yīng)就是由回歸的系數(shù)所決定。

※驗(yàn)證
從propensity score本質(zhì)出發(fā),它是一個(gè)balancing score,因此理論上當(dāng)我們能夠充分學(xué)習(xí)到樣本的propensity score,那么具有相同score的樣本應(yīng)該在協(xié)變量的分布上是一致的。反之,在給定propensity score下,treatment和untreatment組之間的協(xié)變量分布仍然存在顯著差異的話,說明score學(xué)的不好。

可參考文獻(xiàn)::
An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容