九九久久看一区二区,91成人在线免费观看,女av网站

隨機(jī)對(duì)照實(shí)驗(yàn)是推斷因果關(guān)系的金標(biāo)準(zhǔn)，即通過隨機(jī)化過程對(duì)所有的基線因素進(jìn)行平衡。也就是說，在滿足入選條件的病人中，他們是否接受治療是通過完全隨機(jī)化決定的。因此觀察到的病人結(jié)局的差異一定是與治療與否所導(dǎo)致的。在觀察性隊(duì)列研究中，是否接受治療并非隨機(jī)化決定的，即病人是否接受治療可能是由于病人基線水平或者其預(yù)后所決定的。因此直接比較不同治療組病人的結(jié)局并不能推導(dǎo)出治療與病人預(yù)后的因果關(guān)系，即分析中引入了混雜因素。

定義：
傾向性評(píng)分就是運(yùn)用病人的基線條件來評(píng)估其接受治療的概率，即根據(jù)患者的特征、治療醫(yī)師和臨床環(huán)境，患者接受感興趣治療的概率。那么如果兩個(gè)病人具有相同的PS，那么他們的基線情況就是相近的，是否接受治療就是‘隨機(jī)’的。通過這樣的方式選擇出來的病人就可以當(dāng)作是接近于隨機(jī)化實(shí)驗(yàn)的。進(jìn)而病人預(yù)后的比較就更加接近于因果關(guān)系的推倒。

'基線因素' ：在時(shí)間順序上是發(fā)生在接受治療之前的因素

※目的：
PS的最終目的是消除混雜因素（confounding factors），因此基線因素的選擇一定是要以其對(duì)實(shí)驗(yàn)結(jié)果 (endpoint) 的影響為主要依據(jù)，而并非是否接受治療
相應(yīng)的，由于我們的最終目的是找到在兩個(gè)治療組中PS相似的病人，因此 PS model 的選擇并非以 high predictive value 作為主要依據(jù)。通常 PS model 的 AUC 以0.6-0.8 為宜。Perfect treatment distinction 意味著兩種病人沒有可比性。

※變量選擇：
因變量自然就是病人接受了何種治療方式
自變量要選擇與相關(guān)結(jié)局事件有關(guān)的變量。一般分為兩種方式：研究者定義和數(shù)據(jù)主導(dǎo) 的方式。對(duì)于研究者定義的方式，若實(shí)驗(yàn)數(shù)據(jù)來自臨床實(shí)驗(yàn)或者臨床注冊(cè)研究，那么基線數(shù)據(jù)通常是實(shí)驗(yàn)收集的變量，若來自真實(shí)世界數(shù)據(jù)，可以通過因果關(guān)系圖（DAG）的方式來定義。對(duì)于數(shù)據(jù)主導(dǎo)的變量選擇，可以通過 High-dimensional PS (Hd PS) 的方式來對(duì)各種變量根據(jù)其對(duì)實(shí)驗(yàn)結(jié)局的關(guān)聯(lián)程度進(jìn)行排序和選擇。因?yàn)閜ropensity score本質(zhì)上是指樣本被施加treatment的概率，因此也有理論證明只需要包含影響treatment assignment的變量即可。
一般包含以下四個(gè)方面：
(1)所有測量的基線協(xié)變量
(2)所有與治療分配相關(guān)的基線協(xié)變量
(3)影響結(jié)果的所有協(xié)變量 (潛在的混雜因素)
(4)所有影響治療分配和結(jié)果的協(xié)變量 (真正的混雜因素)

※方法：

1.傾向評(píng)分匹配（propensity score matching，PSM）：
是使用最廣泛的一種傾向性評(píng)分方法，又以1:1近鄰匹配被使用最廣泛。一般在篩選好人群之后或者在數(shù)據(jù)庫挖掘人群信息使用傾向性評(píng)分匹配。
以最常使用的1:1近鄰匹配（亦被稱為greedy 貪婪匹配）為例,每名接受治療A的患者逐一與傾向性評(píng)分最為接近的接受治療B的患者匹配，在這個(gè)范圍內(nèi)沒有匹配的患者被排除在外。
缺點(diǎn)：當(dāng)我們以暴露組的樣本量去匹配對(duì)照組，而對(duì)照組的樣本量又是暴露組的好幾倍，此時(shí)往往會(huì)在匹配后造成樣本量的損失。如果損失的病例數(shù)太多，則不能排除匹配造成的選擇性偏移。此外還有匹配的變量必須是已知的等等。
實(shí)現(xiàn)細(xì)節(jié)：
（1）采樣手段：可重復(fù)和不可重復(fù)：without replacement v.s. with replacement
在可重復(fù)模式下，同一個(gè)對(duì)照組樣本可能會(huì)出現(xiàn)在多個(gè)pair對(duì)中，即我們構(gòu)造的數(shù)據(jù)中存在大量重復(fù)樣本，此時(shí)需要考慮方差估計(jì)的問題（是否會(huì)出現(xiàn)過擬合）；在不可重復(fù)模式下，對(duì)照組樣本一旦被某個(gè)實(shí)驗(yàn)組樣本匹配后便不再使用。
（2）匹配方式：貪婪greedy v.s. 最佳optimal
貪婪匹配時(shí)實(shí)驗(yàn)組樣本是隨機(jī)選擇的，然后從對(duì)照組中選擇與當(dāng)前實(shí)驗(yàn)組樣本score最接近的樣本，即使這個(gè)對(duì)照組樣本與后面某個(gè)實(shí)驗(yàn)組樣本更合適。
最佳匹配形成pair的過程是minimize the total within-pair difference of propensity score最小化傾向性得分的配對(duì)內(nèi)總差異，即全局優(yōu)化。
但是這兩者在生成平衡匹配樣本（balanced matched samples）上效果基本相當(dāng)。
（3）相似度度量：Nearest Neighbor v.s Caliper distance
nearest neighbor matching就是在選擇score與當(dāng)前treated樣本最接近的untreated樣本，當(dāng)有多個(gè)同距離的untreated樣本時(shí)，隨機(jī)選擇一個(gè)即可。但是這種方法并沒有對(duì)最大可接受的距離做限制，因此無法保證選出的untreated樣本就是好的。
nearest neighbor matching within a specified caliper distance相比于前者就是增加了一個(gè)caliper distance的限制，即對(duì)于給定的treated樣本，先圈定這個(gè)樣本的caliper distance范圍，接著在這個(gè)范圍中去尋找score最近的untreated樣本，如果沒有的話，當(dāng)前treated樣本就被丟棄。可以看到caliper distance的方法更注重樣本的質(zhì)量。
對(duì)于caliper width（即我們最多能接大能接受的距離范圍）的設(shè)定目前還沒有統(tǒng)一的標(biāo)準(zhǔn)。有一種方法是選擇和logit of propensity score的標(biāo)準(zhǔn)差成比例的caliper distance（有理論證明logit of propensity score大概率是服從正態(tài)分布的）。假設(shè)treated和untreated樣本中的propensity score同方差，使用總體樣本的標(biāo)準(zhǔn)差*0.2作為caliper width可以減少confounders帶來的bias。
（4）匹配數(shù)量：一對(duì)一vs多對(duì)一（m：1）
m個(gè)untreated樣本與1個(gè)treated樣本匹配，對(duì)于不同的treated樣本，m也是可變的；相比于固定的m，動(dòng)態(tài)的m值可以帶來bias reduction。
Full matching指一個(gè)treated和至少一個(gè)untreated，或者一個(gè)untreated和至少一個(gè)treated樣本。

2.傾向性評(píng)分加權(quán)法（propensity score weighting，PSW）：
逆處理概率加權(quán)法（ Inverse Probability of Treatment Weighting Using the Propensity Score,IPTW）:是使用propensity score來對(duì)樣本進(jìn)行加權(quán)從而生成同分布的synthetic sample.傾向性評(píng)分加權(quán)法是一種基于個(gè)體化的標(biāo)準(zhǔn)化法。

3.傾向評(píng)分的分層(Stratification on the Propensity Score，SPS)：
SPS指的就是根據(jù)樣本的propensity score進(jìn)行分層。先對(duì)樣本的propensity score進(jìn)行排序，然后對(duì)樣本分桶。常見的一種做法是等頻分成5個(gè)桶。當(dāng)然，隨著分桶數(shù)的增多，桶內(nèi)樣本的相似度會(huì)增大，桶間樣本的相似度會(huì)減少，可以帶來進(jìn)一步bias reduction的收益。

4.使用傾向評(píng)分進(jìn)行協(xié)變量調(diào)整(Covariate Adjustment Using the Propensity Score)
是這四種方法中唯一一個(gè)需要額外建模的方法。它本質(zhì)上是做了一個(gè)線性回歸（outcome是binary時(shí)候使用邏輯回歸），模型的X是treatment status+propensity score，Y是outcome。此時(shí)treatment的效應(yīng)就是由回歸的系數(shù)所決定。

※驗(yàn)證
從propensity score本質(zhì)出發(fā)，它是一個(gè)balancing score，因此理論上當(dāng)我們能夠充分學(xué)習(xí)到樣本的propensity score，那么具有相同score的樣本應(yīng)該在協(xié)變量的分布上是一致的。反之，在給定propensity score下，treatment和untreatment組之間的協(xié)變量分布仍然存在顯著差異的話，說明score學(xué)的不好。

可參考文獻(xiàn)：：
An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies.

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

傾向性評(píng)分(propensity score, PS)

傾向性評(píng)分(propensity score, PS)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

傾向性評(píng)分(propensity score, PS)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av