筆記-傾向評分定理

去年10月份一篇讀書筆記,當(dāng)時(shí)看的是《基本無害的計(jì)量經(jīng)濟(jì)學(xué)》

對于協(xié)變量(獨(dú)立變量,實(shí)驗(yàn)者不能操作,但是仍影響實(shí)驗(yàn)結(jié)果),作者引入傾向評分來控制協(xié)變量。

PSM

傾向評分定理指出我們只要將影響處理概率的協(xié)變量控制住就好。下面以一個(gè)例子來再闡述下~

例子:分析讀研究生與否對小明同學(xué)的影響。

困難:小明已經(jīng)讀了研究生,怎么才能估計(jì)出他要是不讀研究生,他的收入會是多少呢?

辦法:引入“傾向得分匹配”,這種方法能讓我們從一堆沒有讀研究生的人群中(即我們的總體樣本的一個(gè)子集),對每個(gè)人讀研究生的概率進(jìn)行估計(jì),然后選出和小明具有非常相似的去讀研究生的概率,可是沒有去讀的小剛同學(xué)——作為小明的對照,然后再來看他們的區(qū)別。

步驟:

  1. 要對總體樣本執(zhí)行probit或者logit模型,然后估計(jì)出每一個(gè)觀測對象讀研究生的概率是多少。
    probit [dependent var] [independent var]
    其中,[dependent var]是一個(gè)0或1的二進(jìn)制變量,1代表該對象讀了研究生,否則是0。
  2. 對每一個(gè)觀測值,我們根據(jù)估計(jì)出來的probit模型,算出他讀研究生的概率是多少。
    predict pscore, p
    其中,pscore是定義的記錄每個(gè)觀測對象概率的變量名稱。
  3. 使用psmatch2命令,讓Stata幫你對于每個(gè)讀了研究生的觀測對象,找出一個(gè)與之具有最接近的概率值的,可是沒有讀研究生的觀測對象
    psmatch2 [dependent var], pscore(pscore) noreplacement
    其中,(pscore)是在第二步中生成的那個(gè)記錄對象概率的變量,noreplacement是一個(gè)選項(xiàng),使得任何讀了研究生的觀察對象的對照對象都具有唯一性,換言之,只能1對1匹配。
  4. Stata會在你的數(shù)據(jù)中自動添加幾個(gè)變量,其中_id是自動生成的每一個(gè)觀測對象唯一的ID;_treated表示某個(gè)對象是否讀了研究生,如果讀了,_n表示的是他被匹配到的對照對象的_id;_pdif表示一組匹配了的觀察對象他們概率值的差

傾向評分模型將我們的注意力從估計(jì)E[Yi|Xi,Di]轉(zhuǎn)移到估計(jì)傾向評分p(Xi)=E[Di|Xi],在實(shí)際運(yùn)用中后者更便于模型化。

但作者仍認(rèn)為回歸應(yīng)該成為大部分經(jīng)驗(yàn)研究項(xiàng)目的起點(diǎn),盡管用傾向評分匹配我們提供了一個(gè)更加可靠的對平均處理效果的估計(jì)。因?yàn)樵谶\(yùn)用傾向評分方法進(jìn)行匹配時(shí)有太多的細(xì)節(jié)需要考慮,比如如何模型化評分,如何進(jìn)行推斷,目前還沒有形成一套標(biāo)準(zhǔn),造成即使使用相同的數(shù)據(jù)和協(xié)變量,不同的研究者也可能得到不同的結(jié)果。

關(guān)于回歸的細(xì)節(jié),作者依次討論了樣本權(quán)重和被解釋變量有限不連續(xù)。
對回歸進(jìn)行加權(quán)平均的一個(gè)簡單經(jīng)驗(yàn)就是當(dāng)加權(quán)可使估計(jì)的數(shù)值更加接近總體的相應(yīng)值時(shí)么就應(yīng)該使用加權(quán)回歸。比如,我們的被估計(jì)量是總體回歸方程,但是用來估計(jì)的樣本是非隨機(jī)的,那么這時(shí)候用加權(quán)最小二乘法就很有道理。

很多經(jīng)驗(yàn)研究中使用的被解釋變量都只取有限的一些值。很多教科書說OLS適合于估計(jì)的被解釋變量是連續(xù)變量的情形,當(dāng)我們感興趣的被解釋變量取值有限時(shí),線性回歸模型就不合適,此時(shí)用類似于probit和tobit等非線性模型會更好。

但作者認(rèn)為有限被解釋變量帶來的問題并不嚴(yán)重,因?yàn)榛貧w的合法性來自它和條件期望函數(shù)之間的關(guān)系。在考慮邊際效應(yīng)時(shí),線性模型和非線性模型下結(jié)論的差別很小。像奧拉姆剃刀原理所說“如無必要,勿增實(shí)體”。雖然計(jì)算邊際效應(yīng)很容易,但對于非線性模型還有很多問題要處理,特別是當(dāng)我們在非線性模型中使用工具變量或者面板數(shù)據(jù)時(shí),還會遇到更復(fù)雜的問題。

參考資料:

  1. 《基本無害的計(jì)量經(jīng)濟(jì)學(xué)》
  2. 傾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的運(yùn)用
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 混雜因素通常具備以下幾個(gè)特點(diǎn): *混雜因素必須與研究結(jié)局密切相關(guān); * 混雜因素又與研究的暴露/處理因素有關(guān);...
    飄樂云閱讀 9,449評論 0 11
  • 多目標(biāo)跟蹤的問題是這樣的:有一段視頻,視頻是由 N 個(gè) 連續(xù)幀構(gòu)成的。從第一幀到最后一幀,里面有多個(gè)目標(biāo),不斷地有...
    Fantesla閱讀 6,634評論 0 9
  • 1. 簡述相關(guān)分析和回歸分析的區(qū)別和聯(lián)系。 回歸分析和相關(guān)分析都是研究兩個(gè)或兩個(gè)以上變量之間關(guān)系的方法。 廣義上說...
    安也也閱讀 9,179評論 0 3
  • 轉(zhuǎn)載自 https://mp.weixin.qq.com/s/OXXtPoBrCADbwxVyEbfbYg 25....
    _龍雀閱讀 1,875評論 0 0
  • 上海的風(fēng)跟餓虎似的,聽著怪滲人的。前天刮了一整天的風(fēng),帶下來幾個(gè)小雨。出門一趟,臉上刮的生疼。昨天早上起來,發(fā)現(xiàn)外...
    靈芙醉客閱讀 481評論 0 12

友情鏈接更多精彩內(nèi)容