去年10月份一篇讀書筆記,當(dāng)時(shí)看的是《基本無害的計(jì)量經(jīng)濟(jì)學(xué)》
對于協(xié)變量(獨(dú)立變量,實(shí)驗(yàn)者不能操作,但是仍影響實(shí)驗(yàn)結(jié)果),作者引入傾向評分來控制協(xié)變量。

傾向評分定理指出我們只要將影響處理概率的協(xié)變量控制住就好。下面以一個(gè)例子來再闡述下~
例子:分析讀研究生與否對小明同學(xué)的影響。
困難:小明已經(jīng)讀了研究生,怎么才能估計(jì)出他要是不讀研究生,他的收入會是多少呢?
辦法:引入“傾向得分匹配”,這種方法能讓我們從一堆沒有讀研究生的人群中(即我們的總體樣本的一個(gè)子集),對每個(gè)人讀研究生的概率進(jìn)行估計(jì),然后選出和小明具有非常相似的去讀研究生的概率,可是沒有去讀的小剛同學(xué)——作為小明的對照,然后再來看他們的區(qū)別。
步驟:
- 要對總體樣本執(zhí)行probit或者logit模型,然后估計(jì)出每一個(gè)觀測對象讀研究生的概率是多少。
probit [dependent var] [independent var]
其中,[dependent var]是一個(gè)0或1的二進(jìn)制變量,1代表該對象讀了研究生,否則是0。 - 對每一個(gè)觀測值,我們根據(jù)估計(jì)出來的probit模型,算出他讀研究生的概率是多少。
predict pscore, p
其中,pscore是定義的記錄每個(gè)觀測對象概率的變量名稱。 - 使用psmatch2命令,讓Stata幫你對于每個(gè)讀了研究生的觀測對象,找出一個(gè)與之具有最接近的概率值的,可是沒有讀研究生的觀測對象
psmatch2 [dependent var], pscore(pscore) noreplacement
其中,(pscore)是在第二步中生成的那個(gè)記錄對象概率的變量,noreplacement是一個(gè)選項(xiàng),使得任何讀了研究生的觀察對象的對照對象都具有唯一性,換言之,只能1對1匹配。 - Stata會在你的數(shù)據(jù)中自動添加幾個(gè)變量,其中_id是自動生成的每一個(gè)觀測對象唯一的ID;_treated表示某個(gè)對象是否讀了研究生,如果讀了,_n表示的是他被匹配到的對照對象的_id;_pdif表示一組匹配了的觀察對象他們概率值的差
傾向評分模型將我們的注意力從估計(jì)E[Yi|Xi,Di]轉(zhuǎn)移到估計(jì)傾向評分p(Xi)=E[Di|Xi],在實(shí)際運(yùn)用中后者更便于模型化。
但作者仍認(rèn)為回歸應(yīng)該成為大部分經(jīng)驗(yàn)研究項(xiàng)目的起點(diǎn),盡管用傾向評分匹配我們提供了一個(gè)更加可靠的對平均處理效果的估計(jì)。因?yàn)樵谶\(yùn)用傾向評分方法進(jìn)行匹配時(shí)有太多的細(xì)節(jié)需要考慮,比如如何模型化評分,如何進(jìn)行推斷,目前還沒有形成一套標(biāo)準(zhǔn),造成即使使用相同的數(shù)據(jù)和協(xié)變量,不同的研究者也可能得到不同的結(jié)果。
關(guān)于回歸的細(xì)節(jié),作者依次討論了樣本權(quán)重和被解釋變量有限不連續(xù)。
對回歸進(jìn)行加權(quán)平均的一個(gè)簡單經(jīng)驗(yàn)就是當(dāng)加權(quán)可使估計(jì)的數(shù)值更加接近總體的相應(yīng)值時(shí)么就應(yīng)該使用加權(quán)回歸。比如,我們的被估計(jì)量是總體回歸方程,但是用來估計(jì)的樣本是非隨機(jī)的,那么這時(shí)候用加權(quán)最小二乘法就很有道理。
很多經(jīng)驗(yàn)研究中使用的被解釋變量都只取有限的一些值。很多教科書說OLS適合于估計(jì)的被解釋變量是連續(xù)變量的情形,當(dāng)我們感興趣的被解釋變量取值有限時(shí),線性回歸模型就不合適,此時(shí)用類似于probit和tobit等非線性模型會更好。
但作者認(rèn)為有限被解釋變量帶來的問題并不嚴(yán)重,因?yàn)榛貧w的合法性來自它和條件期望函數(shù)之間的關(guān)系。在考慮邊際效應(yīng)時(shí),線性模型和非線性模型下結(jié)論的差別很小。像奧拉姆剃刀原理所說“如無必要,勿增實(shí)體”。雖然計(jì)算邊際效應(yīng)很容易,但對于非線性模型還有很多問題要處理,特別是當(dāng)我們在非線性模型中使用工具變量或者面板數(shù)據(jù)時(shí),還會遇到更復(fù)雜的問題。
參考資料:
- 《基本無害的計(jì)量經(jīng)濟(jì)學(xué)》
- 傾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的運(yùn)用