在傳統(tǒng)計量當中,控制變量和解釋變量的地位通常不做特別區(qū)分。然而在因果研究的框架下,對二者的要求有顯著的不同。
在研究當中,解釋變量是我們所關注的“因”。對于這個因,必需確保其因果鏈足夠單純(因與果不是第三方的共同結(jié)果,同時,因果兩項不是某控制變量的共同原因)。控制變量不能是因果鏈中的中介,因為控制了中介,因就無法有效地影響果,也不能是因果的共同結(jié)果,在共同結(jié)果的影響下,我們無法判斷因果間的關系鏈條還是否是二者間的純粹聯(lián)系。
在OLS模型假定中要求無內(nèi)生性,即要求所有解釋變量均與擾動項不相關。這個假定太強,因為解釋變量一般很多,要保證都是外生,比較困難。當解釋變量可以區(qū)分為核心變量與控制變量兩類時,可以弱化該條件。
通常,回歸方程中有一個 “核心變量” 或 “感興趣的變量”,我們特別希望得到對其系數(shù)的一致估計,并將其解釋為核心變量對于被解釋變量的因果效應。對于方程中的其他變量,我們可能對于這些變量本身并無太大興趣,之所以把它們也放入回歸方程,主要是為了 “控制住” 那些對被解釋變量有影響的遺漏因素,以避免遺漏變量偏差,故稱這些次要變量為 “控制變量” 。
對于控制變量本身并不感興趣,或許就可以容忍對于控制變量系數(shù)的不一致估計,而只要核心變量的系數(shù)估計一致即可。此時,就可以不要求控制變量外生(即允許控制變量與擾動項相關),而只要在給定控制變量的條件下,核心變量與擾動項不相關即可。換言之,只要求核心變量與擾動項在某種意義上 “條件不相關” 即可。
此“條件不相關”一般以“條件均值獨立”的形式給出,在相互獨立和不相關中間,有個均值獨立。

關于條件均值獨立

“條件均值獨立” 即 “均值獨立” 的基礎上加了一個條件。

條件均值的效果:



對于非線性的條件期望

參考資料: