?本專欄旨在分享日常學(xué)習(xí)計量時整理的筆記。所記之物來自網(wǎng)絡(luò)、書籍,自己僅有整理匯集之功,涉及資料在文末標(biāo)注,版權(quán)歸原作者所有。
一、什么是內(nèi)生性?
內(nèi)生性問題是解釋變量與擾動項相關(guān)導(dǎo)致的,具體的表現(xiàn)形式有遺漏變量、雙向因果和測量誤差。
- 遺漏變量
遺漏變量是指可能與解釋變量相關(guān)的變量,本來應(yīng)該加以控制,但是沒有控制。此時該變量會跑到擾動項中,造成擾動項與解釋變量相關(guān)。 - 雙向因果
雙向因果是指核心解釋變量A和被解釋變量B互相影響。假設(shè)擾動項發(fā)生正向沖擊,B會增加,則A發(fā)生變動,如此就有核心解釋變量A和擾動項相關(guān)。此時,如果B對A有正向影響,正向沖擊便會導(dǎo)致A增加,從而導(dǎo)致核心解釋變量A和擾動項正相關(guān)。反之,會有核心解釋變量A和擾動項負(fù)相關(guān)。 - 測量誤差
測量誤差是指被解釋變量存在度量誤差或解釋變量存在度量誤差。
(1)當(dāng)解釋變量存在度量誤差
y=α+βx'+e,x'無法精確觀測,只能觀測到x,x=x'+u,u為度量誤差
此時有:y=α+βx+(e-βu)
因為u和x相關(guān),所以新的擾動項e-βu和x存在相關(guān)關(guān)系,產(chǎn)生了內(nèi)生性。此時,估計得到的系數(shù)絕對值會偏小。
(2)當(dāng)被解釋變量存在度量誤差
y'=α+βx+e,y'無法精確觀測,只能觀測到y(tǒng),y=y'+v,v為度量誤差
此時有:y=α+βx+(e+v)
只要Cov(x,v)=0,則OLS估計量仍是一致的,但會增大擾動項的方差;若Cov(x,v)≠0,就會產(chǎn)生內(nèi)生性問題
有:y=α+βx+(e-βu)。
二、內(nèi)生性問題的影響
OLS能夠成立的最重要前提條件是解釋變量與擾動項不相關(guān)。否則,OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等于真實值。一致性是指,隨著樣本的增大,估計量無限接近于真實值。
三、如何解決內(nèi)生性問題
1.固定效應(yīng)模型
固定效應(yīng)模型在一定程度上可以緩解內(nèi)生性。因為使用固定效應(yīng)模型的原因是存在個體效應(yīng)、時間效應(yīng)與解釋變量相關(guān)。此時如果不用固定效應(yīng)模型,這些個體、時間影響就會溜到擾動項中,就產(chǎn)生了內(nèi)生性問題。
2.IV/2SLS
解決內(nèi)生性問題常見的做法是使用工具變量。
2.1工具變量
工具變量:與模型中內(nèi)生變量(解釋變量)高度相關(guān),但卻不與誤差項相關(guān),估計過程中被作為工具使用,以替代模型中與誤差項相關(guān)的解釋變量的變量。
“找好的工具變量好比尋找一個好的伴侶,ta應(yīng)該強(qiáng)烈地愛著你(強(qiáng)相關(guān)),但不能愛著別人(外生性)?!?/strong>

2.2 兩階段最小二乘法
IV法可以視為2SLS的特例。當(dāng)內(nèi)生變量個數(shù)=工具變量個數(shù)時,稱為IV法;當(dāng)內(nèi)生變量個數(shù)<工具變量個數(shù)時,稱為2SLS
2SLS思路如下:
y=α+βx1+γx2+u,其中x1是嚴(yán)格外生的,x2是內(nèi)生的,則至少需要1個工具變量,z1為工具變量。
第一階段回歸:內(nèi)生變量和工具變量
x2=a+bz1+cx1+e
第二階段回歸:內(nèi)生變量的預(yù)測值和被解釋變量
y=α+βx1+γx2'+v
2SLS背后邏輯:
將內(nèi)生解釋變量分為兩部分,有工具變量造成的外生部分和與擾動項相關(guān)的內(nèi)生部分。
第一階段:通過外生變量的預(yù)測回歸,得到這些變量的外生部分。
第二階段:把被解釋變量對解釋變量中的外生部分進(jìn)行回歸,消除偏誤得到一致估計。
注意:為了保證2SLS的一致性,必須把原方程中所有的外生解釋變量都放入第一階段回歸。
2SLS的難點在于恰當(dāng)?shù)墓ぞ咦兞窟x擇。若存在N個內(nèi)生解釋變量,則至少需要N個工具變量。
假設(shè)回歸模型
y= α+βx1+γx2+u,其中x1是外生的,x2是內(nèi)生的,有兩個工具變量z1和z2。
stata命令如下:
ivregress 2sls depvar [varlist1] (varlist2 = varlist_iv)
*depvar 被解釋變量
*varlist1 外生解釋變量
*varlist2 內(nèi)生解釋變量
*varlist_iv 工具變量
*示例1
ivregress 2sls y x1 (x2= z1 z2) //普通標(biāo)準(zhǔn)誤
ivregress 2sls y x1 (x2= z1 z2), r first //異方差穩(wěn)健標(biāo)準(zhǔn)誤、顯示第一階段的回歸
*示例2 3
ssc inatll ivreg2
ssc install xtivreg2
ssc install ranktest
ivreg2 y x1 (x2= z1 z2), r //異方差穩(wěn)健標(biāo)準(zhǔn)誤
xtivreg2 y x1 (x2= z1 z2), fe r //異方差穩(wěn)健標(biāo)準(zhǔn)誤、固定效應(yīng)+2SLS
以上命令ivregress 2sls 和 ivreg2是等價的,只是 ivreg2顯示的內(nèi)容更為豐富。xtivreg2 相較于ivreg2,就是OLS和FE/FD模型的差別,ivreg2 ... i.Year i.id等價于xtivreg2 ... i.Year, fe。
2.3 工具變量的檢驗
針對工具變量有三大檢驗:
- 內(nèi)生性檢驗
Cov(x,u)≠0 - 相關(guān)性檢驗 (不可識別檢驗、弱工具變量檢驗)
Cov(x,z)≠0 - 外生性檢驗(過度識別檢驗)
Cov(z,u)=0
以上三大檢驗,優(yōu)先做相關(guān)性檢驗。這是由于弱工具變量會對估計結(jié)果以及外生性檢驗結(jié)果產(chǎn)生影響。
(1)相關(guān)性檢驗
a.不可識別檢驗
不可識別檢驗的原假設(shè)是秩條件不成立,即工具變量與解釋變量不相關(guān)。不可識別檢驗在一定程度上可以驗證是否存在弱工具變量,但不能取代對弱工具變量的檢驗。關(guān)于弱工具變量的檢驗,可以分為單個內(nèi)生變量和多個內(nèi)生變量。
*示例
ivreg2 y x1 (x2= z1 z2), r //異方差穩(wěn)健標(biāo)準(zhǔn)誤
xtivreg2 y x1 (x2= z1 z2), fe r //異方差穩(wěn)健標(biāo)準(zhǔn)誤、固定效應(yīng)+2SLS
b.弱工具變量檢驗
如果方程中有一個內(nèi)生變量,一個經(jīng)驗規(guī)則是在第一階段回歸中,如果F統(tǒng)計量>10,則可拒絕“存在弱工具變量”的原假設(shè),不必?fù)?dān)心弱工具變量的問題。
*示例
ivregress 2sls y x1 (x2= z1 z2), r first //異方差穩(wěn)健標(biāo)準(zhǔn)誤、顯示第一階段的回歸
如果方程中有多個內(nèi)生變量,Stock & Yogo給出了檢驗規(guī)則:如果弱識別檢驗的最小特征值統(tǒng)計量>15% maximal IV size對應(yīng)的臨界值,就可以認(rèn)為工具變量不存在弱相關(guān)問題。
*示例
ivreg2 y x1 (x2= z1 z2), r //異方差穩(wěn)健標(biāo)準(zhǔn)誤
xtivreg2 y x1 (x2= z1 z2), fe r //異方差穩(wěn)健標(biāo)準(zhǔn)誤、固定效應(yīng)+2SLS
如果發(fā)現(xiàn)是弱工具變量,解決的方法有:
- 尋找更強(qiáng)的工具變量
- 使用LIML(有限信息最大似然法),其對弱工具變量不敏感
- 如果有較多的工具變量,可以進(jìn)行“冗余檢驗”,舍棄弱工具變量。冗余檢驗的原假設(shè)是,指定的工具變量是多余的。
*liml方法
ivregress liml y x1 (x2= z1 z2), r //異方差穩(wěn)健標(biāo)準(zhǔn)誤、liml方法
ivreg2 y x1 (x2= z1 z2), r liml //異方差穩(wěn)健標(biāo)準(zhǔn)誤、liml方法
xtivreg2 y x1 (x2= z1 z2), fe r liml //異方差穩(wěn)健標(biāo)準(zhǔn)誤、liml方法
*冗余檢驗
ivreg2 y x1 (x2= z1 z2), r redundant(varlist) //異方差穩(wěn)健標(biāo)準(zhǔn)誤、冗余檢驗
xtivreg2 y x1 (x2= z1 z2), fe r redundant(varlist) //異方差穩(wěn)健標(biāo)準(zhǔn)誤、冗余檢驗、固定效應(yīng)+2SLS
(2)內(nèi)生性檢驗
首先假定內(nèi)生性進(jìn)行2SLS回歸,然后假定不存在內(nèi)生性進(jìn)行OLS回歸,最后使用豪斯曼檢驗。
當(dāng)p值<0.1時,表明兩個回歸的系數(shù)存在顯著的系統(tǒng)性差異,及關(guān)注的核心變量有內(nèi)生性。
*示例1
reg y x1 x2
est store ols
ivregress 2sls y x1 (x2=z1 z2)
est store iv
hausman iv ols, constant sigmamore //根據(jù)存儲的結(jié)果進(jìn)行豪斯曼檢驗
*示例2
ivreg2 y x1 (x2= z1 z2), r endog(x2) //異方差穩(wěn)健標(biāo)準(zhǔn)誤
*示例3
xtivreg2 y x1 (x2= z1 z2), fe r endog(x2) //異方差穩(wěn)健標(biāo)準(zhǔn)誤、固定效應(yīng)+2SLS
(3)外生性檢驗
在恰好識別的情況下,即工具變量數(shù)=內(nèi)生變量數(shù),此時公認(rèn)無法檢驗工具變量的外生性,即工具變量與擾動項不相關(guān)。在這種情況下,只能進(jìn)行定性討論或依賴于專家的意見。在過度識別的情況下,可以進(jìn)行“過度識別檢驗”。當(dāng)p>0.1,接受原假設(shè),說明工具變量具有外生性。
*示例
ivreg2 y x1 (x2= z1 z2), r orthog(z1 z2) //異方差穩(wěn)健標(biāo)準(zhǔn)誤
xtivreg2 y x1 (x2= z1 z2), fe r orthog(z1 z2) //異方差穩(wěn)健標(biāo)準(zhǔn)誤、固定效應(yīng)+2SLS
注意,如果誤差項存在異方差或自相關(guān),那么2SLS的估計雖然是一致估計量,但不是有效估計量。更有效的方法是“廣義矩估計”GMM。某種意義上,GMM之于2SLS,正如GLS之于OLS,前者可以獲得有效估計量,后者只能獲得一致估計量。
該方法的前提條件是:工具變量數(shù)>內(nèi)生變量數(shù),且2SLS存在異方差或自相關(guān)
*示例
ivregress gmm ...
ivreg2 ..., gmm2s
xtivreg2 ..., fe gmm
綜上,在使用stata進(jìn)行2SLS時,推薦使用ivreg2或xtivreg2。
對于面板數(shù)據(jù),建議先對模型進(jìn)行變換,然后對變換后的模型使用2SLS:
- 固定效應(yīng)模型
*離差變換
xtivreg2 y x1 (x2= z1 z2), fe r
*一階差分
xtivreg2 y x1 (x2= z1 z2), fd r
- 隨機(jī)效應(yīng)模型
xtivreg2 y x1 (x2= z1 z2), re r
參考資料:
《高級計量經(jīng)濟(jì)學(xué)及stata應(yīng)用》
面板數(shù)據(jù)分析與Stata應(yīng)用
測量誤差及其對統(tǒng)計分析的影響
有人能講講工具變量和2SLS之間的關(guān)系嗎?
工具變量法(五): 為何第一階段回歸應(yīng)包括所有外生解釋變量
xtivreg2和它的山寨者