2019-11-26logitstic(1)

1、logistic的r2

logit模型結(jié)果中的準(zhǔn)R2和后面的預(yù)測準(zhǔn)確率都是判斷其擬合好壞的指標(biāo)。不過由于logit模型是一個非線性模型,所以準(zhǔn)R2的計算一般只做一個參考。大家一般看預(yù)測準(zhǔn)確率的。此外,準(zhǔn)R2低也并不一定代表模型不好,它只是表示你模型中還遺漏了很多可能與因變量有關(guān)的自變量而已,只要這些遺漏的變量是外生的,就沒問題的(而遺漏的變量是否嚴格外生,這點沒法判斷)。其實只要模型系數(shù)是顯著的,整體是顯著的就好的。


2、logistic的系數(shù)

系數(shù)的解釋:

(1)根據(jù)《用stata學(xué)微觀計量經(jīng)濟學(xué)》的說法,同一個模型,logit估計值大概是ols的5倍,probit估計值是ols的3倍。按照陳強《高級計量經(jīng)濟學(xué)及stata應(yīng)用》,probit模型的相關(guān)系數(shù)之間難以進行比較,因而也是probit模型的劣勢。

(2) 在stata的幫助文件中,提供了OR系數(shù)選項。or reports the estimated coefficients transformed to odds ratios, that is, exp(b) rather than b. Standard errors and confidence intervals are similarly transformed. This option affects how results are displayed, not how they are? estimated.? or may be specified at estimation or when replaying previously estimated results.

原始logit模型為下圖

公式 1


通過反對數(shù)操作可以解決難以解釋系數(shù)的問題,


公式 2

若在公式1 中三個系數(shù)分別為0.13 -1.29 0.68,則,取以e為底的冪后,變成了1.14,0.28,和0.51,即冪系數(shù)。

若工作年限的冪系數(shù)為1.14,則每多一年工作年限,使得勞動力參與比數(shù)(ρ∕1?ρ,即參與勞動與未參與勞動之比)增加了1.14倍,例如若工作12年的勞動參與比為4.88,則13年的參與比為5.56*1.14,

用更加直觀的表述方式,將比數(shù)比減去1乘以100%,極為自變量一個單位變化帶來的增加或減少的百分比。需要注意的是,這里指的是倍數(shù)的改變而非概率的改變。


3、異方差的處理

logit 回歸采用hetprob選項進行檢驗,若h0被拒絕,則說明存在異方差問題

可以加robust 以及增加交互項,只要在構(gòu)建模型前對數(shù)據(jù)做了一些預(yù)處理(如有偏態(tài)分布數(shù)據(jù)取對數(shù),自變量間是否存在嚴重多重共線性等),那么最后的結(jié)果加不加robust對結(jié)果都影響不大的(變量的顯著性不會發(fā)生太大改變,可能就是前后的標(biāo)準(zhǔn)誤有一點點差別)。穩(wěn)健的logit回歸,建議做做交互項,再加點其它控制變量看你關(guān)注的變量是否依然顯著。以此去判斷是否穩(wěn)健。

https://bbs.pinggu.org/forum.php?mod=viewthread&tid=4652489&page=1

也可以加入 robust 選項,進行懷特異方差修正,對比兩個回歸結(jié)果,判斷系數(shù)差異程度


4、

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容