回歸系數(shù)的解釋

在最近的項(xiàng)目中經(jīng)常會(huì)做到線性回歸方面的分析,跟客戶解釋相關(guān)結(jié)果時(shí),用比較學(xué)術(shù)的統(tǒng)計(jì)詞匯闡述結(jié)果常常令人不知所云。我常常想,只有能用最簡單的話跟別人解釋清楚才真的證明是你懂了。于是為了讓自己看起來好懂的樣子,我在網(wǎng)上扒拉半天,找到一本《例解回歸分析》:

96dda144ad3459823fe10ed50ff431adcbef840a.jpg

它恰好是一本深入淺出的書,在此十分推薦大家閱讀(雖然我也還沒讀過多少吧!哈哈!)今天想跟大家分享的正是這本書中的內(nèi)容:回歸系數(shù)的解釋(在48頁)。
對(duì)于多元回歸方程中的回歸系數(shù)的解釋比較混亂,可以從不同的角度進(jìn)行解釋。先說一下回歸方程,簡單線性回歸方程表示一條直線,而多元線性回歸方程表示一個(gè)平面(有兩個(gè)預(yù)測(cè)變量時(shí))或者一個(gè)超平面(有多個(gè)預(yù)測(cè)變量時(shí))。在多元回歸分析中,常系數(shù)的意義與簡單回歸中的一樣,?表示:當(dāng)X_1 = X_2 = ... = X_p = 0時(shí)Y的值?,而回歸系數(shù)\beta_j (j=1,2,...,p)則有多種解釋。一種解釋是,當(dāng)X_j變化一個(gè)單位而其他預(yù)測(cè)變量固定取常數(shù)時(shí),Y的改變量,這個(gè)改變量與其他預(yù)測(cè)變量固定取什么常數(shù)無關(guān),然而,在實(shí)際中,預(yù)測(cè)變量間往往是有關(guān)聯(lián)的,可能無法做到固定某些預(yù)測(cè)變量的值而改變其他變量的值,這是這種解釋的弱點(diǎn)。

回歸系數(shù)\beta_j的另一種解釋是,經(jīng)過其他預(yù)測(cè)變量的“調(diào)整”后,X_j對(duì)響應(yīng)變量Y的貢獻(xiàn),因此\beta_j也稱為偏回歸系數(shù)。那多元回歸中的“調(diào)整”如何理解呢?作者用有兩個(gè)解釋變量的多元回歸為例說明這個(gè)問題。例如在主管業(yè)績數(shù)據(jù)中,僅取X_1X_2作為解釋變量,得到回歸方程為:
\hat Y = 15.3276 + 0.7803X_1 - 0.0502X_2
作者下面用了三個(gè)步驟對(duì)“調(diào)整”的意義進(jìn)行了解釋:

  • 擬合Y對(duì)X_1的簡單回歸模型,得到\hat Y = 14.3763 + 0.754610X_1;
    記這個(gè)簡單回歸模型的殘差為e_{Y.X_1},該符號(hào)中,圓點(diǎn)之前的變量為響應(yīng)變量,之后的為預(yù)測(cè)變量。我們稱e_{Y.X_1}=Y-\hat Y為經(jīng)過X_1“調(diào)整”之后的Y(實(shí)際上,這個(gè)調(diào)整之后的Y就是殘差e_{Y.X_1}

  • 擬合X_2對(duì)X_1的簡單回歸模型,得到\hat {X_2} = 18.9654 + 0.513032X_1;
    記此回歸殘差為e_{X_2.X_1},也稱e_{X_2.X_1}=X_2-\hat X_2為經(jīng)過X_1“調(diào)整”后的X_2。

  • 擬合上面兩個(gè)殘差的簡單回歸模型,其中e_{Y.X_1}是響應(yīng)變量,e_{X_2.X_1}是預(yù)測(cè)變量,得到\hat e_{Y.X_1} = 0 - 0.0502e_{X_2.X_1}。

一個(gè)有意思的結(jié)果是,在最后一個(gè)回歸方程中,e_{X_2.X_1}的系數(shù)也是-0.0502。事實(shí)上,他們的標(biāo)準(zhǔn)誤也一樣,如何直觀的解釋呢?在第一步中,作者考察了YX_1之間的線性關(guān)系。得到的回歸殘差是Y中去掉X_1的線性影響之后的部分,或者說,是Y中與X_1沒有線性關(guān)系的部分。第二步中,作者用X_2代替Y,重復(fù)第一步的分析,此時(shí)的殘差是X_2中與X_1沒有線性關(guān)系的部分,是經(jīng)過X_1“調(diào)整”后的X_2。第三步簡歷上面的到的Y的殘差和X_2的殘差之間的線性關(guān)系,得到的回歸系數(shù)表示,去掉X_1對(duì)YX_2的線性影響之后,X_2對(duì)于Y的影響,即經(jīng)過X_1調(diào)整后,X_2對(duì)Y的影響。這就是對(duì)回歸系數(shù)\beta_j的第二種解釋。

現(xiàn)在回到一般的多元線性回歸,回歸系數(shù)\beta_j反映的是X_j對(duì)響應(yīng)變量Y的貢獻(xiàn),這種貢獻(xiàn)是YX_j都經(jīng)過其他預(yù)測(cè)變量的線性調(diào)整后得到的。因此\beta_j也取名偏回歸系數(shù),這就是多元回歸中對(duì)回歸系數(shù)的第二種解釋,比第一種解釋統(tǒng)計(jì)意義深刻一些。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容