R語言學(xué)習(xí)筆記:線性回歸(二)多元線性回歸

當(dāng)只考慮電視廣告對銷售量的影響的時(shí)候,自變量只有一個(gè):y=kx+b,但是同樣可以將給定的數(shù)據(jù)中的Radio和Newspaper加進(jìn)去,從而控制其他因素對Sales帶來的影響,即

y = k1x1+k2x2+k3x3+……+b

采取同樣的方法,使∑n, i = 1(y-k1x1-k2x2-k3x3-b)^2最小

該種形式簡單容易解釋且應(yīng)用廣泛,易于推廣成為非線性的更復(fù)雜的模型

安裝程序包:GGally,代碼如下:

data %>% select (TV, radio, newspaper, sales) %>% ggpairs()

繪制出如下的多元回歸分析圖:


對角線為各變量自身頻率分布直方圖,右上角為變量之間的相關(guān)系數(shù)(r),左邊為相關(guān)散點(diǎn)圖

從圖中非常清晰的能看出哪一種宣傳手段的投入與銷售量之間關(guān)系最弱

對這幾個(gè)變量進(jìn)行多元回歸分析代碼:

model2 = lm (sales~TV+radio+newspaper, data = data)

summary (model2)


殘差(Residual)的Min與Max十分不對稱,推測存在outlier

根據(jù)此時(shí)的數(shù)據(jù),仍然不能下定結(jié)論削減Newspaper的開支,需要進(jìn)行驗(yàn)證

相比于之前的簡單線性回歸,模型的解釋力增加了

RSD(殘差標(biāo)準(zhǔn)誤)降低到1.686

R方增加到0.90

Adjusted R^2 = 1 - (1 - r^2)[(n-1)/n-(p+1)]

尋找多個(gè)自變量中解釋力最強(qiáng)的一組自變量:

定義解釋力:chow test,新增自變量對于減少殘差平方和的貢獻(xiàn)

調(diào)用程序包c(diǎn)ar

model3 = lm (sales~TV+radio, data = data)#去掉Newspaper后的結(jié)果

summary (model3)

library (jtools)

export_summs(model1, model2, model3)#生成三種模型并列的結(jié)果報(bào)告

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容