當(dāng)只考慮電視廣告對銷售量的影響的時(shí)候,自變量只有一個(gè):y=kx+b,但是同樣可以將給定的數(shù)據(jù)中的Radio和Newspaper加進(jìn)去,從而控制其他因素對Sales帶來的影響,即
y = k1x1+k2x2+k3x3+……+b
采取同樣的方法,使∑n, i = 1(y-k1x1-k2x2-k3x3-b)^2最小
該種形式簡單容易解釋且應(yīng)用廣泛,易于推廣成為非線性的更復(fù)雜的模型
安裝程序包:GGally,代碼如下:
data %>% select (TV, radio, newspaper, sales) %>% ggpairs()
繪制出如下的多元回歸分析圖:

對角線為各變量自身頻率分布直方圖,右上角為變量之間的相關(guān)系數(shù)(r),左邊為相關(guān)散點(diǎn)圖
從圖中非常清晰的能看出哪一種宣傳手段的投入與銷售量之間關(guān)系最弱
對這幾個(gè)變量進(jìn)行多元回歸分析代碼:
model2 = lm (sales~TV+radio+newspaper, data = data)
summary (model2)

殘差(Residual)的Min與Max十分不對稱,推測存在outlier
根據(jù)此時(shí)的數(shù)據(jù),仍然不能下定結(jié)論削減Newspaper的開支,需要進(jìn)行驗(yàn)證
相比于之前的簡單線性回歸,模型的解釋力增加了
RSD(殘差標(biāo)準(zhǔn)誤)降低到1.686
R方增加到0.90
Adjusted R^2 = 1 - (1 - r^2)[(n-1)/n-(p+1)]
尋找多個(gè)自變量中解釋力最強(qiáng)的一組自變量:
定義解釋力:chow test,新增自變量對于減少殘差平方和的貢獻(xiàn)
調(diào)用程序包c(diǎn)ar
model3 = lm (sales~TV+radio, data = data)#去掉Newspaper后的結(jié)果
summary (model3)
library (jtools)
export_summs(model1, model2, model3)#生成三種模型并列的結(jié)果報(bào)告