
一般在進(jìn)行回歸之前,會先對數(shù)據(jù)進(jìn)行相關(guān)性的探索分析。本片內(nèi)容是對上一篇內(nèi)容的深入,在確立相關(guān)性的基礎(chǔ)之上進(jìn)行回歸分析,確定出文教娛樂與衣著之間的回歸方程。
Spass實(shí)戰(zhàn)
依次選擇分析 -> 回歸 -> 線性
統(tǒng)計選項(xiàng)卡中依次選中估算值,模型擬合
分析結(jié)果
表一:方差分析表

查看對模型的檢驗(yàn),該檢驗(yàn)是對模型的F檢驗(yàn),顯著性指標(biāo)與0.05進(jìn)行比較。
表二:回歸系數(shù)表

對回歸系數(shù)進(jìn)行T顯著性檢驗(yàn),顯著性指標(biāo)與0.05進(jìn)行比較。可以直接根據(jù)B列寫出回歸方程。
表三:模型摘要表

這里的R表示的是自變量與因變量的相關(guān)程度。值越大表示相關(guān)程度越高
這里R方用來評估的是自變量與因變量組成的散點(diǎn)與回歸曲線的接近程度,取值于0,1之間。越接近1說明擬合的越好。
Python實(shí)戰(zhàn)
加載數(shù)據(jù)并簡單探索
data_pca = pd.read_excel('data_pca.xlsx', 'consumption', index_col=0, na_values=['NA'])
# kind` could be one of ['scatter', 'hist', 'hex', 'kde', 'reg', 'resid'], but lin was passed.`
sns.jointplot(data_pca['衣著'],data_pca['文教娛樂'], kind = "reg")
plt.show()

構(gòu)建最小二乘模型并擬合
y = data_pca['文教娛樂']
x = data_pca['衣著']
x = sm.add_constant(x)
model = sm.OLS(y, x).fit()
print(model.summary())

利用模型進(jìn)行預(yù)測
predicts = model.predict()
x = data_pca['衣著']
plt.scatter(x, y, label='實(shí)際值')
plt.plot(x, predicts, color = 'red', label='預(yù)測值')
plt.legend()
plt.show()

參考: