統(tǒng)計學(xué)方法:回歸分析實(shí)戰(zhàn)

一般在進(jìn)行回歸之前,會先對數(shù)據(jù)進(jìn)行相關(guān)性的探索分析。本片內(nèi)容是對上一篇內(nèi)容的深入,在確立相關(guān)性的基礎(chǔ)之上進(jìn)行回歸分析,確定出文教娛樂與衣著之間的回歸方程。

Spass實(shí)戰(zhàn)

依次選擇分析 -> 回歸 -> 線性
統(tǒng)計選項(xiàng)卡中依次選中估算值,模型擬合
分析結(jié)果
表一:方差分析表


查看對模型的檢驗(yàn),該檢驗(yàn)是對模型的F檢驗(yàn),顯著性指標(biāo)與0.05進(jìn)行比較。

表二:回歸系數(shù)表


對回歸系數(shù)進(jìn)行T顯著性檢驗(yàn),顯著性指標(biāo)與0.05進(jìn)行比較。可以直接根據(jù)B列寫出回歸方程。

表三:模型摘要表

這里的R表示的是自變量與因變量的相關(guān)程度。值越大表示相關(guān)程度越高
這里R方用來評估的是自變量與因變量組成的散點(diǎn)與回歸曲線的接近程度,取值于0,1之間。越接近1說明擬合的越好。

Python實(shí)戰(zhàn)

加載數(shù)據(jù)并簡單探索

data_pca = pd.read_excel('data_pca.xlsx', 'consumption', index_col=0, na_values=['NA'])

# kind` could be one of ['scatter', 'hist', 'hex', 'kde', 'reg', 'resid'], but lin was passed.`
sns.jointplot(data_pca['衣著'],data_pca['文教娛樂'], kind = "reg")
plt.show()

構(gòu)建最小二乘模型并擬合

y = data_pca['文教娛樂']
x = data_pca['衣著']
x = sm.add_constant(x)
model = sm.OLS(y, x).fit()
print(model.summary())

利用模型進(jìn)行預(yù)測

predicts = model.predict() 
x = data_pca['衣著'] 
plt.scatter(x, y, label='實(shí)際值')
plt.plot(x, predicts, color = 'red', label='預(yù)測值')
plt.legend() 
plt.show() 

參考:

使用 python 做線性回歸

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容