一、逐步回歸所屬模塊
逐步回歸在SPSSAU中歸屬于【進(jìn)階方法】模塊。
二、方法概述
逐步回歸主要用于從多個候選自變量中篩選出對因變量具有穩(wěn)定解釋作用的變量,并建立回歸模型。它適合自變量較多、希望快速判斷哪些因素值得保留的場景,常見于用戶研究、經(jīng)營分析、問卷數(shù)據(jù)分析等實操任務(wù)。
三、變量設(shè)置規(guī)則
1. 整體要求
逐步回歸需要設(shè)置1個因變量和至少1個自變量。因變量為必填項,只能放入1個;自變量為必填項,可放入多個,最多可放入200個。
2. 具體設(shè)置說明
(1)因變量
因變量只能放入定量變量,且僅支持放入1個。這意味著結(jié)果要解釋的是一個連續(xù)型結(jié)果,例如得分、金額、次數(shù)、滿意度總分等。
(2)自變量
自變量支持放入定量變量,也支持放入定類變量,至少放入1個,最多可放入200個。若放入的是定類變量,通常需要先按系統(tǒng)規(guī)則完成分類處理后再進(jìn)入模型。
四、參數(shù)設(shè)置及解釋說明
1. 保存殘差和預(yù)測值
該選項用于把本次分析生成的殘差和預(yù)測值保存下來,方便后續(xù)繼續(xù)做異常值判斷、模型檢驗或進(jìn)一步分析。若只是快速看逐步回歸結(jié)果,可以不勾選;如果后面還要繼續(xù)核查模型表現(xiàn),建議勾選。
2. 方法選擇
逐步回歸提供3種方法選擇,分別是逐步法、向前法和向后法。三種方法本質(zhì)上都是為了篩選變量,只是進(jìn)入和剔除變量的路徑不同。
● 逐步法:邊進(jìn)入邊剔除,系統(tǒng)會根據(jù)顯著性不斷比較變量是否應(yīng)保留,適合大多數(shù)常規(guī)篩選場景。
● 向前法:從少到多逐步加入變量,更適合先看哪些變量能一步步進(jìn)入模型的場景。
● 向后法:從較完整的候選變量開始,再逐步剔除不合適的變量,適合先給出較多候選解釋項再做刪減。
三種方法的進(jìn)入標(biāo)準(zhǔn)為顯著性小于0.05,移出標(biāo)準(zhǔn)為顯著性大于0.1。實際使用時,如果希望以常規(guī)、穩(wěn)妥的方式篩選變量,優(yōu)先選擇逐步法即可。
五、分析結(jié)果表格及其解讀
逐步回歸完成后,SPSSAU會輸出逐步回歸分析結(jié)果、簡化格式結(jié)果,在特定情況下還會輸出樣本缺失情況匯總和迭代中間過程表。
1. 表1:逐步回歸分析結(jié)果

該表格用于完整展示最終進(jìn)入模型的變量及整體模型質(zhì)量,包含非標(biāo)準(zhǔn)化系數(shù)、標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化系數(shù)、t值、p值、VIF、容忍度、R2、調(diào)整R2、F值和D-W值等核心信息。
● B:表示自變量對因變量的實際影響方向和影響大小。若B為正,說明自變量增加時因變量傾向上升;若B為負(fù),則說明因變量傾向下降。判斷時要結(jié)合p值一起看,只有顯著時這個系數(shù)才更有解釋意義。
● 標(biāo)準(zhǔn)誤:用于反映系數(shù)估計的穩(wěn)定程度。一般來說,標(biāo)準(zhǔn)誤越小,說明該系數(shù)波動越小、結(jié)果越穩(wěn)。它通常作為輔助指標(biāo),不單獨(dú)決定結(jié)論。
● Beta:是標(biāo)準(zhǔn)化后的影響系數(shù),適合比較不同自變量誰的影響更大。絕對值越大,通常說明該變量在模型中的相對作用越強(qiáng)。
● t值:用于輔助判斷某個自變量是否顯著。通常t值絕對值越大,變量越可能達(dá)到顯著。實際解讀時仍以p值為準(zhǔn)。
● p值:用于判斷變量是否顯著進(jìn)入模型。一般小于0.05說明該變量對因變量的影響達(dá)到統(tǒng)計意義;大于等于0.05時,說明其解釋作用不夠穩(wěn)定。
● VIF:用于判斷自變量之間是否存在共線性問題。通常VIF小于5說明共線性風(fēng)險較低;若明顯偏高,則說明變量之間可能過于接近,需要謹(jǐn)慎解釋。
● 容忍度:也是判斷共線性的指標(biāo),和VIF配合使用。一般容忍度小于0.2時提示可能存在共線性風(fēng)險,更嚴(yán)格時可關(guān)注是否低于0.1。
● R2:表示模型對因變量的解釋程度,數(shù)值越大,說明模型解釋力越強(qiáng)。
● 調(diào)整R2:是在考慮變量數(shù)量后對R2進(jìn)行修正,更適合用來評價逐步回歸模型是否真正有效。若調(diào)整R2與R2差距不大,通常說明模型較穩(wěn)定。
● F值及其顯著性:用于判斷整個模型是否成立。若對應(yīng)顯著性小于0.05,說明至少有一個自變量對因變量有顯著影響,模型整體可用。
● D-W值:用于輔助判斷殘差是否相互獨(dú)立。通常接近2時說明殘差獨(dú)立性較好;如果偏離2較多,則需要進(jìn)一步關(guān)注模型設(shè)定是否合適。
2. 表2:逐步回歸分析結(jié)果-簡化格式

該表格是對核心結(jié)果的濃縮展示,便于論文寫作、報告匯報或快速提煉結(jié)論,包含回歸系數(shù)、95%置信區(qū)間、VIF、容忍度、樣本量、R2、調(diào)整R2和F值等信息。
● 回歸系數(shù):用于快速查看各變量的影響方向與大小,并同時配合括號中的t值判斷變量表現(xiàn)。若系數(shù)方向明確且顯著,說明該變量具有穩(wěn)定解釋作用。
● 95%置信區(qū)間:用于觀察系數(shù)估計的大致范圍。區(qū)間越集中,通常說明結(jié)果越穩(wěn)定;若區(qū)間表現(xiàn)較分散,則說明系數(shù)不夠穩(wěn)。
● 樣本量:表示參與最終分析的有效樣本數(shù)。樣本量越充分,模型結(jié)果通常越有參考價值。
● R2與調(diào)整R2:用于快速概括模型解釋力。若兩者都較高且差距不大,通常說明模型擬合表現(xiàn)較好。
● F值:用于快速判斷模型整體是否顯著,若對應(yīng)顯著性小于0.05,說明模型整體成立。
3. 表3:樣本缺失情況匯總

當(dāng)原始數(shù)據(jù)中存在被排除的無效樣本時,系統(tǒng)會輸出該表,用于說明最終有效樣本和被排除樣本的數(shù)量及占比。
● 有效樣本:表示真正進(jìn)入逐步回歸分析的數(shù)據(jù)量。有效樣本越多,結(jié)果通常越穩(wěn)定。
● 排除無效樣本:表示因缺失、異?;虿粷M足分析要求而未進(jìn)入模型的樣本數(shù)。若占比過高,需要先檢查數(shù)據(jù)質(zhì)量,否則會影響結(jié)論代表性。
● 占比:用于直觀看樣本保留情況。通常有效樣本占比越高越理想。
4. 表4:迭代中間過程

當(dāng)系統(tǒng)展示變量逐輪進(jìn)入或移出模型的過程時,會輸出該表。它用于幫助用戶理解逐步法、向前法或向后法是如何篩選變量的。
● 迭代次數(shù):表示模型篩選變量的輪次,能夠幫助判斷模型是如何一步步形成的。
● 項:表示每一輪被考察的變量。若某變量多輪都未穩(wěn)定保留,通常說明其解釋作用不夠穩(wěn)。
● 未標(biāo)準(zhǔn)化系數(shù)、標(biāo)準(zhǔn)誤、t值、p值:這些指標(biāo)共同用于判斷變量在某一輪中是否值得進(jìn)入或繼續(xù)保留在模型中。實際解讀重點(diǎn)仍然是看p值是否達(dá)到顯著標(biāo)準(zhǔn)。
六、分析結(jié)果圖表及其解讀
逐步回歸完成后,SPSSAU還會輸出模型結(jié)果圖,用于更直觀地呈現(xiàn)保留變量、剔除變量與因變量之間的關(guān)系。
模型結(jié)果圖
該圖表的作用是把最終進(jìn)入模型的自變量、未進(jìn)入或被剔除的變量,以及因變量之間的關(guān)系直觀展示出來。圖中與因變量直接相連的自變量,說明其最終被保留在模型中;未被保留的變量通常會以被剔除或弱化的方式呈現(xiàn)。
解讀時可以重點(diǎn)看兩點(diǎn):第一,哪些變量最終與因變量形成穩(wěn)定連接,這些就是模型最終保留的關(guān)鍵解釋項;第二,連線對應(yīng)的系數(shù)方向和顯著性表現(xiàn)是否清晰,若方向明確且達(dá)到顯著,說明該變量具有較穩(wěn)定的解釋意義。
以上就是SPSSAU逐步回歸方法的相關(guān)內(nèi)容,更深入教程可查看SPSSAU幫助手冊、教學(xué)視頻、疑難解惑等資料。