概念
方差分析是分析分類型變量對數(shù)值型變量影響的一種統(tǒng)計分析方法,從分析數(shù)據(jù)的差異入手,分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要因素。
方差分析在統(tǒng)計學(xué)中又叫做F檢驗(yàn)
方差分析的三個前提
1、數(shù)據(jù)要服從正態(tài)分布
2、總體方差要相等
3、每一組的觀測值是不能相互影響,相互是獨(dú)立的
方差分析的四個步驟
1.先提出假設(shè)檢驗(yàn),假設(shè)因素有n個水平,每個水平的均值分別用u1、u2、u3...等表示,要檢驗(yàn)n個水平之間均值是否相等,現(xiàn)提出一個零假設(shè),假設(shè)它們之間的均值相等。
2.構(gòu)造一個統(tǒng)計量,比如F統(tǒng)計量
3.指定顯著性水平阿爾法(那個字母),一般為0.05或0.01
4.最后通過統(tǒng)計量F可以計算出概率P值,通過概率P值和我們指定的顯著性水平比較。若P值<顯著性水平,就拒絕原假設(shè),認(rèn)為各總體均值之間存在顯著性差異的;P值>顯著性水平,則不能認(rèn)為各總體均值之間存在顯著性差異。
單因素方差分析的基本思想
1、明確觀測變量和控制變量
2、分析觀測變量的方差:方差分析認(rèn)為觀測變量的變動由控制變量和隨機(jī)變量兩方面的影響?
總變差=組間差異+組內(nèi)差異
SST = SSA + SSE
其中:
SST:總離差平方和
SSA:組內(nèi)離差平方和,由控制變量的不同水平組成的變量
SSE:組內(nèi)離差平方和,由抽樣誤差引起的變差
3、比較觀測變量總離差平方和各部分的比例:
(1)組間離差平方和所占比例較大,即觀測變量的變動主要由控制變量引起;
(2)組間離差平方和所占比例較小,即觀測變量的變動主要由隨機(jī)變量引起;
案例
題目

變量視圖

數(shù)據(jù)
1.00 1.00 75.00
2.00 1.00 69.00
4.00 1.00 63.00
3.00 1.00 52.00
1.00 2.00 57.00
2.00 2.00 51.00
4.00 2.00 67.00
3.00 2.00 61.00
1.00 3.00 76.00
2.00 3.00 100.00
4.00 3.00 85.00
3.00 3.00 61.00
1.00 4.00 77.00
2.00 4.00 90.00
4.00 4.00 80.00
3.00 4.00 76.00
1.00 5.00 75.00
2.00 5.00 77.00
4.00 5.00 87.00
3.00 5.00 57.00
1.00 6.00 72.00
2.00 6.00 60.00
4.00 6.00 62.00
3.00 6.00 52.00
1.00 7.00 76.00
2.00 7.00 33.00
4.00 7.00 70.00
3.00 7.00 33.00
1.00 8.00 81.00
2.00 8.00 79.00
4.00 8.00 75.00
3.00 8.00 69.00
1.00 9.00 63.00
2.00 9.00 73.00
4.00 9.00 40.00
3.00 9.00 60.00
1.00 10.00 94.00
2.00 10.00 100.00
4.00 10.00 64.00
3.00 10.00 61.00
1.00 11.00 54.00
2.00 11.00 61.00
4.00 11.00 40.00
1.00 12.00 70.00
2.00 12.00 68.00
4.00 12.00 67.00
3.00 12.00 66.00
1.00 13.00 87.00
2.00 13.00 68.00
4.00 13.00 51.00
3.00 11.00 41.00
3.00 13.00 65.00
1.00 14.00 65.00
2.00 14.00 63.00
4.00 14.00 61.00
3.00 14.00 58.00
1.00 15.00 65.00
2.00 15.00 83.00
4.00 15.00 75.00
3.00 15.00 50.00
1.00 16.00 79.00
2.00 16.00 76.00
4.00 16.00 64.00
3.00 16.00 44.00
1.00 17.00 62.00
2.00 17.00 73.00
4.00 17.00 50.00
3.00 17.00 45.00
1.00 18.00 75.00
2.00 18.00 74.00
4.00 18.00 62.00
3.00 18.00 58.00
1.00 1.00 68.00
2.00 1.00 54.00
4.00 1.00 58.00
3.00 1.00 41.00
1.00 2.00 75.00
2.00 2.00 78.00
4.00 2.00 82.00
3.00 2.00 44.00
1.00 3.00 83.00
2.00 3.00 79.00
4.00 3.00 78.00
3.00 3.00 86.00
1.00 4.00 66.00
2.00 4.00 83.00
4.00 4.00 87.00
3.00 4.00 75.00
1.00 5.00 66.00
2.00 5.00 74.00
4.00 5.00 70.00
3.00 5.00 75.00
1.00 6.00 76.00
2.00 6.00 69.00
4.00 6.00 77.00
3.00 6.00 63.00
1.00 7.00 70.00
2.00 7.00 68.00
4.00 7.00 68.00
3.00 7.00 52.00
1.00 8.00 86.00
2.00 8.00 75.00
4.00 8.00 61.00
3.00 8.00 61.00
1.00 9.00 62.00
2.00 9.00 65.00
4.00 9.00 55.00
3.00 9.00 43.00
1.00 10.00 88.00
2.00 10.00 70.00
4.00 10.00 76.00
3.00 10.00 69.00
1.00 11.00 56.00
2.00 11.00 53.00
4.00 11.00 70.00
3.00 11.00 43.00
1.00 12.00 86.00
2.00 12.00 73.00
4.00 12.00 77.00
3.00 12.00 51.00
1.00 13.00 84.00
2.00 13.00 79.00
4.00 13.00 42.00
3.00 13.00 60.00
1.00 14.00 77.00
2.00 14.00 66.00
4.00 14.00 71.00
3.00 14.00 52.00
1.00 15.00 78.00
2.00 15.00 65.00
4.00 15.00 65.00
3.00 15.00 55.00
1.00 16.00 80.00
2.00 16.00 81.00
4.00 16.00 78.00
3.00 16.00 52.00
1.00 17.00 62.00
2.00 17.00 57.00
4.00 17.00 37.00
3.00 17.00 45.00
1.00 18.00 70.00
2.00 18.00 65.00
4.00 18.00 83.00
3.00 18.00 60.00
分析及步驟
此案例是通過單因素分析,不同地區(qū)和廣告形式對銷售額的影響
原假設(shè):
(1)不同廣告形式對銷售額沒有顯著影響
(2)不同地區(qū)對銷售額沒有顯著影響
在spss軟件中,選擇菜單分析|比較均值|單因素ANOVA檢驗(yàn),彈出如下對話框

因變量選擇為銷售額
因子為廣告形式
點(diǎn)擊確定,結(jié)果如下:

如果把廣告形式修改為地區(qū),結(jié)果如下:

這兩個結(jié)果的F檢驗(yàn)的顯著性水平值為0,小于0.05,拒絕原假設(shè),說明:
不同廣告形式對銷售額有顯著性影響
不同地區(qū)對銷售額有顯著性影響