載入數(shù)據(jù):


分析操作步驟:




Fisher(F):給出的是Bayes線性判別函數(shù)的系數(shù)
未標(biāo)準(zhǔn)化(U):給出未標(biāo)準(zhǔn)化的典型判別系數(shù),即費希爾投影函數(shù)。

先驗概率選相等給出的結(jié)果是距離判別的結(jié)果,根據(jù)組樣本大小計算用于貝葉斯判別。
輸出是貝葉斯判別選項

這里可以修改各組的假定概率,點擊運行即可保存。

預(yù)測組成員(Predicted group membership):存放判別樣品所屬類別的值;
判別得分(Discriminant scores):存放Fisher判別函數(shù)值(投影函數(shù))的值,有幾個典型判別函數(shù)就有幾個判別函數(shù)值變
組成員概率(Probabilities of group membership):存放樣品屬于各類的Bayes后驗概率值,總體分為幾類就生成幾個后驗概率變量。
例5.4.1鳶尾花案例的結(jié)果分析:

案例處理匯總分析,反映有效樣本和變量的缺失情況,鳶尾花這個例子沒有缺失變量。

給出組別1、組別2、組別3以及組別1、2、3共同的均值、標(biāo)準(zhǔn)差差和變量個數(shù),這個用于費希爾判別,可見第五版課本P138。

組內(nèi)協(xié)方差就是當(dāng)組一、組三和組二協(xié)方差相等時方差的聯(lián)合無偏估計,對比下第五版課本P117的方差的聯(lián)合無偏估計和第五版課本P135的公式,可得方差的聯(lián)合無偏估計*(三組變量總個數(shù)-組數(shù))=組內(nèi)平方和及叉積和矩陣(E),用于費希爾判別,可見第五版課本P138。

?因為總體協(xié)方差*相應(yīng)的自由度=總平方和,組間平方和=總平方和-組內(nèi)平方和,所以總的協(xié)方差矩陣*相應(yīng)的自由度-方差的聯(lián)合無偏估計*(三組變量總個數(shù)-組數(shù))=組間平方和及叉和矩陣(H),用于費希爾判別,可見第五版課本P138。

Box's M統(tǒng)計量檢驗各組內(nèi)協(xié)方差陣相等的假設(shè)。原假設(shè)為:H0:Σ1=Σ2=Σ3=Σ ?概率值小于0.05,故在0.05的顯著性水平下各總體協(xié)方差陣不相等,即組一、組二和組三協(xié)方差不相等。因此在分類選項中的協(xié)方差矩陣選擇可以考慮采用分組協(xié)方差。

由于只有三個組,所以只有兩個判別函數(shù)。反映判別函數(shù)的特征根(第一個特征根為32.192、第二個特征根為0.285,可見第五版課本P138)、解釋方差的比例和典型相關(guān)系數(shù)(組間平方和與總平方和之比的平方根,表示判別函數(shù)與組別間的關(guān)系程度)。第一個判別函數(shù)解釋了99.1%的方差,第二判別函數(shù)解釋了0.9%的方差,兩個判別函數(shù)解釋了全部方差。

Fisher判別函數(shù)有效性檢驗結(jié)果。該檢驗的原假設(shè)是不同組的平均Fisher判別函數(shù)值不存在顯著差異。從表中給出的p值來看,P=0.00<0.05,說明在0.05的顯著性水平下有理由拒絕原假設(shè)。1到 2?表示沒有函數(shù)被移去,拒絕原假設(shè),表明兩個判別函數(shù)能將各組樣品分開,2的表示排除了第一個判別函數(shù)后的顯著性檢驗,拒絕原假設(shè),第二個判別函數(shù)也能將各組樣品分開。

標(biāo)準(zhǔn)化判別函數(shù)系數(shù)可以看出預(yù)測變量在組成判別函數(shù)時的相對貢獻(xiàn),如本例,第一判別函數(shù)的花瓣長比較重要,第二判別函數(shù)在花萼寬比較重要。標(biāo)準(zhǔn)判別函數(shù)系數(shù)的計算是由非標(biāo)準(zhǔn)化判別函數(shù)系數(shù)乘以聯(lián)合組內(nèi)協(xié)方差矩陣主對角的平方根得來。

結(jié)構(gòu)系數(shù)即預(yù)測變量與典型判別函數(shù)的聯(lián)合組內(nèi)相關(guān)系數(shù),由聯(lián)合組內(nèi)相關(guān)系數(shù)矩陣*標(biāo)準(zhǔn)化判別函數(shù)系數(shù)矩陣計算得到。

非標(biāo)準(zhǔn)化判別函數(shù)系數(shù),即費歇爾判別函數(shù)系數(shù)。是由上面的特征根所對應(yīng)的特征向量(標(biāo)準(zhǔn)化特征向量)而得來的??梢姷谖灏嬲n本P138。
中心化的費希爾判別函數(shù)(Fisher投影函數(shù)) ,表示為
y1=-0.083*花萼長-0.153*花萼寬+0.220*花瓣長+0.281*花瓣寬-2.105
y2=0.002*花萼長+0.216*花萼寬-0.093*花瓣長+0.284*花瓣寬-6.661

?反映判別函數(shù)在各組的重心,即判別函數(shù)的組均值,由非標(biāo)準(zhǔn)化判別函數(shù)系數(shù)矩陣*(各組平均值-總平均值)得到,可見第五版課本P138。
將樣本中150個樣品的判別函數(shù)得分作一散點圖,如下所示:

判別:
本例使用了所有判別函數(shù)且概率相等,所以費希爾判別等價于距離判別等價于各先驗概率均相等時的貝葉斯判別。

分類函數(shù)處理匯總。已處理150個觀測量,沒有缺失值。

因為之前選擇的是先驗概率所有組相等,所以組一與組二的概率都為0.333,這個用于貝葉斯判別。

這里的Fisher 的線性判別式函數(shù)系數(shù)為貝葉斯的線性判別函數(shù)系數(shù),這是用貝葉斯判別分析法產(chǎn)生的分類函數(shù)系數(shù),可見課本第五版課本P121的5.2.17式,可以計算出每個觀測在各組的分類函數(shù)值,然后將觀測分類到較大的分類函數(shù)值中。

給出了判別結(jié)果,通過判別函數(shù)的預(yù)測,有147個觀測是正確的,其中,y=1組50個觀測全部被判對,y=2組50個觀測中有48個觀測被判對,y=3組50個觀測中有49個觀測被判對,從而有98%的原始觀測被判對。(可見第五版課本P141)
例5.2.3破產(chǎn)和非破產(chǎn)公司的案例結(jié)果分析:

案例處理匯總分析,反映有效樣本和變量的缺失情況。這里排除了一個變量,因為破產(chǎn)組與非破產(chǎn)組中第47個數(shù)據(jù)是待判數(shù)據(jù),所以只能選用前46個變量進行分析。

給出組別1、組別2以及組別1、2共同的均值、方差和變量個數(shù),這個用于距離判別,可見第五版課本P123。

組內(nèi)協(xié)方差就是當(dāng)組一協(xié)方差與組二協(xié)方差相等時方差的聯(lián)合無偏估計,用于距離判別,可見第五版課本P123。

組別1、組別2的協(xié)方差,用于計算組內(nèi)協(xié)方差和當(dāng)組一協(xié)方差與組二協(xié)方差不相等時的距離判別,可見第五版課本P123。

Box's M統(tǒng)計量檢驗各組內(nèi)協(xié)方差陣相等的假設(shè)。原假設(shè)為:H0:Σ1=Σ2 =Σ ?概率值小于0.05,在0.05的顯著性水平下各總體協(xié)方差陣不相等,即組一協(xié)方差與組二協(xié)方差不相等。因此在分類選項中的協(xié)方差矩陣選擇可以考慮采用分組協(xié)方差。
判別:
本例假定概率相等,所以距離判別等價于各先驗概率均相等時的貝葉斯判別。

分類函數(shù)處理匯總,已處理47個觀測量,沒有缺失值。

因為之前選擇的是先驗概率所有組相等,所以組一與組二的概率都為0.5,這個用于貝葉斯判別。

這里的Fisher 的線性判別式函數(shù)系數(shù)為貝葉斯的線性判別函數(shù)系數(shù)(可見課本第五版課本P123),這是用貝葉斯判別分析法產(chǎn)生的分類函數(shù)系數(shù),可見課本第五版課本P121的5.2.17式,可以計算出每個觀測在各組的分類函數(shù)值,然后將觀測分類到較大的分類函數(shù)值中。

給出了判別結(jié)果,通過判別函數(shù)的預(yù)測,有41個觀測是正確的,其中,y=1組21個觀測有18個被判對,y=2組25個觀測中有24個觀測被判對,從而有96%的原始觀測被判對。在交叉驗證中,其中,y=1組21個觀測有18個被判對,y=2組25個觀測中有23個觀測被判對,從而有92%的原始觀測被判對。
?
spss幾點說明:
1、spss只有Bayes判別和Fisher判別的直接選項,沒有距離判別的直接選項,只在個案結(jié)果(Casewise?Statistics)中給出了一個結(jié)果。
2、spss中Bayes判別和Fisher判別的操作沒有分開進行
3、spss中給出的判別表達(dá)式(投影函數(shù))都是針對協(xié)方差陣相等的情形給出的,對于協(xié)方差陣不相等的情況要手動計算
4、spss判別以Bayes判別為主,主要菜單與選項都是針對Bayes判別分析設(shè)置,并且最終保存的判別結(jié)果也是以Bayes判別為依據(jù);Fisher判別操作僅給出投影表達(dá)式、各類投影中心坐標(biāo)或投影分解圖去做判別,并沒有提供費歇爾法的計算機處理程序。
5.當(dāng)協(xié)方差不等時,除了做不出交叉驗證的結(jié)果和出現(xiàn)典型判別式函數(shù)的組協(xié)方差及相等性檢驗外,其他結(jié)果幾乎不變;當(dāng)概率不同,協(xié)方差相等時,交叉驗證的結(jié)果不同。