本文主要講述聚類分析在SPSS中的實(shí)現(xiàn),和對(duì)結(jié)果的解讀 ?主要應(yīng)用K均值聚類、系統(tǒng)聚類、兩步聚類法
案例一 ? ? ? ?K均值聚類在移動(dòng)用戶分類中的應(yīng)用
1.自變量的類別和定義如下 (客戶在不同時(shí)間段的通話時(shí)長(zhǎng)和平均時(shí)長(zhǎng))

2.觀察數(shù)據(jù)發(fā)現(xiàn)平均通話時(shí)長(zhǎng)跟總通話時(shí)長(zhǎng)不在一個(gè)數(shù)量級(jí)上,考慮對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理

3.單擊分析→分類→K均值聚類 彈出如下對(duì)話框選入六個(gè)變量,在選項(xiàng)對(duì)話框中將迭代次數(shù)定位100,K均值聚類需要自定義聚類數(shù)目,這里選擇為5類(4-8類是常見的聚類類別)
如下圖得到分類結(jié)果,標(biāo)準(zhǔn)化可以消除數(shù)據(jù)數(shù)量級(jí)的差異,但是不便于閱讀,我們需要轉(zhuǎn)化成可讀的方式

3.單擊分析均值→平均值 對(duì)話框,在選項(xiàng)中選取平均值,進(jìn)行運(yùn)算

4.得到結(jié)果如下:


然后公司就可以針對(duì)不同的用戶特點(diǎn),推出不同的套餐,以增加用戶的消費(fèi)
案例二 ?對(duì)變量的聚類 ? 系統(tǒng)聚類法
1.如下圖:數(shù)據(jù)集是不同國(guó)家的裁判對(duì)不同運(yùn)動(dòng)員的打分情況

2.下圖是選項(xiàng)和參數(shù)的設(shè)置 ,變量的聚類距離選?。?b>皮爾遜相關(guān)性)

3.下圖是分析結(jié)果
表一 ?是聚類過程 ?首先把2和4聚為一類 ,接下來把3和7聚為一類,依次類推
圖一 ?是冰柱圖可以忽略,圖二是樹狀圖,要重點(diǎn)關(guān)注和解讀

4.對(duì)結(jié)果的解讀如下
圖二的結(jié)果 按照最大的距離作為25,其他的以25做參照化簡(jiǎn)
可以看到非專業(yè)裁判8和其他專業(yè)裁判到距離為25才聚為一類(非專業(yè)與專業(yè)裁判有較大差異)
3.5.7聚為一類,羅馬尼亞、中國(guó)和俄羅斯聚為一類裁判得分相近
1.2.4.6 意大利、韓國(guó)、法國(guó)、美國(guó) 聚為一類得分相近 ?這兩個(gè)東西方陣營(yíng)之間存在差異,但是他們之間的差異小于 專業(yè)裁判與非專業(yè)裁判之間的差異