聚類分析的原理和應(yīng)用(二)

本文主要講述聚類分析在SPSS中的實(shí)現(xiàn),和對(duì)結(jié)果的解讀 ?主要應(yīng)用K均值聚類、系統(tǒng)聚類、兩步聚類法

案例一 ? ? ? ?K均值聚類在移動(dòng)用戶分類中的應(yīng)用

1.自變量的類別和定義如下 (客戶在不同時(shí)間段的通話時(shí)長(zhǎng)和平均時(shí)長(zhǎng))


2.觀察數(shù)據(jù)發(fā)現(xiàn)平均通話時(shí)長(zhǎng)跟總通話時(shí)長(zhǎng)不在一個(gè)數(shù)量級(jí)上,考慮對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理


3.單擊分析→分類→K均值聚類 彈出如下對(duì)話框選入六個(gè)變量,在選項(xiàng)對(duì)話框中將迭代次數(shù)定位100,K均值聚類需要自定義聚類數(shù)目,這里選擇為5類(4-8類是常見的聚類類別)

如下圖得到分類結(jié)果,標(biāo)準(zhǔn)化可以消除數(shù)據(jù)數(shù)量級(jí)的差異,但是不便于閱讀,我們需要轉(zhuǎn)化成可讀的方式


3.單擊分析均值→平均值 對(duì)話框,在選項(xiàng)中選取平均值,進(jìn)行運(yùn)算




4.得到結(jié)果如下:



然后公司就可以針對(duì)不同的用戶特點(diǎn),推出不同的套餐,以增加用戶的消費(fèi)


案例二 ?對(duì)變量的聚類 ? 系統(tǒng)聚類法

1.如下圖:數(shù)據(jù)集是不同國(guó)家的裁判對(duì)不同運(yùn)動(dòng)員的打分情況


2.下圖是選項(xiàng)和參數(shù)的設(shè)置 ,變量的聚類距離選?。?b>皮爾遜相關(guān)性)



3.下圖是分析結(jié)果

表一 ?是聚類過程 ?首先把2和4聚為一類 ,接下來把3和7聚為一類,依次類推

圖一 ?是冰柱圖可以忽略,圖二是樹狀圖,要重點(diǎn)關(guān)注和解讀


圖二

4.對(duì)結(jié)果的解讀如下

圖二的結(jié)果 按照最大的距離作為25,其他的以25做參照化簡(jiǎn)

可以看到非專業(yè)裁判8和其他專業(yè)裁判到距離為25才聚為一類(非專業(yè)與專業(yè)裁判有較大差異)

3.5.7聚為一類,羅馬尼亞、中國(guó)和俄羅斯聚為一類裁判得分相近

1.2.4.6 意大利、韓國(guó)、法國(guó)、美國(guó) 聚為一類得分相近 ?這兩個(gè)東西方陣營(yíng)之間存在差異,但是他們之間的差異小于 專業(yè)裁判與非專業(yè)裁判之間的差異

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容