一、什么是聚類分析
聚類分析在統(tǒng)計學上是根據(jù)“物以類聚”的道理,對樣本或指標進行分類的一種多元統(tǒng)計分析方法。這一方法在任何領域應用時,都需要先對事物彼此不同的屬性進行辨認,將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性。在互聯(lián)網(wǎng)用戶行為分析上,大量用戶都有相同或相近的行為屬性,我們可以通過行為對用戶進行聚類,提取行為特征,對不同行為屬性的用戶針對性精準運營。

二、聚類分析的特征
在網(wǎng)站分析和APP分析中應用聚類分析時會使得分析過程和分析結果更簡單、直觀。
簡單:分析邏輯內置于系統(tǒng)中,只需點選操作即可實現(xiàn)對用戶或頁面的聚類
直觀:將毫無規(guī)律的大量數(shù)據(jù)變的規(guī)律化、類別化、統(tǒng)一化,可直觀看出某一群體或某類頁面的特征。
三、聚類分析的應用
聚類分析在互聯(lián)網(wǎng)領域的主要應用有:用戶聚類、頁面聚類或內容來源聚類、活躍留存聚類分析。
1、用戶聚類
用戶聚類是將有共同用戶屬性或行為屬性特征的用戶歸為同一群體,主要體現(xiàn)為用戶分群,用戶標簽法。用戶分群用戶分群可以通過用戶屬性組合定義不同用戶群體,也可以通過用戶群體的行為表現(xiàn)反推用戶的屬性特征。用戶分群對推廣營銷和用戶運營最大的意義在于精細化的定位用戶群體細分用戶需求。推廣和運營已經(jīng)從初期發(fā)的模糊運營進化到當前基于用戶行為甚至是基于預測模型的用戶分群。
用戶分群、用戶標簽法

2、頁面聚類
頁面聚類則主要是相似/相關頁面分組法,例如:在頁面分析中,經(jīng)常存在帶?參數(shù)的頁面,比如:資訊詳情頁面、商品頁面等,都屬于同一類頁面,簡單的分析容易造成如跳出率、退出率等指標不準確的問題,通過聚類分析可以獲取同類頁面的準確數(shù)據(jù)用于分析場景。

3、來源聚類
來源聚類幫助我們分析訪客來源和推廣渠道,可根據(jù)設置的UTM參數(shù),根據(jù)不同渠道、著陸頁、媒介、內容、關鍵詞等對受訪頁面進行聚類分析。

4、活躍、留存聚類分析
傳統(tǒng)的活躍分析和留存分析只依據(jù)用戶瀏覽網(wǎng)站或打開APP行為分析活躍和留存,更高級的活躍和留存分析可以自定義不同的用戶行為聚類分析。
例如我不只關心用戶瀏覽網(wǎng)站的活躍和留存,還想分析網(wǎng)站中新上線的某個功能模塊的用戶活躍和留存情況,這時可以通過自定義活躍、留存聚類有相應行為的用戶進行用戶行為分析。
