背景介紹
淘寶是中國(guó)深受歡迎的電商平臺(tái),經(jīng)常網(wǎng)購(gòu)的人少不了逛逛淘寶,隨便看看有什么想買的或者有目的想買什么,在逛淘寶的過(guò)程中,我們會(huì)留下足跡。通過(guò)這些足跡,也就是用戶的行為,我們可以對(duì)這些行為進(jìn)行分析挖掘。
使用的工具是Python,主要用到了Numpy,Pandas、Matplotlib及Msno這幾個(gè)包。
數(shù)據(jù)來(lái)源于阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46
1 提出問(wèn)題
本文主要圍繞這幾個(gè)點(diǎn)展開(kāi):
1.漏斗模型用戶行為分析
2.平臺(tái)用戶使用情況分析
3.時(shí)間維度用戶行為分析
4.RFM模型用戶價(jià)值分析
5.商品銷售情況分析
6.商品銷售類目分析
2 數(shù)據(jù)讀取與數(shù)據(jù)探索
2.1 數(shù)據(jù)說(shuō)明
數(shù)據(jù)集包含了2014年11月18日至2014年12月18日之間,有行為的約100萬(wàn)隨機(jī)用戶的所有行為(行為包括點(diǎn)擊、購(gòu)買、加購(gòu)、喜歡)。
數(shù)據(jù)主要包括5個(gè)字段,用戶ID,商品ID,商品類目ID,行為類型,時(shí)間戳。一共有12256906條記錄。

2.2 數(shù)據(jù)讀取
總共的數(shù)據(jù)有1億左右,雖然pandas可以處理這么多的數(shù)據(jù),但是電腦配置不夠,所以這里只取了1200多萬(wàn)條數(shù)據(jù)。使用pandas讀取數(shù)據(jù)只需要幾秒鐘的時(shí)間,Excel大半天都打不開(kāi)。

2.3 數(shù)據(jù)探索
查看數(shù)據(jù)信息

1200多萬(wàn)的數(shù)據(jù)大小有561.1M,要是全部數(shù)據(jù)大小差不多有4G
查看是否有缺失值

user_geohash 缺失值過(guò)多,需做剔除處理
3 數(shù)據(jù)清洗
3.1 刪除重復(fù)值

3.2 處理缺失值

3.3 數(shù)據(jù)一致性轉(zhuǎn)換

4 數(shù)據(jù)分析
4.1 漏斗模型用戶行為分析

a.上述分析說(shuō)明,需要優(yōu)化商品的推薦機(jī)制,優(yōu)化用戶搜索商品的效率;
b.提升用戶從點(diǎn)擊到收藏和加入購(gòu)物車這一環(huán)節(jié)的轉(zhuǎn)化率,這樣才能最終提升用戶購(gòu)買的比例。
4.2?平臺(tái)用戶使用情況分析

4.3?時(shí)間維度用戶行為分析




可以發(fā)現(xiàn)在雙十二當(dāng)天訪問(wèn)量達(dá)到頂峰,可以利用這個(gè)巨大的流量?jī)?yōu)勢(shì),提升用戶購(gòu)買的幾率。


分別分析瀏覽和其他三種行為在一天的變化情況,可以發(fā)現(xiàn):
a.用戶從0點(diǎn)到6點(diǎn)處于一個(gè)休息狀態(tài),而從6點(diǎn)開(kāi)始,到10點(diǎn)活躍的人數(shù)越來(lái)越多,10點(diǎn)達(dá)到了一個(gè)巔峰,然后又逐漸回落,預(yù)測(cè)是用戶起床上班,利用路上通勤時(shí)間進(jìn)行瀏覽以及購(gòu)買,而到了上班時(shí)間,則只能抽空購(gòu)物;
b.晚上6點(diǎn)到12點(diǎn)用戶數(shù)量又開(kāi)始激增,成交率也增加,證明用戶下班,吃飯等等有較多的空閑時(shí)間進(jìn)行購(gòu)物了,22點(diǎn)之后瀏覽慢慢下降,是準(zhǔn)備要休息了。
在用戶的空閑時(shí)間安排營(yíng)銷活動(dòng),比如早上通勤時(shí)間,中午吃飯時(shí)間,晚上6-10點(diǎn),能夠提升用戶成交率。
4.4?RFM模型用戶價(jià)值分析
最近一次消費(fèi) (Recency)
消費(fèi)頻率 (Frequency)
消費(fèi)金額 (Monetary)




a.重要價(jià)值用戶是優(yōu)質(zhì)客戶,可以有針對(duì)性地給這類客戶提供VIP服務(wù),比如現(xiàn)在的淘寶VIP會(huì)員卡等等;
b.重要挽留客戶占比也很大,他們消費(fèi)時(shí)間間隔較遠(yuǎn),并且消費(fèi)頻次低,需要主動(dòng)聯(lián)系客戶,調(diào)查清楚哪里出現(xiàn)了問(wèn)題,比如通過(guò)短信,郵件,APP推送等喚醒客戶;
c.重要保持客戶,消費(fèi)時(shí)間間隔較遠(yuǎn),但是消費(fèi)頻次高,有可能就是需要買東西的時(shí)候,就高頻購(gòu)買,不需要就不再購(gòu)物,對(duì)于這類客戶,需要主動(dòng)聯(lián)系,了解客戶的需求,及時(shí)滿足這類用戶的需求(提供優(yōu)惠券促使消費(fèi));
d.重要發(fā)展客戶,消費(fèi)頻次低,我們需要提升他的消費(fèi)頻率,可以通過(guò)優(yōu)惠券疊加等活動(dòng)來(lái)刺激消費(fèi)。
4.5?商品銷售情況分析


大量商品只被購(gòu)買一次

用戶瀏覽的商品和最終購(gòu)買的商品存在著很大的差異,我們需要優(yōu)化推薦系統(tǒng),讓用戶真正找到自己想買的商品,將瀏覽量轉(zhuǎn)換為購(gòu)買量。

從瀏覽到加購(gòu)/收藏的轉(zhuǎn)化率較低。

收藏之后購(gòu)買的高于加入購(gòu)物車之后被購(gòu)買的轉(zhuǎn)化率。

a.收藏是比加購(gòu)有更高轉(zhuǎn)化率的途徑,可以針對(duì)收藏夾的商品發(fā)放優(yōu)惠券,促使轉(zhuǎn)化;
b.用戶收藏和加入購(gòu)物車之后的購(gòu)買率達(dá)到了35.8%,說(shuō)明商品只要被用戶喜歡和加入購(gòu)物車,那就有相當(dāng)大的幾率被購(gòu)買,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購(gòu)物車,這樣能夠增大轉(zhuǎn)化率。
4.6?商品銷售類目分析

a.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示,將暢銷類的商品和非暢銷品展示在一起,提升商品購(gòu)買轉(zhuǎn)化率;
b.優(yōu)化商品的推薦算法,將流量更多地聚焦于暢銷的商品,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動(dòng)整體商品類目的銷售。
5 結(jié)論
1.需要優(yōu)化商品的推薦機(jī)制,優(yōu)化用戶搜索商品的效率,提升用戶從點(diǎn)擊到收藏和加入購(gòu)物車這一環(huán)節(jié)的轉(zhuǎn)化率,這樣才能最終提升用戶購(gòu)買的比例;
2.有過(guò)購(gòu)買行為的用戶占總用戶的比例為88.8%,需要采取措施引流;
3.雙十二當(dāng)天訪問(wèn)量達(dá)到頂峰,可以利用這個(gè)巨大的流量?jī)?yōu)勢(shì),提升用戶購(gòu)買的幾率。在用戶的空閑時(shí)間安排營(yíng)銷活動(dòng),比如早上通勤時(shí)間,中午吃飯時(shí)間,晚上6-10點(diǎn),能夠提升用戶成交率;
4.大量商品只被購(gòu)買一次,用戶瀏覽的商品和最終購(gòu)買的商品存在著很大的差異,我們需要優(yōu)化推薦系統(tǒng),讓用戶真正找到自己想買的商品,將瀏覽量轉(zhuǎn)換為購(gòu)買量;
5.收藏是比加購(gòu)有更高轉(zhuǎn)化率的途徑,可以針對(duì)收藏夾的商品發(fā)放優(yōu)惠券,促使轉(zhuǎn)化。用戶收藏和加入購(gòu)物車之后的購(gòu)買率達(dá)到了35.8%,說(shuō)明商品只要被用戶喜歡和加入購(gòu)物車,那就有相當(dāng)大的幾率被購(gòu)買,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購(gòu)物車,這樣能夠增大轉(zhuǎn)化率;
6.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示,將暢銷類的商品和非暢銷品展示在一起,提升商品購(gòu)買轉(zhuǎn)化率。優(yōu)化商品的推薦算法,將流量更多地聚焦于暢銷的商品,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動(dòng)整體商品類目的銷售。