淘寶用戶行為分析-探索性分析EDA

背景介紹

淘寶是中國(guó)深受歡迎的電商平臺(tái),經(jīng)常網(wǎng)購(gòu)的人少不了逛逛淘寶,隨便看看有什么想買的或者有目的想買什么,在逛淘寶的過(guò)程中,我們會(huì)留下足跡。通過(guò)這些足跡,也就是用戶的行為,我們可以對(duì)這些行為進(jìn)行分析挖掘。

使用的工具是Python,主要用到了Numpy,Pandas、Matplotlib及Msno這幾個(gè)包。

數(shù)據(jù)來(lái)源于阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46

1 提出問(wèn)題

本文主要圍繞這幾個(gè)點(diǎn)展開(kāi):

1.漏斗模型用戶行為分析

2.平臺(tái)用戶使用情況分析

3.時(shí)間維度用戶行為分析

4.RFM模型用戶價(jià)值分析

5.商品銷售情況分析

6.商品銷售類目分析

2 數(shù)據(jù)讀取與數(shù)據(jù)探索

2.1 數(shù)據(jù)說(shuō)明

數(shù)據(jù)集包含了2014年11月18日至2014年12月18日之間,有行為的約100萬(wàn)隨機(jī)用戶的所有行為(行為包括點(diǎn)擊、購(gòu)買、加購(gòu)、喜歡)。

數(shù)據(jù)主要包括5個(gè)字段,用戶ID,商品ID,商品類目ID,行為類型,時(shí)間戳。一共有12256906條記錄。

2.2 數(shù)據(jù)讀取

總共的數(shù)據(jù)有1億左右,雖然pandas可以處理這么多的數(shù)據(jù),但是電腦配置不夠,所以這里只取了1200多萬(wàn)條數(shù)據(jù)。使用pandas讀取數(shù)據(jù)只需要幾秒鐘的時(shí)間,Excel大半天都打不開(kāi)。

2.3 數(shù)據(jù)探索

查看數(shù)據(jù)信息

1200多萬(wàn)的數(shù)據(jù)大小有561.1M,要是全部數(shù)據(jù)大小差不多有4G

查看是否有缺失值

user_geohash 缺失值過(guò)多,需做剔除處理

3 數(shù)據(jù)清洗

3.1 刪除重復(fù)值

3.2 處理缺失值

3.3 數(shù)據(jù)一致性轉(zhuǎn)換

4 數(shù)據(jù)分析

4.1 漏斗模型用戶行為分析

a.上述分析說(shuō)明,需要優(yōu)化商品的推薦機(jī)制,優(yōu)化用戶搜索商品的效率;

b.提升用戶從點(diǎn)擊到收藏和加入購(gòu)物車這一環(huán)節(jié)的轉(zhuǎn)化率,這樣才能最終提升用戶購(gòu)買的比例。

4.2?平臺(tái)用戶使用情況分析

4.3?時(shí)間維度用戶行為分析

可以發(fā)現(xiàn)在雙十二當(dāng)天訪問(wèn)量達(dá)到頂峰,可以利用這個(gè)巨大的流量?jī)?yōu)勢(shì),提升用戶購(gòu)買的幾率。

分別分析瀏覽和其他三種行為在一天的變化情況,可以發(fā)現(xiàn):

a.用戶從0點(diǎn)到6點(diǎn)處于一個(gè)休息狀態(tài),而從6點(diǎn)開(kāi)始,到10點(diǎn)活躍的人數(shù)越來(lái)越多,10點(diǎn)達(dá)到了一個(gè)巔峰,然后又逐漸回落,預(yù)測(cè)是用戶起床上班,利用路上通勤時(shí)間進(jìn)行瀏覽以及購(gòu)買,而到了上班時(shí)間,則只能抽空購(gòu)物;

b.晚上6點(diǎn)到12點(diǎn)用戶數(shù)量又開(kāi)始激增,成交率也增加,證明用戶下班,吃飯等等有較多的空閑時(shí)間進(jìn)行購(gòu)物了,22點(diǎn)之后瀏覽慢慢下降,是準(zhǔn)備要休息了。

在用戶的空閑時(shí)間安排營(yíng)銷活動(dòng),比如早上通勤時(shí)間,中午吃飯時(shí)間,晚上6-10點(diǎn),能夠提升用戶成交率。

4.4?RFM模型用戶價(jià)值分析

最近一次消費(fèi) (Recency)

消費(fèi)頻率 (Frequency)

消費(fèi)金額 (Monetary)

a.重要價(jià)值用戶是優(yōu)質(zhì)客戶,可以有針對(duì)性地給這類客戶提供VIP服務(wù),比如現(xiàn)在的淘寶VIP會(huì)員卡等等;

b.重要挽留客戶占比也很大,他們消費(fèi)時(shí)間間隔較遠(yuǎn),并且消費(fèi)頻次低,需要主動(dòng)聯(lián)系客戶,調(diào)查清楚哪里出現(xiàn)了問(wèn)題,比如通過(guò)短信,郵件,APP推送等喚醒客戶;

c.重要保持客戶,消費(fèi)時(shí)間間隔較遠(yuǎn),但是消費(fèi)頻次高,有可能就是需要買東西的時(shí)候,就高頻購(gòu)買,不需要就不再購(gòu)物,對(duì)于這類客戶,需要主動(dòng)聯(lián)系,了解客戶的需求,及時(shí)滿足這類用戶的需求(提供優(yōu)惠券促使消費(fèi));

d.重要發(fā)展客戶,消費(fèi)頻次低,我們需要提升他的消費(fèi)頻率,可以通過(guò)優(yōu)惠券疊加等活動(dòng)來(lái)刺激消費(fèi)。

4.5?商品銷售情況分析

大量商品只被購(gòu)買一次

用戶瀏覽的商品和最終購(gòu)買的商品存在著很大的差異,我們需要優(yōu)化推薦系統(tǒng),讓用戶真正找到自己想買的商品,將瀏覽量轉(zhuǎn)換為購(gòu)買量。

從瀏覽到加購(gòu)/收藏的轉(zhuǎn)化率較低。

收藏之后購(gòu)買的高于加入購(gòu)物車之后被購(gòu)買的轉(zhuǎn)化率。

a.收藏是比加購(gòu)有更高轉(zhuǎn)化率的途徑,可以針對(duì)收藏夾的商品發(fā)放優(yōu)惠券,促使轉(zhuǎn)化;

b.用戶收藏和加入購(gòu)物車之后的購(gòu)買率達(dá)到了35.8%,說(shuō)明商品只要被用戶喜歡和加入購(gòu)物車,那就有相當(dāng)大的幾率被購(gòu)買,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購(gòu)物車,這樣能夠增大轉(zhuǎn)化率。

4.6?商品銷售類目分析

a.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示,將暢銷類的商品和非暢銷品展示在一起,提升商品購(gòu)買轉(zhuǎn)化率;

b.優(yōu)化商品的推薦算法,將流量更多地聚焦于暢銷的商品,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動(dòng)整體商品類目的銷售。

5 結(jié)論

1.需要優(yōu)化商品的推薦機(jī)制,優(yōu)化用戶搜索商品的效率,提升用戶從點(diǎn)擊到收藏和加入購(gòu)物車這一環(huán)節(jié)的轉(zhuǎn)化率,這樣才能最終提升用戶購(gòu)買的比例;

2.有過(guò)購(gòu)買行為的用戶占總用戶的比例為88.8%,需要采取措施引流;

3.雙十二當(dāng)天訪問(wèn)量達(dá)到頂峰,可以利用這個(gè)巨大的流量?jī)?yōu)勢(shì),提升用戶購(gòu)買的幾率。在用戶的空閑時(shí)間安排營(yíng)銷活動(dòng),比如早上通勤時(shí)間,中午吃飯時(shí)間,晚上6-10點(diǎn),能夠提升用戶成交率;

4.大量商品只被購(gòu)買一次,用戶瀏覽的商品和最終購(gòu)買的商品存在著很大的差異,我們需要優(yōu)化推薦系統(tǒng),讓用戶真正找到自己想買的商品,將瀏覽量轉(zhuǎn)換為購(gòu)買量;

5.收藏是比加購(gòu)有更高轉(zhuǎn)化率的途徑,可以針對(duì)收藏夾的商品發(fā)放優(yōu)惠券,促使轉(zhuǎn)化。用戶收藏和加入購(gòu)物車之后的購(gòu)買率達(dá)到了35.8%,說(shuō)明商品只要被用戶喜歡和加入購(gòu)物車,那就有相當(dāng)大的幾率被購(gòu)買,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購(gòu)物車,這樣能夠增大轉(zhuǎn)化率;

6.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示,將暢銷類的商品和非暢銷品展示在一起,提升商品購(gòu)買轉(zhuǎn)化率。優(yōu)化商品的推薦算法,將流量更多地聚焦于暢銷的商品,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動(dòng)整體商品類目的銷售。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容