淘寶APP用戶行為數(shù)據(jù)分析
(一)數(shù)據(jù)理解
1.數(shù)據(jù)來(lái)源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1
本文從數(shù)據(jù)集中選取了2014年11月18日至2014年12月18日之間,共802758條行為數(shù)據(jù),數(shù)據(jù)集中每一行代表一條用戶行為,共有6個(gè)字段。
2.列字段如下:
User_id 用戶ID
Item_id 商品ID
behavior_type
用戶行為類型(包含點(diǎn)擊,收藏,加購(gòu)物車(chē),購(gòu)買(mǎi)4中行為,分別用1,2,3,4表示)
User_geohash 地理位置
Item_category 商品種類
Time 用戶行為發(fā)生時(shí)間
(二)提出問(wèn)題
1、整體用戶的購(gòu)物情況
pv(總訪問(wèn)量)、日均訪問(wèn)量、uv(用戶總數(shù))、有購(gòu)買(mǎi)行為的用戶數(shù)量、用戶的購(gòu)物情況、復(fù)購(gòu)率分別是多少?
2、用戶行為轉(zhuǎn)化漏斗
點(diǎn)擊—加購(gòu)物車(chē)—收藏—購(gòu)買(mǎi)各環(huán)節(jié)轉(zhuǎn)化率如何?購(gòu)物車(chē)遺棄率是多少?
3、購(gòu)買(mǎi)率高和購(gòu)買(mǎi)率為 0 的人群有什么特征
4、基于時(shí)間維度了解用戶的行為習(xí)慣
5、基于RFM模型的用戶分析
(三)數(shù)據(jù)清洗
(三)數(shù)據(jù)清洗
1.缺失值處理
User_geohash字段表示地理位置信息,由于數(shù)據(jù)存在大量空值,且對(duì)數(shù)據(jù)分析意義不大,因此不對(duì)該列進(jìn)行處理(三)數(shù)據(jù)清洗
1.缺失值處理
User_geohash字段表示地理位置信息,由于數(shù)據(jù)存在大量空值,且對(duì)數(shù)據(jù)分析意義不大,因此不對(duì)該列進(jìn)行處理

2.數(shù)據(jù)一致化處理
字段time包含(年月日)和小時(shí)兩種屬性,為了方便分析,將該字段分成日期date和小時(shí)time 2列

由于behavior_type列的四種行為分別用1,2,3,4表示點(diǎn)擊,收藏,加購(gòu)物車(chē),購(gòu)買(mǎi)四種行為,為了方便查看數(shù)據(jù),將1,2,3,4替換為’pv’, ’fav’ ,’cart’ ,’buy’

查詢表結(jié)構(gòu),發(fā)現(xiàn)date列不是日期類型,將其修改為date類型

(四)構(gòu)建模型和分析數(shù)據(jù)
1.總體用戶購(gòu)物情況
(1)pv(總訪問(wèn)量)

(2)日均訪問(wèn)量

(3)uv(用戶總數(shù))

(4)有購(gòu)買(mǎi)行為的用戶數(shù)量

(5)用戶的購(gòu)物情況

(6)復(fù)購(gòu)率:產(chǎn)生兩次或者兩次以上購(gòu)買(mǎi)的用戶所占比列

2.用戶行為轉(zhuǎn)化漏斗
在購(gòu)物環(huán)節(jié)中收藏和加購(gòu)物車(chē)沒(méi)有先后之分,所以將這兩個(gè)環(huán)節(jié)放在一起作為購(gòu)物環(huán)節(jié)的一步

3.購(gòu)買(mǎi)率高和低的人群各有什么特征
購(gòu)買(mǎi)率高的用戶特征:

? ? ? ?從結(jié)果可以看出,購(gòu)買(mǎi)率高的用戶點(diǎn)擊率并不高,他們一般點(diǎn)擊不超過(guò)5次就直接購(gòu)買(mǎi),由此可以推斷出這些用戶為理智型消費(fèi)者,有明確的購(gòu)物目標(biāo),很少會(huì)被商家廣告或者促銷吸引
購(gòu)買(mǎi)率低的用戶特征:

? ? ? ?從結(jié)果可以看出,購(gòu)買(mǎi)率低主要有2個(gè)因素,其一點(diǎn)擊次數(shù)少,可能原因是網(wǎng)購(gòu)欲望不強(qiáng)烈,可以通過(guò)廣告等加以引導(dǎo);其二是點(diǎn)擊收藏次數(shù)較多,但是購(gòu)買(mǎi)率低,這類用戶可能正在為促銷活動(dòng)做準(zhǔn)備,價(jià)格敏感,購(gòu)物難度較大
4.基于時(shí)間維度了解用戶的行為習(xí)慣
1.一周中用戶活躍時(shí)段分布
由于第一周和第五周數(shù)據(jù)不全。因此這兩周的數(shù)據(jù)不進(jìn)行分析


? ? ? ?從結(jié)果可以看出,每周用戶活躍穩(wěn)定,每周五會(huì)有小幅降低,但是周末逐漸回升。其中周五用戶活躍度突增,這是有雙十二電商活動(dòng)引起的
2.一天中用戶的活躍時(shí)段分布


? ? ? ?可以看出,每日0點(diǎn)到5點(diǎn)用戶活躍度快速降低,降到一天中的活躍量最低值,6點(diǎn)到10點(diǎn)用戶活躍度快速上升,10點(diǎn)到18點(diǎn)用戶活躍度較平穩(wěn),17點(diǎn)到23點(diǎn)用戶活躍度快速上升,達(dá)到一天中的最高值。
5.基于RFM模型找出最有價(jià)值客戶
RFM模型是衡量客戶價(jià)值和客戶創(chuàng)造力的重要工具和手段
R-Recency(最近一次購(gòu)買(mǎi)時(shí)間)
F-Frequency(消費(fèi)頻率)
M-Money(消費(fèi)金額)
但由于沒(méi)有相關(guān)金額數(shù)據(jù),只能通過(guò)R,F(xiàn)對(duì)客戶價(jià)值打分
(1)R-Rcency
? ? ? ?統(tǒng)計(jì)客戶最近發(fā)生購(gòu)買(mǎi)行為的日期距離2014-12-19間隔幾天,再對(duì)間隔進(jìn)行排名,間隔越少,客戶價(jià)值越大

(2)計(jì)算F-Frequency
先統(tǒng)計(jì)每位用戶的購(gòu)買(mǎi)頻率,再對(duì)購(gòu)買(mǎi)頻率進(jìn)行排名,頻率越大,客戶價(jià)值越大,排名就越靠前

(3)對(duì)用戶進(jìn)行評(píng)分
查詢有購(gòu)買(mǎi)行為的用戶的數(shù)量

? ? ? ?對(duì)3326名有購(gòu)買(mǎi)行為的用戶按照排名進(jìn)行分組,共劃分為四組,對(duì)排在前四分之一的用戶打4分,排在前四分之一到四分之二(即二分之一)的用戶打3分,排在前四分之二到前四分之三的用戶打2分,剩余的用戶打1分,按照這個(gè)規(guī)則分別對(duì)用戶時(shí)間間隔排名打分和購(gòu)買(mǎi)頻率排名打分,最后把兩個(gè)分?jǐn)?shù)合并在一起作為該名用戶的最終評(píng)分

? ? ? ?通過(guò)打分可以了解每位顧客的特性,從而實(shí)現(xiàn)差異化營(yíng)銷。比如對(duì)于?user_value?=?44?的用戶,為重點(diǎn)用戶需要關(guān)注;對(duì)于user_value?=?41?這類忠誠(chéng)度高而購(gòu)買(mǎi)能力不足的,可以可以適當(dāng)給點(diǎn)折扣或捆綁銷售來(lái)增加用戶的購(gòu)買(mǎi)頻率。對(duì)于?user_value?=?14?這類忠誠(chéng)度不高而購(gòu)買(mǎi)能力強(qiáng)的,需要關(guān)注他們的購(gòu)物習(xí)性做精準(zhǔn)化營(yíng)銷。還可以通過(guò)每個(gè)月對(duì)用戶的評(píng)分變化,推測(cè)客戶消費(fèi)的異動(dòng)狀況,對(duì)于即將流失的客戶,通過(guò)電話問(wèn)候、贈(zèng)送禮品、加大折扣力度等有效的方式挽回客戶。
(五)結(jié)論及建議
1、總體轉(zhuǎn)化率只有 1%,用戶點(diǎn)擊后收藏和加購(gòu)物車(chē)的轉(zhuǎn)化率在 5% ,需要提高用戶的購(gòu)買(mǎi)意愿,可通過(guò)活動(dòng)促銷、精準(zhǔn)營(yíng)銷等方式。
2、購(gòu)買(mǎi)率高且點(diǎn)擊量少的用戶屬于理智型購(gòu)物者,有明確購(gòu)物目標(biāo),受促銷和廣告影響少;而購(gòu)買(mǎi)率低的用戶可以認(rèn)為是等待型或克制型用戶群體,下單欲望較少且自制力較強(qiáng),購(gòu)物難度較大。
3、大部分用戶的主要活躍時(shí)間在10點(diǎn)到23點(diǎn),在19點(diǎn)到23點(diǎn)達(dá)到一天的頂峰。每周五的活躍度有所下降,但周末開(kāi)始回升??梢愿鶕?jù)用戶的活躍時(shí)間段精準(zhǔn)推送商家的折扣優(yōu)惠或促銷活動(dòng),提高購(gòu)買(mǎi)率。
4、通過(guò) R 和 F 的數(shù)據(jù)對(duì)用戶行為進(jìn)行打分,對(duì)每位用戶進(jìn)行精準(zhǔn)化營(yíng)銷,還可以通過(guò)對(duì)R 和 F 的數(shù)據(jù)監(jiān)測(cè),推測(cè)客戶消費(fèi)的異動(dòng)狀況,挽回流失客戶。