電商用戶行為分析(一)

一、項(xiàng)目背景介紹:

2014年是阿里巴巴集團(tuán)移動(dòng)電商業(yè)務(wù)快速發(fā)展的一年,例如2014雙11大促中移動(dòng)端成交占比達(dá)到42.6%,超過(guò)240億元。相比PC時(shí)代,移動(dòng)端網(wǎng)絡(luò)的訪問(wèn)是隨時(shí)隨地的,具有更豐富的場(chǎng)景數(shù)據(jù),比如用戶的位置信息、用戶訪問(wèn)的時(shí)間規(guī)律等。

通過(guò)數(shù)據(jù)分析,能夠挖掘數(shù)據(jù)背后豐富的內(nèi)涵,為移動(dòng)用戶在合適的時(shí)間、合適的地點(diǎn)精準(zhǔn)推薦合適的內(nèi)容。

本案例的目標(biāo)是從該數(shù)據(jù)進(jìn)行隨機(jī)抽樣,并用mysql進(jìn)行分析,提高自己對(duì)電商指標(biāo)體系的認(rèn)識(shí)。

二、數(shù)據(jù)說(shuō)明

1、字段說(shuō)明


字段說(shuō)明

三、分析思路

1、提出問(wèn)題:
1)分析用戶購(gòu)物過(guò)程中的常見(jiàn)監(jiān)控指標(biāo),了解運(yùn)營(yíng)現(xiàn)狀,查看各環(huán)節(jié)的漏斗轉(zhuǎn)化情況,并找到需要改進(jìn)的節(jié)點(diǎn);
2)研究用戶在不同維度下的行為規(guī)律,了解用戶行為特征,優(yōu)化運(yùn)營(yíng)策略;
3)利用RFM模型對(duì)用戶進(jìn)行分類,指導(dǎo)運(yùn)營(yíng)針對(duì)不同價(jià)值用戶進(jìn)行精細(xì)化運(yùn)營(yíng);
4)了解用戶生命周期,針對(duì)不同周期的用戶采取不同的運(yùn)營(yíng)策略。

2、指標(biāo)和字段解讀
通過(guò)用戶和用戶行為路徑可以分析PV、UV、PV/UV、跳失率、總訂單量等運(yùn)營(yíng)指標(biāo);
通過(guò)用戶行為和時(shí)間可以分析用戶的購(gòu)物行為特征;
通過(guò)用戶和商品、商品類別可以分析用戶的購(gòu)買商品偏好;用戶和時(shí)間可以分析用戶的購(gòu)買時(shí)間偏好,便于對(duì)不同商品和時(shí)間偏好的用戶采取個(gè)性化時(shí)間推薦(push、短信等推送);
通過(guò)商品類別和用戶行為可以分析不同商品類別受歡迎程度,指導(dǎo)運(yùn)營(yíng)進(jìn)行商品的上新或下架;
通過(guò)商品類別和時(shí)間可以分析不同商品類別的熱銷時(shí)間段,便于做活動(dòng)的推廣;
結(jié)合AARRR模型,可以分析用戶的生命周期,劃分不同用戶所處的周期階段,采用差異化運(yùn)營(yíng);
通過(guò)時(shí)間和用戶的生命周期字段,結(jié)合RFM模型可以給用戶做價(jià)值分類,對(duì)客戶進(jìn)行差異化管理。

四、數(shù)據(jù)清洗

(查看數(shù)據(jù)清洗流程:http://www.itdecent.cn/p/adb82624df14)

將csv導(dǎo)入mysql的方法:
切換命令行菜單:https://jingyan.baidu.com/article/f00622280752dbfbd3f0c815.html
導(dǎo)入數(shù)據(jù):https://blog.csdn.net/qq_25504271/article/details/78911151

1)選擇子集
導(dǎo)入之前已選擇好

2)列名重命名
無(wú)需更改列名

3)數(shù)據(jù)類型轉(zhuǎn)換
可以在設(shè)計(jì)表菜單欄更好數(shù)據(jù)類型

4)數(shù)據(jù)去重

查詢重復(fù)值:
select *,count(1)
from user1
group by user_id,item_id,behavior_type,item_id,time
having COUNT(user_id)>1;

存在重復(fù)值

存在重復(fù)值,但由于同一用戶同一個(gè)行為在一小時(shí)內(nèi)是可能存在多次的,因此這里不做去重處理。

5)缺失值處理

查詢?nèi)笔е担?SELECT 
COUNT(user_id)/(SELECT COUNT(*) FROM USER1) AS '用戶ID字段的非空比例' 
,COUNT(item_id)/(SELECT COUNT(1) FROM USER1) AS '商品ID字段的非空比例' 
,COUNT(behavior_type)/(SELECT COUNT(1) FROM USER1) AS '行為路徑字段的非空比例' 
,COUNT(item_category)/(SELECT COUNT(1) FROM USER1) AS '品類字段的非空比例' 
,COUNT(time)/(SELECT COUNT(1) FROM USER1) AS '時(shí)間字段的非空比例' 
FROM USER1
WHERE user_id IS NOT NULL;

無(wú)缺失值

經(jīng)查詢,無(wú)缺失值

6)關(guān)聯(lián)數(shù)據(jù)

由于只有一個(gè)表格,無(wú)需做表關(guān)聯(lián)(如果需要關(guān)聯(lián),可以到分析過(guò)程中有需要時(shí)進(jìn)行關(guān)聯(lián),這樣會(huì)提高M(jìn)ySQL的性能。

7)異常值處理


檢查時(shí)間是否異常
SELECT MIN(time), MAX(time)
FROM USER1;

檢查用戶行為類別是否異常
SELECT DISTINCT behavior_type
FROM USER1;

時(shí)間數(shù)據(jù)

行為數(shù)據(jù)

無(wú)需處理異常值

8)數(shù)據(jù)標(biāo)準(zhǔn)化整理

日期數(shù)據(jù)整理:

為方便后續(xù)的分析,將日期數(shù)據(jù)分為日期和時(shí)間兩個(gè)維度


1、新增一列date,用于儲(chǔ)存日期值
-- 新增列:alter table 表名 add column 列名 varchar(20);
alter table user1 add column date varchar(20) NOT NULL AFTER time;

2、復(fù)制time列的數(shù)據(jù)到date列
-- 更新列:UPDATE table_name SET field1=new-value1, field2=new-value2 [WHERE Clause]

UPDATE user1
SET date=time

3、將date轉(zhuǎn)化為年月日

UPDATE USER1
SET date = DATE_FORMAT(date, '%Y-%m-%d');

4、將time轉(zhuǎn)化為小時(shí)

alter table user1 add column hour varchar(20) NOT NULL AFTER date;(增加列)

方法一:
UPDATE user1
SET hour=time (賦值)

UPDATE USER1
SET hour = DATE_FORMAT(hour,'%H');(截取時(shí)間)

方法二:
UPDATE USER1
SET time = left(SUBSTRING_INDEX(time,' ',-1),2);

有多種方法可以實(shí)現(xiàn)數(shù)據(jù)截取操作(時(shí)間函數(shù)和字符串函數(shù)都可以操作,使用時(shí)間函數(shù)的時(shí)候需要注意截取后的數(shù)據(jù)格式類型需要轉(zhuǎn)化,否則會(huì)報(bào)錯(cuò),截取時(shí)間后的格式不能是datetime)

時(shí)間數(shù)據(jù)整理

行為數(shù)據(jù)整理:

將用戶行為數(shù)據(jù)進(jìn)行替換: 1:pv 2:fav 3:cart 4:buy


將behavior_type列進(jìn)行更改:

UPDATE user1

SET behavior_type=(case when behavior_type=1 then' PV'
                        when behavior_type=2 then 'fav'
                        when behavior_type=3 then 'cart'
                        when behavior_type=4 then 'buy'
                   end)

需要注意字符串要加引號(hào)

整理后數(shù)據(jù)

以上就完成了數(shù)據(jù)的整理工作。

五、指標(biāo)的構(gòu)建

1、總體運(yùn)營(yíng)指標(biāo):

1)流量指標(biāo):
計(jì)算頁(yè)面訪客數(shù)(pv)、獨(dú)立訪客數(shù)(uv)、人均點(diǎn)擊數(shù)(uv/pv)

1)計(jì)算頁(yè)面訪客數(shù)(pv)、獨(dú)立訪客數(shù)(uv)、人均點(diǎn)擊數(shù)(uv/pv)

SELECT 
    COUNT(*) AS 'pv'
    ,COUNT(DISTINCT user_id) AS 'uv'
    ,COUNT(*)/COUNT(DISTINCT user_id) AS '月uv/pv'
    ,COUNT(*)/COUNT(DISTINCT user_id)/30 AS '日uv/pv'
FROM user1
WHERE behavior_type="PV"
訪客數(shù)據(jù)

頁(yè)面訪客:987911次、獨(dú)立訪客數(shù):8474位、人均點(diǎn)擊次數(shù)116.58次。
95/30≈3.89次,日人均點(diǎn)擊次數(shù)大概為3.89次/人/天

2)每日流量指標(biāo)變化趨勢(shì)

日流量數(shù)據(jù)

通過(guò)Navicat導(dǎo)出數(shù)據(jù)進(jìn)行可視化處理:


pv、uv 趨勢(shì)圖
pv/uv 趨勢(shì)圖

pv、uv指標(biāo)呈正相關(guān)性;
三個(gè)指標(biāo)在大部分時(shí)間走勢(shì)平穩(wěn),由于雙十二的影響,從2014-12-11開(kāi)始上升,到2014-12-12達(dá)到峰值,2014-12-13結(jié)束回到正常水平。

2、AARRR漏斗轉(zhuǎn)化率

1)按照頁(yè)面訪客計(jì)算漏斗轉(zhuǎn)化率

1)按照頁(yè)面訪客計(jì)算漏斗轉(zhuǎn)化率

SELECT
    behavior_type
    ,count(*)
FROM user1
GROUP BY behavior_type

用戶行為漏斗

由于在購(gòu)物環(huán)節(jié)中,收藏和加入購(gòu)物車行為沒(méi)有嚴(yán)格的先后之分,可將兩個(gè)個(gè)步驟作為同一步,最終得到用戶購(gòu)物行為各環(huán)節(jié)轉(zhuǎn)化率,如下:


給環(huán)節(jié)轉(zhuǎn)化率
轉(zhuǎn)化率

從整體轉(zhuǎn)化率來(lái)看:瀏覽- 收藏/加購(gòu)轉(zhuǎn)化率僅為5%,總體購(gòu)買轉(zhuǎn)化率為1%,說(shuō)明有大部分的用戶在瀏覽后未進(jìn)行下一步操作,平時(shí)“逛街看看”成為一種習(xí)慣;
從節(jié)點(diǎn)轉(zhuǎn)化率來(lái)看:瀏覽-加購(gòu)/收藏環(huán)節(jié)轉(zhuǎn)化率很低,收藏/加購(gòu)-購(gòu)買的轉(zhuǎn)化率也只有20%,說(shuō)明有相當(dāng)一部分用戶是喜歡“囤貨”,可能是為了等節(jié)假日購(gòu)買?由于整體的節(jié)點(diǎn)并不是最細(xì)的不可分割節(jié)點(diǎn),整體的數(shù)據(jù)比較粗糙,如果需要進(jìn)一步的深入分析,需要有更細(xì)的轉(zhuǎn)化率數(shù)據(jù)(由于操作路徑每個(gè)環(huán)節(jié)都會(huì)損失一部分,因此如果能近量的較少客戶購(gòu)買時(shí)所需要的操作步驟,對(duì)提升整體轉(zhuǎn)化率應(yīng)該會(huì)有很好的提高)。

2)獨(dú)立訪客計(jì)算漏斗轉(zhuǎn)化率

用戶行為的uv
SELECT behavior_type, COUNT(DISTINCT user_id) as behavior_count
FROM USER1
GROUP BY behavior_type
ORDER BY behavior_count DESC;

fav和cart去重:
SELECT
DISTINCT user_id
FROM USER1
WHERE behavior_type='fav' or behavior_type='cart'

獨(dú)立訪客轉(zhuǎn)化率

用戶每個(gè)環(huán)節(jié)的轉(zhuǎn)化率差不多,需要更多數(shù)據(jù)才能發(fā)現(xiàn)用戶流失原因。

3)、跳失率

瀏覽頁(yè)跳失率: = 只訪問(wèn)一次就離開(kāi)的人數(shù)/總用戶數(shù)

只瀏覽用戶

SELECT
    count(DISTINCT user_id) 只瀏覽用戶
FROM user1
WHERE user_id in (
        SELECT DISTINCT user_id
        FROM user1
        WHERE behavior_type='pv')
AND user_id not in (
        SELECT DISTINCT user_id
        FROM user1
        WHERE behavior_type='fav')
AND user_id not in (
        SELECT DISTINCT user_id
        FROM user1
        WHERE behavior_type='cart') 
AND user_id not in (
        SELECT DISTINCT user_id
        FROM user1
        WHERE behavior_type='buy')  

瀏覽頁(yè)面流失人數(shù)

只加收藏、購(gòu)物車人數(shù)

只加收藏、購(gòu)物車

SELECT
 count(DISTINCT user_id) 只加收藏、購(gòu)物車用戶數(shù)
FROM user1
WHERE user_id in (
     SELECT DISTINCT user_id
     FROM user1
     WHERE behavior_type='fav')
OR user_id in (
     SELECT DISTINCT user_id
     FROM user1
     WHERE behavior_type='cart')
AND user_id not in (
     SELECT DISTINCT user_id
     FROM user1
     WHERE behavior_type='buy')  

只加收藏、購(gòu)物車人數(shù)

(3)、訂單指標(biāo):

1)總成交量和人均購(gòu)買次數(shù):

總成交量和人均購(gòu)買次數(shù):
SELECT
        count(behavior_type)總成交量
        ,count(DISTINCT user_id)總購(gòu)買用戶數(shù)
        ,count(behavior_type)/count(DISTINCT user_id)人均購(gòu)買次數(shù)
FROM user1
WHERE behavior_type='buy'

總成交量

2)每日總成交和人均成交情況:

每日總成交和人均成交情況
SELECT
        date
        ,count(behavior_type)總成交量
        ,count(DISTINCT user_id)總購(gòu)買用戶數(shù)
        ,count(behavior_type)/count(DISTINCT user_id)人均購(gòu)買次數(shù)
FROM user1
WHERE behavior_type='buy'
GROUP BY date
ORDER BY date;

每日成交情況
每日成交量

(4)復(fù)購(gòu)率:

1)總體復(fù)購(gòu)率

1)總體復(fù)購(gòu)率

購(gòu)買人數(shù)
SELECT
count(DISTINCT user_id) as 成交人數(shù)
FROM user1
WHERE   behavior_type='buy'

購(gòu)買次數(shù)大于1
SELECT
user_id
,count(behavior_type) as 購(gòu)買次數(shù)
FROM user1
WHERE   behavior_type='buy'
GROUP BY user_id
HAVING count(behavior_type)>1


復(fù)購(gòu)人數(shù)

SELECT
count(DISTINCT user_id)
FROM
(SELECT
user_id
,count(behavior_type) as 購(gòu)買次數(shù)
FROM user1
WHERE   behavior_type='buy'
GROUP BY user_id
HAVING count(behavior_type)>1
) as a 

復(fù)購(gòu)率=復(fù)購(gòu)人數(shù)/購(gòu)買人數(shù)=2295/4330=53%

2)商品品類銷量排名(商品復(fù)購(gòu)率)

2)商品銷售排名

SELECT
    item_category
    ,COUNT(behavior_type)購(gòu)買次數(shù)
FROM USER1
WHERE behavior_type='BUY'
GROUP BY item_category
ORDER BY COUNT(behavior_type) DESC
LIMIT 10;
商品銷售排名
商品排名

如果有更多數(shù)據(jù),可根據(jù)商品品類屬性進(jìn)行研究和下鉆,優(yōu)化商品結(jié)果,但這里因?yàn)閿?shù)據(jù)脫敏無(wú)法進(jìn)行下鉆分析

3)用戶復(fù)購(gòu)排名

3)用戶復(fù)購(gòu)排名

SELECT
    user_id
    ,count(behavior_type)購(gòu)買次數(shù)
FROM user1
WHERE behavior_type='BUY'
GROUP BY user_id
ORDER BY count(behavior_type) DESC
LIMIT 10;
購(gòu)買次數(shù)

以上用戶對(duì)平臺(tái)的忠誠(chéng)度比較高,對(duì)平臺(tái)的銷售貢獻(xiàn)度也高(利潤(rùn)貢獻(xiàn)情況還需要具體分析),對(duì)不同的客戶可以收集相應(yīng)的用戶畫(huà)像,并對(duì)用戶進(jìn)行分層管理和營(yíng)銷,從而達(dá)到精細(xì)化運(yùn)營(yíng)

2、用戶行為特征分析

(1)、用戶行為時(shí)間的特征

1)、按日期維度

1)、按日期維度
SELECT
        date
        ,count(1)點(diǎn)擊次數(shù)
        ,SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)瀏覽次數(shù)
        ,SUM(CASE WHEN behavior_type='fav' THEN 1 ELSE 0 END)收藏次數(shù)
        ,SUM(CASE WHEN behavior_type='cart' THEN 1 ELSE 0 END)加購(gòu)次數(shù)
        ,SUM(CASE WHEN behavior_type='buy' THEN 1 ELSE 0 END)購(gòu)買次數(shù)
        ,COUNT(DISTINCT USER_ID)每日用戶數(shù)
        ,count(*)/count(DISTINCT user_id)人均行為次數(shù)
        ,concat(ROUND(SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)/count(1)*100,2),'%')瀏覽數(shù)占比
        ,concat(ROUND(SUM(CASE WHEN behavior_type='BUY' THEN 1 ELSE 0 END)/count(1)*100,2),'%')購(gòu)買數(shù)占比
FROM user1
-- where date != '2014-12-12'
GROUP BY date
ORDER BY date;

日期維度
日維度

用戶活躍度與總體點(diǎn)擊數(shù)是正相關(guān)的,走勢(shì)平穩(wěn),不過(guò)在雙十二電商大促這天各項(xiàng)指標(biāo)暴增,且當(dāng)天點(diǎn)擊數(shù)占比有所下降(用戶的點(diǎn)擊更有針對(duì)性,前期已經(jīng)選好商品,就等雙十二當(dāng)天直接購(gòu)買的客戶數(shù)量比較多?), 成交數(shù)占比大幅上升。

2)、周維度

2)、周維度

查詢數(shù)據(jù)發(fā)現(xiàn)2014-11-18到2014-11-23,2014-12-15到2014-12-18均不滿一周,因此,只取完整的三周進(jìn)行分析:

SELECT
        DATE_FORMAT(date,'%W')星期
        ,count(1)點(diǎn)擊次數(shù)
        ,SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)瀏覽次數(shù)
        ,SUM(CASE WHEN behavior_type='fav' THEN 1 ELSE 0 END)收藏次數(shù)
        ,SUM(CASE WHEN behavior_type='cart' THEN 1 ELSE 0 END)加購(gòu)次數(shù)
        ,SUM(CASE WHEN behavior_type='buy' THEN 1 ELSE 0 END)購(gòu)買次數(shù)
        ,COUNT(DISTINCT USER_ID)每日用戶數(shù)
        ,count(*)/count(DISTINCT user_id)人均行為次數(shù)
        ,concat(ROUND(SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)/count(1)*100,2),'%')瀏覽數(shù)占比
        ,concat(ROUND(SUM(CASE WHEN behavior_type='BUY' THEN 1 ELSE 0 END)/count(1)*100,2),'%')購(gòu)買數(shù)占比
FROM user1
-- where date != '2014-12-12'
WHERE   (date BETWEEN '2014-11-24' AND '2014-12-14') 
                        -- and date !='2014-12-12'
GROUP BY DATE_FORMAT(date,'%W')
ORDER BY DATE_FORMAT(date,'%W');
周維度
周維度

一周中的大部分時(shí)間用戶活躍度都比較平穩(wěn),周五比較特殊,出現(xiàn)了增長(zhǎng)( 查看數(shù)據(jù)發(fā)現(xiàn)雙十二正好是周五,屬于特殊活動(dòng)日,如果進(jìn)行詳細(xì)分析時(shí)應(yīng)該將雙十二的日期排除分析有更有意義)。

3)、小時(shí)維度

3)、小時(shí)維度
SELECT
        hour
        ,count(1)點(diǎn)擊次數(shù)
        ,SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)瀏覽次數(shù)
        ,SUM(CASE WHEN behavior_type='fav' THEN 1 ELSE 0 END)收藏次數(shù)
        ,SUM(CASE WHEN behavior_type='cart' THEN 1 ELSE 0 END)加購(gòu)次數(shù)
        ,SUM(CASE WHEN behavior_type='buy' THEN 1 ELSE 0 END)購(gòu)買次數(shù)
        ,COUNT(DISTINCT USER_ID)每日用戶數(shù)
        ,count(*)/count(DISTINCT user_id)人均行為次數(shù)
        ,concat(ROUND(SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)/count(1)*100,2),'%')瀏覽數(shù)占比
        ,concat(ROUND(SUM(CASE WHEN behavior_type='BUY' THEN 1 ELSE 0 END)/count(1)*100,2),'%')購(gòu)買數(shù)占比
FROM user1
-- where date != '2014-12-12'
GROUP BY hour
ORDER BY hour;
小時(shí)維度
小時(shí)維度

晚間用戶較為活躍,但用戶行為傾向于瀏覽;白天尤其是中午左右的時(shí)段,購(gòu)買行為的比率相對(duì)一天中最高,此時(shí)購(gòu)買的目的性最強(qiáng)(瀏覽數(shù)占比與購(gòu)買數(shù)占比進(jìn)行關(guān)聯(lián)分析得出結(jié)論)。

(2)用戶商品偏好特征:

(2)用戶商品偏好特征:

SELECT
        item_category
        ,COUNT(*)點(diǎn)擊次數(shù)
        ,SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)瀏覽次數(shù)
        ,SUM(CASE WHEN behavior_type='fav' THEN 1 ELSE 0 END)收藏次數(shù)
        ,SUM(CASE WHEN behavior_type='cart' THEN 1 ELSE 0 END)加購(gòu)次數(shù)
        ,SUM(CASE WHEN behavior_type='buy' THEN 1 ELSE 0 END)購(gòu)買次數(shù)
        ,concat(ROUND(SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END)/count(behavior_type)*100,2),'%')瀏覽數(shù)占比
        ,concat(ROUND(SUM(CASE WHEN behavior_type='BUY' THEN 1 ELSE 0 END)/count(1)*100,2),'%')購(gòu)買數(shù)占比
FROM user1
-- where date != '2014-12-12'
GROUP BY item_category
ORDER BY 瀏覽次數(shù) DESC
商品維度

按照商品品類區(qū)分(矩陣分析),根據(jù)點(diǎn)擊次數(shù)和購(gòu)買次數(shù)兩個(gè)維度將所有商品劃分到四個(gè)象限:

瀏覽與購(gòu)買分布散點(diǎn)圖

點(diǎn)擊數(shù)高,購(gòu)買數(shù)高。說(shuō)明此類產(chǎn)品剛需比較強(qiáng),品牌多且種類豐富,用戶在較高的需求下有很多的選擇;
點(diǎn)擊數(shù)低購(gòu)買數(shù)高。用戶的購(gòu)買決策十分果斷,且對(duì)于該類產(chǎn)品的需求量也是很大的,說(shuō)明該類產(chǎn)品選擇性比較小,可能形成幾個(gè)品牌壟斷的情況,或者產(chǎn)品的差異性較小,用戶不愿花費(fèi)過(guò)多的精力去挑選。
點(diǎn)擊數(shù)低購(gòu)買數(shù)低,絕大多數(shù)產(chǎn)品都集中在這個(gè)象限,這種產(chǎn)品存在很多的替代品,用戶很難集中在某個(gè)子類進(jìn)行大量購(gòu)買,而是跳躍式選購(gòu)。
點(diǎn)擊數(shù)高購(gòu)買數(shù)低,這類產(chǎn)品的需求彈性較大,用戶購(gòu)買存在隨機(jī)性。

(3)、用戶購(gòu)買路徑特征:

用戶購(gòu)買商品分為以下幾類過(guò)程:

直接購(gòu)買
瀏覽后購(gòu)買
加購(gòu)物車購(gòu)買
瀏覽加購(gòu)物車購(gòu)買
收藏購(gòu)買
瀏覽收藏購(gòu)買

(3)、用戶購(gòu)買路徑特征:

1)創(chuàng)建用戶行為路徑表視圖(對(duì)用戶、商品、日期進(jìn)行分組,表結(jié)構(gòu):user_id,pv,fav,cart,buy)

CREATE VIEW 用戶行為 as
SELECT user_id
            ,SUM(CASE WHEN  behavior_type='PV' THEN 1 ELSE 0 END)瀏覽
            ,SUM(CASE WHEN  behavior_type='fav' THEN 1 ELSE 0 END)收藏
            ,SUM(CASE WHEN  behavior_type='cart' THEN 1 ELSE 0 END)加購(gòu)物車
            ,SUM(CASE WHEN  behavior_type='buy' THEN 1 ELSE 0 END)購(gòu)買
FROM user1
GROUP BY user_id,item_id,date;



2)將用戶行為標(biāo)準(zhǔn)化(存在該類行為則標(biāo)記為1,否則為0)

CREATE VIEW 用戶行為標(biāo)準(zhǔn)化表 AS
SELECT user_id
            ,(CASE WHEN 瀏覽>0 THEN 1 ELSE 0 END)瀏覽
            ,(CASE WHEN 收藏>0 THEN 1 ELSE 0 END)收藏
            ,(CASE WHEN 加購(gòu)物車>0 THEN 1 ELSE 0 END)加購(gòu)物車
            ,(CASE WHEN 購(gòu)買>0 THEN 1 ELSE 0 END)購(gòu)買
FROM 用戶行為


3)建立標(biāo)準(zhǔn)化指標(biāo)表(user_id,購(gòu)買路徑類型)

--選取user_i作為分組依據(jù),不會(huì)出現(xiàn)user_id重復(fù)的情況,但是會(huì)導(dǎo)致存在多種路徑的用戶數(shù)據(jù)的缺失(需要跟業(yè)務(wù)統(tǒng)一好計(jì)算口徑)

CREATE VIEW 標(biāo)準(zhǔn)化指標(biāo)表1 AS
SELECT user_id
            ,concat(瀏覽,收藏,加購(gòu)物車,購(gòu)買) as 購(gòu)買路徑類型
FROM 用戶行為標(biāo)準(zhǔn)化表 as a
WHERE a.購(gòu)買>0
GROUP BY user_id;


4)統(tǒng)計(jì)各指標(biāo)用戶數(shù)
SELECT 購(gòu)買路徑類型
            ,COUNT(DISTINCT user_id)用戶數(shù)
FROM 標(biāo)準(zhǔn)化指標(biāo)表
GROUP BY 購(gòu)買路徑類型;



3.2)
選取user_id和路徑作為分組依據(jù),因此會(huì)出現(xiàn)user_id重復(fù)的情況(需要統(tǒng)一計(jì)算口徑,跟前面的只把user_id作為分組的結(jié)果進(jìn)行對(duì)比)

CREATE VIEW 標(biāo)準(zhǔn)化指標(biāo)表 AS
SELECT user_id
            ,concat(瀏覽,收藏,加購(gòu)物車,購(gòu)買) as 購(gòu)買路徑類型
FROM 用戶行為標(biāo)準(zhǔn)化表 as a
WHERE a.購(gòu)買>0
GROUP BY user_id,concat(瀏覽,收藏,加購(gòu)物車,購(gòu)買)

4.2)統(tǒng)計(jì)各指標(biāo)用戶數(shù)
SELECT 購(gòu)買路徑類型
            ,COUNT(DISTINCT user_id)用戶數(shù)
FROM 標(biāo)準(zhǔn)化指標(biāo)表1
GROUP BY 購(gòu)買路徑類型
計(jì)算結(jié)果
計(jì)算結(jié)果

結(jié)果顯示,直接夠買的用戶遠(yuǎn)遠(yuǎn)多于瀏覽后加購(gòu)或者收藏再購(gòu)買的用戶,說(shuō)明大部分購(gòu)買者都是喜歡直接購(gòu)買商品的,這個(gè)跟周圍朋友的習(xí)慣也是符合的,基本上都是在瀏覽的階段都不會(huì)馬上購(gòu)買,而是等到過(guò)段時(shí)間想買的時(shí)候就直接下單,幾個(gè)步驟之間相當(dāng)于是分開(kāi)的。

(4)、用戶復(fù)購(gòu)率特征:

(4)、用戶復(fù)購(gòu)率特征:

客戶購(gòu)買次數(shù)
SELECT
        DISTINCT user_id
        ,COUNT(user_id)'購(gòu)買次數(shù)'
FROM user1
WHERE behavior_type='BUY'
GROUP BY user_id
ORDER BY COUNT(user_id) DESC


不同購(gòu)買次數(shù)的客戶分布

SELECT
        a.購(gòu)買次數(shù)
        ,count(DISTINCT user_id)用戶數(shù)
FROM 
        (SELECT
                DISTINCT user_id
                ,COUNT(user_id)購(gòu)買次數(shù)
        FROM user1
        WHERE behavior_type='BUY'
        GROUP BY user_id
        ORDER BY COUNT(user_id) DESC
        ) as a
GROUP BY a.購(gòu)買次數(shù)
ORDER BY a.購(gòu)買次數(shù)

客戶購(gòu)買次數(shù)分布
購(gòu)買次數(shù)分布
購(gòu)買次數(shù)分布

用戶的購(gòu)買次數(shù)大部分集中在5次以內(nèi),購(gòu)買頻率都還挺高的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容