電商用戶行為分析(MySQL+Power BI)

一、項(xiàng)目背景

隨著電商行業(yè)的不斷發(fā)展,獲客成本顯著上升,各大電商平臺(tái)都不遺余力地開拓新的營銷模式來刺激用戶消費(fèi)。如何獲取高質(zhì)量用戶,精準(zhǔn)營銷,高效運(yùn)營成為電商平臺(tái)未來發(fā)展的關(guān)鍵。基于這樣的背景,本文對(duì)電商用戶行為進(jìn)行分析,解讀電商用戶行為規(guī)律,理解用戶需求,幫助平臺(tái)提高銷量,實(shí)現(xiàn)營收增長。

二、理解數(shù)據(jù)

本文基于國內(nèi)熱門電商網(wǎng)站淘寶網(wǎng)的用戶行為數(shù)據(jù)進(jìn)行分析。
數(shù)據(jù)來源于阿里云天池。
User Behavior Data from Taobao

數(shù)據(jù)集主要情況為:用戶數(shù)量有近100萬(987,994),商品數(shù)量約為416萬(4,162,024),商品類目數(shù)量有近1萬(9,439),所有行為數(shù)量超過1億條(100,150,807).

數(shù)據(jù)集含義如下:




由于數(shù)據(jù)量較大,本文只導(dǎo)入10萬條數(shù)據(jù)進(jìn)行抽樣分析。使用MySQL分析數(shù)據(jù),獲得分析結(jié)果,然后將分析結(jié)果導(dǎo)出到Power BI或者Excel進(jìn)行可視化。

三、分析思路

本次分析的目的是提高銷量,將采用對(duì)比分析、多維度拆解分析、漏斗模型、RFM模型等方法,并從以下四個(gè)維度進(jìn)行分析和提出改進(jìn)建議。

  • 用戶行為習(xí)慣(時(shí)間):分析不同日期及時(shí)間段的用戶行為習(xí)慣,找出用戶最活躍的時(shí)期。
  • 用戶行為轉(zhuǎn)化(行為):分析用戶從點(diǎn)擊到購買整個(gè)環(huán)節(jié)中不同行為路徑的轉(zhuǎn)化率,并給出提高轉(zhuǎn)化率的建議。
  • 用戶購買偏好(產(chǎn)品):分析熱銷商品以及系統(tǒng)推薦產(chǎn)品,優(yōu)化營銷推薦策略。
  • 用戶價(jià)值(用戶):利用RFM模型進(jìn)行客戶群分類,建立評(píng)分機(jī)制,對(duì)不同價(jià)值的用戶采用不同的運(yùn)營刺激消費(fèi)。
    以下是分析思路


    思維導(dǎo)圖

數(shù)據(jù)清洗

  1. 選擇子集
    源數(shù)據(jù)只導(dǎo)入10萬條數(shù)據(jù),列包含用戶ID、商品ID、商品類目ID、行為類型、時(shí)間戳。
  2. 列名重命名


  3. 重復(fù)值處理
    發(fā)現(xiàn)無重復(fù)值。


  4. 缺失值處理
    將各字段設(shè)置成“not null”,確保每個(gè)字段中都沒有缺失值,并且利用count函數(shù)進(jìn)行計(jì)數(shù)查詢,結(jié)果表明沒有缺失值。



  5. 格式一致化
    數(shù)據(jù)集一共有五列,其中timestamp列為時(shí)間戳,需轉(zhuǎn)化為時(shí)間格式。在原數(shù)據(jù)表增加4個(gè)新字段datetime,date,time,hour。






    格式一致化結(jié)果

    6.數(shù)據(jù)異常值處理
    由于我們利用2017年11月25日至2017年12月3日之間的用戶行為數(shù)據(jù)進(jìn)行研究,因此需要對(duì)該時(shí)間段外的數(shù)據(jù)進(jìn)行刪除。


查詢?nèi)掌?/div>
處理后結(jié)果

五、分析過程

(一)用戶行為習(xí)慣分析

分別以日和小時(shí)為單位分析用戶購買行為,找出用戶活躍規(guī)律。

1.2017年11月25日至12月3日間的用戶行為習(xí)慣分布



在研究日期內(nèi),11月25日、11月26日與12月2日、12月3日為周末,其余為工作日。從點(diǎn)擊量來看,我們可以看出用戶的活躍度在12月2日和12月3日有明顯增幅。從加購數(shù)和收藏?cái)?shù)看,相對(duì)于收藏,用戶更愛直接加購,并且在12月2日及3日間兩者都出現(xiàn)明顯增長。從購買數(shù)看,整體相對(duì)平穩(wěn),但在后一個(gè)周末出現(xiàn)了大幅增長。
流量急劇增長的原因可能是雙十二的預(yù)熱活動(dòng)導(dǎo)致,用戶開始瀏覽商品,并進(jìn)行收藏及加購,但卻未下單??傮w而言,周末的用戶活躍度整體比工作日高。

2.一天內(nèi)的用戶行為習(xí)慣分布



從點(diǎn)擊量看,我們可以發(fā)現(xiàn)每日0點(diǎn)至3點(diǎn)用戶活躍度快速降低,凌晨3點(diǎn)為一天最低值。4點(diǎn)至10點(diǎn)活躍度逐步上升,10點(diǎn)至18點(diǎn)活躍度相對(duì)平穩(wěn)。其中13點(diǎn)至16點(diǎn)是白天的活躍期。18點(diǎn)后活躍度急劇上升,并在20點(diǎn)至22點(diǎn)達(dá)到一天的高峰期,其中21點(diǎn)時(shí)為最高值。說明用戶習(xí)慣在晚上7點(diǎn)至23點(diǎn)瀏覽并選擇商品進(jìn)行購買。
從加購、收藏、購買及轉(zhuǎn)化率看,用戶加購意愿較強(qiáng),且與點(diǎn)擊量變化趨勢(shì)相關(guān)性最高。購買轉(zhuǎn)化率則在中午12點(diǎn)至13點(diǎn)最高,說明用戶在午休時(shí)下單意愿較強(qiáng)。

(二)用戶行為轉(zhuǎn)化分析

從用戶行為習(xí)慣分布(時(shí))圖中,我們發(fā)現(xiàn)一天中的購買轉(zhuǎn)化率最大值為3.4%,相對(duì)較低。下面我們來分析用戶行為轉(zhuǎn)化中的問題。

1.用戶整體行為轉(zhuǎn)化分析

(1)建立用戶行為視圖


(2) 提取數(shù)據(jù)


(3) 建模分析


先對(duì)整體用戶行為進(jìn)行描述性分析,從行為數(shù)量占比圖中,我們發(fā)現(xiàn)點(diǎn)擊行為占比89.7%,加購行為約為收藏行為的2倍。從用戶行為轉(zhuǎn)化漏斗圖中,我們可以看到用戶從點(diǎn)擊到購買的轉(zhuǎn)化率約為2.3%。那么是什么原因?qū)е聫狞c(diǎn)擊到購買的轉(zhuǎn)化率偏低呢?
針對(duì)轉(zhuǎn)化率低的問題,從用戶行為和商品兩個(gè)維度來做出3種假設(shè),來研究是什么原因?qū)е罗D(zhuǎn)化率低。


思維導(dǎo)圖

2.不同行為路徑轉(zhuǎn)化分析

行為路徑指的是用戶從點(diǎn)開商品到最終購買所經(jīng)過的步驟。本文以點(diǎn)擊、加購、收藏、購買為4個(gè)基本的步驟。通過分析不同行為路徑的轉(zhuǎn)化率,我們可以發(fā)現(xiàn)哪個(gè)環(huán)節(jié)產(chǎn)生了問題,而導(dǎo)致用戶最終未購買。
假設(shè)一:不同的行為路徑影響轉(zhuǎn)化率。
可分為4種路徑(收藏加購不分先后順序):

  • 點(diǎn)擊—購買
  • 點(diǎn)擊—加購—購買
  • 點(diǎn)擊—收藏—購買
  • 點(diǎn)擊—收藏和加購—購買

(1)查詢統(tǒng)計(jì)各行為路徑用戶數(shù)

(2)繪制轉(zhuǎn)化漏斗圖并分析


從上圖,我們可以發(fā)現(xiàn)在點(diǎn)擊商品后,48.58%的用戶會(huì)進(jìn)行加購,25%的用戶會(huì)加購并收藏,12%的用戶會(huì)進(jìn)行收藏,而7.45%的用戶會(huì)直接購買。
其次,我們發(fā)現(xiàn)收藏和加購-購買的轉(zhuǎn)化率有80%,其次為加購-購買的轉(zhuǎn)化率69%,收藏-購買的轉(zhuǎn)化率60%,加購的轉(zhuǎn)化率大于收藏。
經(jīng)過分析,我們發(fā)現(xiàn)不同的購物行為路徑對(duì)轉(zhuǎn)化率存在影響。因此,假設(shè)一成立。

(三)用戶商品偏好分析

現(xiàn)在從產(chǎn)品維度分析對(duì)轉(zhuǎn)化率的影響。

1.商品類目數(shù)量

假設(shè)二:商品類目單一影響轉(zhuǎn)化率。




查詢商品類目發(fā)現(xiàn)有3128個(gè),并不單一,用戶的購買選擇較為豐富。
因此假設(shè)二不成立。

2.熱搜商品和熱賣商品

假設(shè)三:推薦商品不符合用戶偏好影響轉(zhuǎn)化率。

(1)熱搜與熱賣TOP20商品ID



熱搜與熱賣TOP20商品ID

整理成表格可以發(fā)現(xiàn)兩組數(shù)據(jù)的商品ID不存在重合。高點(diǎn)擊的商品沒有轉(zhuǎn)化成高銷量商品。由于商品ID較多,TOP20的樣本數(shù)據(jù)較少,下面我們?cè)購纳唐奉惸縼磉M(jìn)行分析。

(2)熱搜與熱賣TOP20商品類目



熱搜與熱賣TOP20商品類目

將數(shù)據(jù)整理成表格發(fā)現(xiàn)兩組數(shù)據(jù)有12個(gè)相同類目,重合度達(dá)60%。說明商品類目存在明顯的集中趨勢(shì)。
而用戶點(diǎn)擊量最多的前5個(gè)類目在購買量中分別排名7,8,3,11,16。說明存在流量浪費(fèi),高流量并未直接對(duì)應(yīng)高銷量。
從商品ID和商品類目來看,高流量并沒有帶來高銷量,推薦的商品未完全符合用戶偏好,因此假設(shè)三成立。
綜上所述,

  • 假設(shè)一:不同的行為路徑影響轉(zhuǎn)化率 成立
  • 假設(shè)二:商品種目單一影響轉(zhuǎn)化率 不成立
  • 假設(shè)三:推薦商品不符合用戶偏好影響轉(zhuǎn)化率 成立

(四)用戶價(jià)值分析

RFM模型是衡量客戶價(jià)值和客戶創(chuàng)利能力的重要工具和手段。

  • R:最近一次消費(fèi)時(shí)間(最近一次消費(fèi)到參考時(shí)間的間隔)
  • F:消費(fèi)的頻率(消費(fèi)次數(shù))
  • M:消費(fèi)的金額(總消費(fèi)金額)
    由于本次分析中沒有提供金額,所以從R、F兩個(gè)維度對(duì)客戶群進(jìn)行分析。

1.計(jì)算R和F的值


2.確定R和F的評(píng)分規(guī)則

整理后發(fā)現(xiàn)R值范圍1-9,F(xiàn)值1-43。


3.給R和F價(jià)值打分


4.計(jì)算R價(jià)值分和F價(jià)值分的平均數(shù)

5.進(jìn)行用戶分類并分析




用戶分類

由上圖,我們可以發(fā)現(xiàn)91%用戶為重要挽留用戶和重要發(fā)展用戶,兩者分別占比52%和39%。而 重要價(jià)值用戶和重要保持用戶僅占約6%和3%。

六、總結(jié)與建議

(一)用戶行為習(xí)慣

通過對(duì)用戶行為習(xí)慣的分析,可以發(fā)現(xiàn)周末的用戶活躍度整體比工作日高。一天中晚上7點(diǎn)至23點(diǎn)為高峰期。中午12點(diǎn)到下午1點(diǎn)則是白天的活躍時(shí)間段,并且購買轉(zhuǎn)化率較高。

  • 可以將營銷活動(dòng)、直通車、鉆展等安排在用戶活躍時(shí)間段,來促進(jìn)引流并轉(zhuǎn)化;
  • 可以在中午12點(diǎn)左右設(shè)置各類限時(shí)促銷或捆綁銷售活動(dòng),縮短用戶選擇時(shí)間,促進(jìn)轉(zhuǎn)化率的提升,從而提高銷量。

(二)用戶行為轉(zhuǎn)化

通過分析,發(fā)現(xiàn)用戶收藏加購到購買的轉(zhuǎn)化率達(dá)到80%,而流量行為從點(diǎn)擊到購買的轉(zhuǎn)化率僅為2.3%。說明從點(diǎn)擊到其它環(huán)節(jié)中存在大量的流失,購買行為路徑的優(yōu)化是重要環(huán)節(jié)。

  • 引導(dǎo)加購及收藏,可以加強(qiáng)營銷機(jī)制引導(dǎo)顧客加購以及收藏,比如加購送優(yōu)惠券、加購送小樣贈(zèng)品、收藏抽獎(jiǎng)等;
  • 優(yōu)化人群畫像,針對(duì)行為路徑較短的人群,如占比7.45%的點(diǎn)擊后即購買的用戶 著重進(jìn)行商品推薦,從而提高轉(zhuǎn)化率,提升銷量;
  • 優(yōu)化界面設(shè)計(jì),可以給客戶提供同類產(chǎn)品比較的功能。讓用戶不需要多次返回搜索結(jié)果進(jìn)行點(diǎn)擊查看,方便用戶確定心儀產(chǎn)品,增加點(diǎn)擊到購買行為的轉(zhuǎn)化。

(三)用戶購買偏好

高瀏覽的商品并未對(duì)應(yīng)高銷量,存在流量的浪費(fèi)。TOP20的熱銷類目和熱搜類目存在60%的相同類目,即熱門的商品類目存在集中的趨勢(shì)。

  • 優(yōu)化推薦機(jī)制,優(yōu)先展示熱銷的商品和類目,滿足用戶的購買偏好;
  • 優(yōu)化推薦商品的展示方式,如美化圖片、評(píng)論管理等,提升用戶的購買意愿;
  • 通過更完善的會(huì)員積分機(jī)制,促銷活動(dòng)等方式來降低流失率。

(四)用戶價(jià)值

通過RFM模型對(duì)客戶群進(jìn)行劃分,可以對(duì)不同的用戶群體采用不同的策略,促進(jìn)精準(zhǔn)營銷。

  • 針對(duì)重要挽留客戶,有流失的風(fēng)險(xiǎn),要想辦法主動(dòng)聯(lián)系用戶,明確流失原因,想辦法挽回并再次激活用戶購物;
  • 針對(duì)重要發(fā)展用戶,消費(fèi)頻率較低,可以采取購物紅包、每月會(huì)員日、限時(shí)優(yōu)惠信息提醒等方式來提升消費(fèi)頻率;
  • 針對(duì)重要價(jià)值用戶,需要重點(diǎn)關(guān)注并給予VIP待遇,不斷提升用戶滿意度;
  • 針對(duì)重要保持用戶,最近一次消費(fèi)時(shí)間較長,可以采取短信推送、APP促銷信息提醒等方式和客戶保持聯(lián)系,為其進(jìn)行個(gè)性化推薦,以提高復(fù)購率。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文結(jié)構(gòu): 一、理解數(shù)據(jù) 1、總體介紹 ①、數(shù)據(jù)來源: 本數(shù)據(jù)集數(shù)據(jù)來源于阿里巴巴天池:https://tianc...
    對(duì)三zzzzzzz閱讀 2,877評(píng)論 0 14
  • 本文結(jié)構(gòu): 一、理解數(shù)據(jù) 1、總體介紹 ①、數(shù)據(jù)來源: 本數(shù)據(jù)集數(shù)據(jù)來源于阿里巴巴天池:https://tianc...
    對(duì)三zzzzzzz閱讀 996評(píng)論 0 6
  • 一. 認(rèn)識(shí)數(shù)據(jù) 數(shù)據(jù)來自天池推薦算法大賽,點(diǎn)擊獲取數(shù)據(jù)。 數(shù)據(jù)集包含了:2014年11月18日-2014年12月1...
    子羊ly閱讀 772評(píng)論 0 1
  • 一.分析背景與目的 1.1背景與數(shù)據(jù)限制 本數(shù)據(jù)集為某電商app中的用戶行為,本分析案例通過:時(shí)間-用戶-商品-行...
    Dogegg_Li閱讀 4,393評(píng)論 1 3
  • 感賞我自己能將自己的內(nèi)心真實(shí)的一面講出來,不在逃避自己的內(nèi)心,聽取姐妹們的分析和指點(diǎn)。 感賞我及時(shí)表揚(yáng)孩子,鼓勵(lì)孩...
    貴州六年級(jí)莊杰閱讀 159評(píng)論 0 1

友情鏈接更多精彩內(nèi)容