最近剛給帆軟的可視化冬季挑戰(zhàn)賽當完評委,發(fā)現(xiàn)了一批非常好的數(shù)據(jù)分析項目案例,經(jīng)過官方授權(quán)后,分享給大家。
今天為大家分享的項目作品是來自于參賽用戶楓城的作品,主題是基于人、貨、場的電商平臺數(shù)據(jù)分析,分析的思路非常清晰,可視化報告的部分做的也不錯,對數(shù)據(jù)分析新手來說非常具有學(xué)習價值。
場景介紹
業(yè)務(wù)背景介紹:小風是一名剛?cè)肼毜腂I工程師,在試用期結(jié)束期間,導(dǎo)師拿著一份電商數(shù)據(jù)給到小風,要求其給出合理分析結(jié)果
分析目的:小風通過分析電商平臺兩年內(nèi)的銷售情況和發(fā)展情況,找出平臺發(fā)展對應(yīng)結(jié)論,并給出相應(yīng)改善建議。
分析工具:FineBI,數(shù)據(jù)源獲取方式見文末
分析思路
首先我們明確這次分析的目的對于電商平臺相關(guān)數(shù)據(jù),分析發(fā)現(xiàn)問題并給出相關(guān)建議,決定從傳統(tǒng)的人,貨,場角度進行分析。
場的維度我們分析平臺銷售的健康情況和銷售分布情況??梢缘玫狡脚_銷售的分布特點和增長趨勢。
接著我們通過貨品分析,了解到該平臺,品類銷售情況和產(chǎn)品的價格帶在哪個位置,以此可以進行ABC分類的優(yōu)化和了解平臺產(chǎn)品定位,同時我們通過評分還了解到產(chǎn)品體驗還有待優(yōu)化,并嘗試定位產(chǎn)品低評的原因
接著會員分析,我們了解到會員的增長趨勢和會員的分布情況,發(fā)現(xiàn)會員也大量分布在巴西沿海,同時我們還通過AARRR模型和RFM模型了解到會員轉(zhuǎn)化率情況及消費屬性,并確定了重要價值客戶的占比和地理分布位置,客戶分層,有利于精準營銷。
同時通過分析會員訂單了解會員消費時間點和消費方式及平均付款時間。同時也通過會員的評分,了解到會員的潛在訴求。
其他分析-物流分析,最終分析了該平臺的物流情況,發(fā)現(xiàn)物流不準時占比偏高,物流時間也偏長,但同時物流費用占比訂單費用偏高,人們的消費和收到的服務(wù)不成正比,同時通過低評的不準時占比和物流時間驗證該猜測,確定低評現(xiàn)象和物流服務(wù)有關(guān)。
最后,就以上結(jié)論和現(xiàn)象進行相關(guān)改善建議
整體分析腦圖如下所示:
數(shù)據(jù)整理
基礎(chǔ)數(shù)據(jù)表主要為以下9張,如下圖所示,AAARR模型表,巴西各州輔助表,表關(guān)系,地區(qū)經(jīng)緯度表是我通過其他途徑獲得的輔助數(shù)據(jù)表。
主要用到自助數(shù)據(jù)集寬表為:訂單核心各維度聚合寬表,RFM模型表
數(shù)據(jù)整理過程:
第一步:獲取:登錄kaggle,下載公共數(shù)據(jù)集,需要翻墻和擁有kaggle賬號。(想去Kaggle參加競賽的朋友可以找我要翻墻工具)
第二步:清洗:為了保證源數(shù)據(jù)準確性,將上述9張EXCEL基礎(chǔ)數(shù)據(jù)做去重及異常值處理(如數(shù)據(jù)查重,時間值前后,金額正負等常規(guī)判斷),通過EXCEL配合相應(yīng)函數(shù)完成,因比較簡單,這邊不做過多敘述。
第三步:導(dǎo)入傳入到FineBI,并為了方便操作,將每張EXCEL表單獨創(chuàng)建一張寬表,作為維度表。(方便單表添加字段或維護),為后續(xù)制作大寬表打下數(shù)據(jù)基礎(chǔ)。
第四步:主要寬表制作(1)訂單核心各維度聚合寬表。
a、以O(shè)list_order_dataset為核心表,鏈接各維度表,創(chuàng)建訂單核心各維度聚合寬表。其表間血緣關(guān)系如下所示。
b、選取訂單核心表,通過左右合并依次和各維度表進行合并
c增加過濾,過濾出2017年至2018年的數(shù)據(jù)
d、新增列是否準時 通過預(yù)期物流到貨時間和實際到貨時間比較
e、新增列新老會員
f、訂單核心各維度聚合寬表創(chuàng)建完畢,其雪花模型如下所示。
第四步(2):主要寬表制作(2) RFM模型表
a、首先取訂單核心各維度聚合寬表對應(yīng)字段。
b、新增列,距今消費時間天數(shù),后續(xù)可計算平均消費時間天數(shù),并以此判斷R值
同理,通過會員消費頻次,計算平均會員頻次,比以此進行F值計算;通過會員消費金額,計算平均會員消費金額,并以此進行M值計算。
c、合并RFM,對R,F,M進行拼接
d、通過IF函數(shù)對RFM進行中文定義
至此相關(guān)數(shù)據(jù)處理完畢,數(shù)據(jù)整理告一段落。
完成分析報告
a、整體框架:整體排版按照故事的敘事來進行排版,具體為如下板塊,任務(wù)背景,明確目的->“場”分析->“貨”分析->”人”分析->其他分析->總結(jié)建議。
b、圖表選擇:圖表選擇可以看這張圖:
c、分析思路和對應(yīng)結(jié)論
場分析:通過季銷售趨勢圖及環(huán)比,還有各州金額分布分析了解平臺銷售走勢和銷售分布,了解平臺銷售是否健康及銷售重點區(qū)域。
1)發(fā)現(xiàn)相較2017年,2018年的銷售金額和銷售量呈環(huán)比上升趨勢,最近兩季度略微下降,趨向平穩(wěn)。平臺客單價在175Reals/單浮動。說明平臺整體的態(tài)勢還是向上發(fā)展的。
2)了解到訂單來源主要來自巴西沿海各州,其中圣保羅州,里約熱內(nèi)盧州,米納斯吉拉斯州為訂單量產(chǎn)出州TOP3,而反觀巴西內(nèi)地產(chǎn)出偏低,小風猜測這也許巴西經(jīng)濟中心集中在沿海各州有關(guān)。
貨分析:通過帕累托分析品類銷售情況,散點圖探究品類寬度和銷售關(guān)系,再通過價格帶分析,了解平臺產(chǎn)品定位。通過評價占比了解產(chǎn)品滿意情況,通過產(chǎn)品完整性分析驗證猜測。
1)發(fā)現(xiàn)health_beauty,watches_gifts,bed_bath_table這三個品類為該平臺熱賣品類,且18年銷售均大于17年,呈上升趨勢
2)通過散點圖分析,確認了寬度越寬的品類往往銷售額也越高
3)列出TOP10銷售的產(chǎn)品,得到平臺價格帶定位在0-100 ,主要面向低端客戶群體
4)1-2分的低評占了評價的18%,平臺服務(wù)有很大提升空間,探索其低分原因不是由產(chǎn)品本身不完整性導(dǎo)致的
人分析:分析平臺會員走勢了解平臺會員健康情況,通過地圖分布了解會員分布情況,通過AARRR模型了解會員轉(zhuǎn)化率,通過環(huán)形圖了解新老會員銷售情況。利用RFM模型給會員分層并確定重要價值客戶分布。利用會員行為分析了解會員下單時間,付費方式和平均付款時間,還知道會員低分占比及評論時間趨向。
1)發(fā)現(xiàn)2017年至2018年會員總體呈上升趨勢,但2018年第三季度呈現(xiàn)下滑狀態(tài)。
2)通過會員各州分布和城市分布發(fā)現(xiàn),會員主要集中在圣保羅州,里約熱內(nèi)盧州,主要分布城市為sao paulo riode janeiro
3)一般電商模型為AARRR模型,發(fā)現(xiàn)平臺轉(zhuǎn)化率在98%左右。
4)發(fā)現(xiàn)重要價值客戶占會員體系的17%,而重要價值客戶也憑借著自己的高客單,高銷量為銷售額提供了主要貢獻。
5)會員下單主要集中在11點,16點,20點,喜歡用credit_card作為支付手段,平均付款時間在6.46小時。
6)發(fā)現(xiàn)會員評分4-5分約占78%,總體好評居多,但1-2分也占據(jù)著13%,存在一定風險,可以適當優(yōu)化,會員評論時間集中在11-12,21-23時間段。
其他分析:通過物流準時度分析,物流時間占訂單時間分析,平均物流天數(shù)分析,物流運費金額在總金額的占比,來評估顧客物流服務(wù)投入產(chǎn)出比,通過低評的非準時占比和物流時間來驗證猜測。
1)顧客對物流服務(wù)的投入產(chǎn)出比低下,造成較大不滿
2)低評確實是由物流因素引起
對應(yīng)建議:
d、顏色總體偏深色調(diào)布局,淺色系布局一直不好拿捏,后期再進行嘗試,統(tǒng)一調(diào)整了字體和字號,讓畫面看起來更整齊美觀,并在結(jié)論處對應(yīng)指標做顏色標識,如代表好的指標為紅色系,代表差的指標為綠色系,整個優(yōu)化采取局部美化,完成時整體調(diào)優(yōu)的方式
調(diào)色網(wǎng)站推薦:Material Palette:http://www.materialpalette.com/,F(xiàn)lat UI Colors:http://flatuicolors.com/
e、作品展示(有些模糊,原圖太大,放不進來,只能壓縮,將就著看了,有興趣的可以下載PDF看)
總結(jié)
經(jīng)驗分享:帶著目的去分析,按照分析框架,循序漸進,去享受分析的過程。
作品pdf版本及數(shù)據(jù)源下載,轉(zhuǎn)發(fā)收藏本文,后臺私信“電商分析”領(lǐng)??!