一、 背景介紹
隨著互聯(lián)網(wǎng)的發(fā)展,人們?cè)絹?lái)越多地依靠網(wǎng)上購(gòu)物,尤其是嬰幼兒產(chǎn)品備受青睞。本次分析的主要目的是通過(guò)數(shù)據(jù)分析方法了解商品的消費(fèi)情況,為商家接下來(lái)的業(yè)務(wù)發(fā)展提供銷售建議和指導(dǎo)策略。
二、 數(shù)據(jù)來(lái)源
阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
三、 提出問(wèn)題
1) 商品的購(gòu)買數(shù)量如何?哪種商品的購(gòu)買數(shù)量最好?在哪個(gè)季度購(gòu)買數(shù)量最好?
2) 哪個(gè)年齡段嬰兒對(duì)應(yīng)的購(gòu)買量最多?
3) 嬰兒的性別與購(gòu)買數(shù)量有何關(guān)系?
四、 理解數(shù)據(jù)
嬰兒信息表字段:
user_id(用戶id)、birthday(出生日期)、gender(性別,0為男性、1為女性)
購(gòu)買信息表字段:
user_id(用戶id)、auction_id(購(gòu)買行為編號(hào))、cat_id(商品種類id)、cat1(商品屬于哪個(gè)類別)、property(商品屬性)、buy_mount(購(gòu)買數(shù)量)、day(購(gòu)買時(shí)間)
五、 數(shù)據(jù)清洗
a) 對(duì)數(shù)據(jù)集進(jìn)行處理選擇有分析意義的數(shù)據(jù),隱藏auction_id、cat_id、property等無(wú)意義的字段;
b) 通過(guò)COUNTA函數(shù)檢查表中并無(wú)缺失值需要填補(bǔ);應(yīng)用VLOOKUP函數(shù)將購(gòu)買信息表中有出生日期及性別的用戶篩選出來(lái),作為后續(xù)待分析數(shù)據(jù),剔除無(wú)用數(shù)據(jù);

c) 再通過(guò)查找替換功能將cat1列中商品的種類名稱用ABCDEF進(jìn)行統(tǒng)一的重命名,利用Excel的分列和設(shè)置單元格格式功能,將日期格式進(jìn)行轉(zhuǎn)換,從而增強(qiáng)可讀性也便于后續(xù)的分析與計(jì)算操作;
d) 根據(jù)商品的購(gòu)買日期和嬰兒的出生日期,我們可以利用Excel隱藏函數(shù)DATEDIF,計(jì)算出嬰兒當(dāng)前年齡,由于有些購(gòu)買日期是在嬰兒出生前購(gòu)買,所以還需要通過(guò)IFERROR函數(shù)來(lái)處理一些異常值,如果為嬰兒出生日期前購(gòu)買則顯示為-1;

e) 最終,將年齡按照嬰兒的重點(diǎn)成長(zhǎng)期進(jìn)行劃分,分組為未出生、0-1歲、1-3歲、3-7歲及7歲以上,再利用VLOOKUP函數(shù)將數(shù)據(jù)集中的年齡進(jìn)行分組匹配。

六、 數(shù)據(jù)可視化
1) 各種商品購(gòu)買數(shù)量如何?哪種商品購(gòu)買數(shù)量最好?

通過(guò)數(shù)據(jù)透視表和透視圖可知,C>A>B>E>F>D,且2014年度購(gòu)買數(shù)量最好。

第四季度的購(gòu)買數(shù)量明顯高于其他季度。
2) 哪個(gè)年齡段嬰兒對(duì)應(yīng)的購(gòu)買量最多?

由上圖可知,0-1歲和1-3歲嬰兒的購(gòu)買量最多;
未出生嬰兒對(duì)應(yīng)的更傾向與F商品、0-1歲傾向于C商品、1-3歲傾向于E商品、3-7歲傾向于D商品、7歲以上傾向于D商品。
3) 嬰兒的性別與購(gòu)買數(shù)量有何關(guān)系?

男性嬰兒傾向于選擇C商品,而女性嬰兒更傾向于選擇A商品。
七、 分析結(jié)論
通過(guò)對(duì)數(shù)據(jù)運(yùn)用多維度拆解方法,從產(chǎn)品指標(biāo)出發(fā),重點(diǎn)研究商品購(gòu)買量、商品種類和時(shí)間的關(guān)系。


1) 從嬰兒性別統(tǒng)計(jì)分析來(lái)看,男性嬰兒數(shù)量遠(yuǎn)大于女性嬰兒數(shù)量,后續(xù)可以針對(duì)男性嬰兒的購(gòu)買需求做出進(jìn)一步的分析和了解;
2) 從不同性別對(duì)商品種類的影響看出,男性嬰兒更傾向于選擇C商品(C>A>B>E>F>D),而女性嬰兒更傾向于選擇A商品(A>B>C>F>E>D)。
按照年齡將數(shù)據(jù)分為三類:未出生、嬰兒(0-2歲)、兒童(3-8歲)

通過(guò)年齡段分布情況可以看出嬰兒的購(gòu)買數(shù)量最多。

未出生的寶寶傾向于購(gòu)買C商品,嬰兒階段的寶寶也傾向于購(gòu)買C商品,而兒童階段則傾向于購(gòu)買A商品;
可以看出不同階段的寶寶對(duì)商品的需求也不同,建議商家后續(xù)應(yīng)定向?qū)Σ煌挲g段進(jìn)行推廣。