黑五數(shù)據(jù)——基于Excel分析

大數(shù)據(jù)分析已經(jīng)迅速成為數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)的一個(gè)組成部分,并在使品牌和企業(yè)更容易在用戶運(yùn)營(yíng)中發(fā)揮重要作用。企業(yè)建立的內(nèi)容傳播和推廣活動(dòng)受到來(lái)自各種渠道的影響越來(lái)越大,尤其是關(guān)于其受眾、其用戶的在線行為和個(gè)人喜好的數(shù)據(jù)洞察。本文嘗試我從kaggle大數(shù)據(jù)平臺(tái)上下載了Black Friday的銷售數(shù)據(jù),對(duì)其進(jìn)行分析,以挖掘出對(duì)該電商企業(yè)制定促銷策略有價(jià)值的信息。

一、電商數(shù)據(jù)分析指標(biāo)及數(shù)據(jù)分析方法
1.電商數(shù)據(jù)分析指標(biāo)在知乎上找到了一篇詳細(xì)的文章,想借此引用獼猴桃電商數(shù)據(jù)分析指標(biāo)總結(jié)
2.數(shù)據(jù)分析方法也同樣引用獼猴桃常用數(shù)據(jù)分析方法及模型
具體自我總結(jié)等學(xué)完python,再總結(jié)《數(shù)據(jù)化管理》。
二、業(yè)務(wù)理解并提出問(wèn)題

image.png

前期思考借用了豬可飛大佬的一些思考,基于框架提出問(wèn)題,
(1)根據(jù)消費(fèi)者的性別比例、年齡分布、職業(yè)分布、所在城市居住時(shí)間分布和婚姻狀況,商家該怎樣針對(duì)顧客發(fā)促銷廣告
(2)銷售額最高的產(chǎn)品類別和產(chǎn)品是什么?銷量最高的產(chǎn)品類別和產(chǎn)品是什么?
(3)各城市的產(chǎn)品銷售額和銷量是怎樣的?
(4)找出銷售數(shù)量最高的TOP10商品,來(lái)分析最受歡迎的商品有什么特點(diǎn)?
(5)不同居住年數(shù)的購(gòu)物習(xí)慣是怎樣的?
二、這次數(shù)據(jù)集中的數(shù)據(jù)量共計(jì)有657677條。一共包含了12個(gè)字段,如下:
User_ID:用戶編碼
Product_ID:產(chǎn)品編碼
Gender:性別(F-女性,M-男性)
Age:年齡(分為7個(gè)年齡段:017、1825、2635、3645、4650、5155、55+)
Occupation:職業(yè)(分為21個(gè)類別:0-20)
City_Category:城市類別(分為3個(gè)類別:A、B、C)
Stay_In_Current_City_Years:在當(dāng)前城市的居住年數(shù)(分為5個(gè)類別:0、1、2、3、4+)
Marital_Status:婚姻狀況(0-未婚,1-已婚)
Product_Category_1:商品所屬分類1,不可為空
Product_Category_2:商品所屬分類2
Product_Category_3:商品所屬分類3
Purchase:購(gòu)買金額(美元)
三、數(shù)據(jù)清洗
1-列名重命名
image.png

2-選擇子集
根據(jù)要分析的問(wèn)題,將不會(huì)用到的列進(jìn)行隱藏??梢詫⑸唐匪鶎俜诸?還有商品所屬分類3進(jìn)行隱藏。
3-刪除重復(fù)值
(1)在分析有關(guān)銷售金額時(shí),由于同一個(gè)用戶可以買不同的產(chǎn)品,同一個(gè)產(chǎn)品可以被不同的用戶購(gòu)買,所以用戶對(duì)應(yīng)的唯一值——用戶編碼,和產(chǎn)品對(duì)應(yīng)的唯一值——產(chǎn)品編碼都不能作為本表的唯一列去判斷是否有重復(fù)項(xiàng),新建一個(gè)輔助列,將用戶編號(hào)和產(chǎn)品編號(hào)放在一起,去判斷購(gòu)買信息是否有重復(fù)列。
選擇整個(gè)區(qū)域——數(shù)據(jù)-刪除重復(fù)值——取消全選——選擇輔助列——確定。結(jié)果顯示未發(fā)現(xiàn)重復(fù)值。
(2)在分析消費(fèi)者時(shí),由于同一個(gè)用戶可以買不同的產(chǎn)品,所以應(yīng)檢查用戶編號(hào)是否有重復(fù),刪除重復(fù)值。
image.png

4-缺失值處理
分析需要用到的列無(wú)缺失值,計(jì)數(shù)均為537578。
5-一致化處理
為了方便分析和閱讀,將表中性別那一列中的F全部替換為女,M全部替換為男。將表中婚姻那一列中的替換“0”為“未婚”,“1”為“已婚”。
6-數(shù)據(jù)排序
對(duì)該數(shù)據(jù)檢查,該數(shù)據(jù)集默認(rèn)以用戶ID從小到大排序,其他分析需要用到的列無(wú)需特定排序,因此未進(jìn)行數(shù)據(jù)重新排序。
7-異常值處理
對(duì)該數(shù)據(jù)檢查,分析需要用到的列均無(wú)異常值,無(wú)需異常值處理。
四、數(shù)據(jù)分析
1、通過(guò)數(shù)據(jù)透視表找出消費(fèi)者的性別比例、年齡分布、職業(yè)分布、所在城市居住時(shí)間分布和婚姻狀況。
(1)消費(fèi)者的性別比例
image.png

從性別看,消費(fèi)者中大部分為男性,男性人數(shù)是女性人數(shù)的兩倍多。
(2)消費(fèi)者的年齡分布
image.png

從年齡看,消費(fèi)者的年齡集中在18歲至45歲,以中青年為主。在七個(gè)年齡分段中, 26歲至35歲的消費(fèi)者為購(gòu)買該產(chǎn)品的主力,大約占全部購(gòu)買該產(chǎn)品類別的消費(fèi)者的40%。
(3)消費(fèi)者的職業(yè)分布
image.png

從職業(yè)看,消費(fèi)者從事職業(yè)4、職業(yè)0和職業(yè)7的人數(shù)較多,分別占全部消費(fèi)者的12.56%,11.68%和11.36%。其他職業(yè)占比均低于10%。
(4)消費(fèi)者的所在城市居住時(shí)間分布
image.png

從消費(fèi)者所在城市居住時(shí)間看,居住時(shí)間滿一年且不足兩年的消費(fèi)者為“黑五”消費(fèi)的主力軍,占全部消費(fèi)者的35.41%。
(5)消費(fèi)者的婚姻狀況
image.png

從消費(fèi)者的婚姻狀況看,未婚消費(fèi)者占全部消費(fèi)者的58.00%,接近六成。
通過(guò)對(duì)消費(fèi)者的性別、年齡、職業(yè)、所在城市居住時(shí)間、婚姻狀況這5個(gè)角度分析得出,從黑五中的消費(fèi)者性別分析得出71.72%為男性,23.21%為女性。消費(fèi)者主力的年齡范圍在26-35歲這個(gè)范圍,處在這個(gè)年齡段的消費(fèi)者大都數(shù)已經(jīng)工作了,能夠經(jīng)濟(jì)獨(dú)立了,其次是36-45歲和18-25歲之間的消費(fèi)團(tuán)體。從消費(fèi)者的職業(yè)分析,職位是4,0,7的消費(fèi)者的消費(fèi)金額都在10%以上,可以判斷從事這幾個(gè)行業(yè)的收入應(yīng)該不錯(cuò)。
在商品分類1對(duì)客戶屬性分析
性別
image.png

年齡
image.png

職業(yè)分布
image.png
由于職業(yè)太多,只選取了消費(fèi)金額排名前15的職業(yè)
城市
image.png

居住年數(shù)
image.png

婚姻
image.png

通過(guò)消費(fèi)者性別、年齡、居住年數(shù)、婚姻以及職業(yè)和產(chǎn)品購(gòu)買金額之間的百分百排名,發(fā)現(xiàn)商品分類1中的第1、5、8這三種類型的產(chǎn)品的購(gòu)買金額都在總體購(gòu)買金額的10%以上,說(shuō)明這3類產(chǎn)品的需求量很大。其中第1類產(chǎn)品一直銷售金額排名第一,而第5、8這兩類產(chǎn)品由于消費(fèi)者的年齡和職業(yè)不同,排名會(huì)發(fā)生變化。商家可以好好開(kāi)拓這3類產(chǎn)品,為消費(fèi)者提供更好的商品。同時(shí)有些銷量特別低的產(chǎn)品類目,商家可以根據(jù)自己的需求決定是否還需要保留。
2、通過(guò)數(shù)據(jù)透視表找出銷售額最高的產(chǎn)品類別和產(chǎn)品,以及銷量最高的產(chǎn)品類別和產(chǎn)品。
(1)銷售額最高的產(chǎn)品類別
image.png

從上圖可以看出,銷售額最高的是產(chǎn)品類別1,銷售額為1,882,666,325美元。
(2)銷售額最高的產(chǎn)品
image.png

從上圖可以看出,銷售額最高的產(chǎn)品是P00025442,銷售額為27,532,426美元。
(3)銷量最高的產(chǎn)品類別
image.png

從上圖可以看出,銷量最高的是產(chǎn)品類別5,銷量為148,592。
(4)銷量最高的產(chǎn)品
image.png

從上圖可以看出,銷量最高的產(chǎn)品是P00265242,銷量為1,858。
3、通過(guò)數(shù)據(jù)透視表找出各城市的產(chǎn)品銷售額和銷量。
(1)各城市的產(chǎn)品銷售額
image.png

從上圖可以看出,銷售額最高的為城市B,銷售額為2,083,431,612美元;其次為城市C,銷售額為1,638,567,969美元;最后為城市A,銷售額為1,295,668,797美元。
(2)各城市的產(chǎn)品銷量
image.png

從上圖可以看出,銷量最高的為城市B,銷量為226,493;其次為城市C,銷量為166,446;最后為城市A,銷量為144,638。
4、找出銷售數(shù)量最高的TOP10商品,來(lái)分析最受歡迎的商品有什么特點(diǎn)?
根據(jù)產(chǎn)品編號(hào),購(gòu)買金額兩個(gè)字段繪制出數(shù)據(jù)透視表,然后根據(jù)數(shù)據(jù)透視表制作如下的表格。
image.png

從中可以看出購(gòu)買金額排前10的產(chǎn)品,其中有7個(gè)都在產(chǎn)品所屬分類1中的第一個(gè)檔次中,這10中產(chǎn)品在總的購(gòu)買金額中都占了0.44%以上。商家可以根據(jù)這幾類產(chǎn)品分析推出更加符合消費(fèi)者偏好的產(chǎn)品,也可以根據(jù)這些產(chǎn)品找出和它們相關(guān)聯(lián)的產(chǎn)品。
5、不同居住年數(shù)的購(gòu)物習(xí)慣是怎樣的?
image.png

image.png

根據(jù)消費(fèi)者的居住年數(shù)與購(gòu)買金額的百分百得出,消費(fèi)主力為居住年數(shù)是1年的人,這類人往往大多數(shù)可能是居住穩(wěn)定了,可以購(gòu)買自己想要的東西了。消費(fèi)金額最少的是居住年數(shù)為0的,這可能是才到這個(gè)城市幾個(gè)月,只購(gòu)買自己的必需品。
根據(jù)消費(fèi)者居住年數(shù)和產(chǎn)品類別的分析得出,1、5、8這三類產(chǎn)品仍然是熱銷品,可能是和生活衣食住行息息相關(guān)的產(chǎn)品。后期商家可以根據(jù)不同居住年數(shù),推薦不同的商品。比如居住1年的,可以推薦 家居品,比如洗衣機(jī)等;居住2年以上的可以推薦兒童用品等等。
五:結(jié)論
通過(guò)數(shù)據(jù)分析可得:商家應(yīng)把主要精力放在1、5、8這三類商品上面,優(yōu)化提供更多好的商品,可以真的居住年數(shù)在一年以上兩年以上的,年齡在26-35,以及職位是4,0,7的這些顧客上進(jìn)行精準(zhǔn)營(yíng)銷,提高企業(yè)營(yíng)業(yè)收入增長(zhǎng)。
注意:1.
image.png

image.png

注意透視表計(jì)數(shù)項(xiàng)和求和項(xiàng)之間的不同
2.數(shù)據(jù)透視表占比的使用方法
3.注意數(shù)據(jù)刪除重復(fù)值

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容