分析分為兩個部分:
一,數(shù)據(jù)清洗
二,數(shù)據(jù)分析
下面是具體步驟
一,數(shù)據(jù)清洗
1.使用python3,對數(shù)據(jù)進行截??;(截取前一百行)

2.將新的u_b100000.csv表格導入SQL Workbench
? ?創(chuàng)建一個新的table:u_b2017,并導入u_b10000000.csv

3.確認重復項/缺失值

沒有重復值

沒有缺失值
4.新增一個主鍵ID

unsigned 為 非負數(shù)
5.將timestamp轉(zhuǎn)換成when(%y-%m-%d %k:%i:%s), date(%y-%m-%d),time(%k:%i:%s)

6.整合數(shù)據(jù)

二,數(shù)據(jù)分析
a.活躍用戶分析

每日活躍用戶數(shù)量

可以看出活躍用戶量在12月2日有明顯上升,可結(jié)合相關(guān)策略進行分析

每時段活躍用戶數(shù)量

可以看出凌晨4點用戶活躍度最低
b)用戶行為分析

每日4個維度的行為總數(shù)

可看出瀏覽次數(shù)遠高于其他行為,證明曝光是足夠的;在12月2日有明顯上升,可結(jié)合相關(guān)策略進行分析;

加購物車行為遠高于其他兩種行為,證明購物車的形式比收藏利用率高;
c)瀏覽購買轉(zhuǎn)換率

#直接購買的轉(zhuǎn)化率

直接購買次數(shù)/總瀏覽次數(shù)=1.1%
#購物車購買的轉(zhuǎn)換率


購物車購買的轉(zhuǎn)換率 =0.32%
#收藏購買轉(zhuǎn)換率


購物車購買的轉(zhuǎn)換率 =0.01%
結(jié)論:
總體的瀏覽購買轉(zhuǎn)化率 = 1.1%+0.32%+0.01%=1.43%,即用戶每100次瀏覽行為,就會產(chǎn)生1.43次購買行為;

直接購買>加入購物車>收藏