一、什么是用戶畫(huà)像
1.應(yīng)用場(chǎng)景
1.1精細(xì)化運(yùn)營(yíng)
?為不同用戶群體進(jìn)行運(yùn)營(yíng),通過(guò)較少的成本得到較高的運(yùn)營(yíng)收入,可提升ROI(Return on investment)。
· 領(lǐng)導(dǎo)(直觀掌握數(shù)據(jù)):活躍用戶數(shù)、新增設(shè)備數(shù)、注冊(cè)用戶數(shù)、客單價(jià)、GMV、各平臺(tái)收入分布。
· 采購(gòu)人員(各商品的售賣情況):時(shí)間/季節(jié)、商品品類/名稱、購(gòu)買(mǎi)人數(shù)、購(gòu)買(mǎi)次數(shù)、購(gòu)買(mǎi)金額(銷售趨勢(shì))。
·?市場(chǎng)人員(了解用戶的渠道來(lái)源,從而針對(duì)性的調(diào)整投放策略):下載渠道、活躍用戶、訪問(wèn)次數(shù)、訪問(wèn)時(shí)間、次日留存、注冊(cè)轉(zhuǎn)化用戶(率)、支付成功用戶(率)、支付金額。
·?產(chǎn)品人員(了解用戶行為路徑,迭代產(chǎn)品):功能模塊使用量(活動(dòng)banner、首頁(yè)...)、時(shí)間、新用戶留存率(目標(biāo)用戶數(shù)、當(dāng)日、第1日、第2日、第3日....)
·?營(yíng)銷人員(分不同群體進(jìn)行營(yíng)銷/push):近7日活躍用戶、新增用戶、近30日活躍購(gòu)買(mǎi)5次以上的用戶)
1.2推薦系統(tǒng)
基于已有連結(jié)預(yù)測(cè)新的連結(jié)( 瀏覽頁(yè)面、購(gòu)物車頁(yè)面、訂單頁(yè)面推薦),用戶數(shù)字化表示。
2.概念
2.1示例
· 張三用戶畫(huà)像:1001(UserID),年齡20,常住地北京,消費(fèi)能力高,購(gòu)買(mǎi)偏好美妝
對(duì)每一條數(shù)據(jù)標(biāo)簽數(shù)字化:
年齡:20-25歲301、26-30歲302、31-35歲303...
性別:男101、女102...
常住地:北京401、上海402...
商品偏好:美妝201、書(shū)籍202、數(shù)碼203...
· 張三用戶畫(huà)像:1001,301,401,201
2.2定義
· 用戶畫(huà)像就是用戶標(biāo)注,通過(guò)標(biāo)簽的形式描述用戶;
· 個(gè)人特征:自然屬性(年齡、身高、體重)、社會(huì)屬性(職業(yè)、社交特征)、財(cái)富狀況(高/低收入人群、是否有固定資產(chǎn))、家庭情況(是否已婚、是否有孩子)、購(gòu)物習(xí)慣(網(wǎng)購(gòu)、下線購(gòu)物、線下看網(wǎng)上買(mǎi))、位置特征(常住地、常活動(dòng)的商圈)。
二、用戶畫(huà)像的計(jì)算框架選型
目標(biāo):理解用戶畫(huà)像項(xiàng)目的幾種實(shí)現(xiàn)方式
步驟:1.計(jì)算方式? ?2.存儲(chǔ)方式
2.1離線數(shù)倉(cāng)
直接在mySQL上查詢的缺點(diǎn):(mySQL是為業(yè)務(wù)數(shù)據(jù)庫(kù)準(zhǔn)備的)
(1) 查詢時(shí)會(huì)影響線上業(yè)務(wù)運(yùn)行;
(2)查詢語(yǔ)句過(guò)于繁瑣,并且多個(gè)分析之間有共性,中間層沒(méi)有保存;
(3)用于業(yè)務(wù)數(shù)據(jù)庫(kù)的模型一般都特別細(xì)分,分析不方便。
解決問(wèn)題(2):維度建模(分層)
(1)ODS貼源層:做數(shù)據(jù)存儲(chǔ),當(dāng)出現(xiàn)問(wèn)題時(shí)不再二次抽?。?/p>
(2)DW數(shù)倉(cāng)層:維度建模,簡(jiǎn)化查詢;
(3)DM集市層,為每個(gè)部門(mén)提供小型數(shù)倉(cāng);
(4)ADS應(yīng)用層,對(duì)應(yīng)數(shù)據(jù)應(yīng)用的需求,例如便于報(bào)表訪問(wèn)等。
解決問(wèn)題(3):將多個(gè)表進(jìn)行合并拉寬
解決問(wèn)題(1):數(shù)據(jù)抽取