
第1章 用戶畫像基礎(chǔ)
1.1 用戶畫像是什么
1.1 用戶畫像是什么
用戶畫像,即用戶信息標(biāo)簽化,通過(guò)收集用戶的社會(huì)屬性、消費(fèi)習(xí)慣、偏好特征等各個(gè)維度的數(shù)據(jù),進(jìn)而對(duì)用戶或者產(chǎn)品特征屬性進(jìn)行刻畫,并對(duì)這些特征進(jìn)行分析、統(tǒng)計(jì),挖掘潛在價(jià)值信息,從而抽象出用戶的信息全貌。

1.1.2 標(biāo)簽類型
用戶畫像建模其實(shí)就是對(duì)用戶“打標(biāo)簽”,從對(duì)用戶打標(biāo)簽的方式來(lái)看,一般分為3種類型(如圖1-3所示):
①統(tǒng)計(jì)類標(biāo)簽;②規(guī)則類標(biāo)簽;③機(jī)器學(xué)習(xí)挖掘類標(biāo)簽。
1.統(tǒng)計(jì)類標(biāo)簽
這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型,例如,對(duì)于某個(gè)用戶來(lái)說(shuō),其性別、年齡、城市、星座、近7日活躍時(shí)長(zhǎng)、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊(cè)數(shù)據(jù)、用戶訪問(wèn)、消費(fèi)數(shù)據(jù)中統(tǒng)計(jì)得出。該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)。
2.規(guī)則類標(biāo)簽
該類標(biāo)簽基于用戶行為及確定的規(guī)則產(chǎn)生。例如,對(duì)平臺(tái)上“消費(fèi)活躍”用戶這一口徑的定義為“近30天交易次數(shù)≥2”。在實(shí)際開發(fā)畫像的過(guò)程中,由于運(yùn)營(yíng)人員對(duì)業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對(duì)數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類標(biāo)簽的規(guī)則由運(yùn)營(yíng)人員和數(shù)據(jù)人員共同協(xié)商確定;
3.機(jī)器學(xué)習(xí)挖掘類標(biāo)簽
該類標(biāo)簽通過(guò)機(jī)器學(xué)習(xí)挖掘產(chǎn)生,用于對(duì)用戶的某些屬性或某些行為進(jìn)行預(yù)測(cè)判斷。例如,根據(jù)一個(gè)用戶的行為習(xí)慣判斷該用戶是男性還是女性、根據(jù)一個(gè)用戶的消費(fèi)習(xí)慣判斷其對(duì)某商品的偏好程度。該類標(biāo)簽需要通過(guò)算法挖掘產(chǎn)生。
1.2 數(shù)據(jù)架構(gòu)
在整個(gè)工程化方案中,系統(tǒng)依賴的基礎(chǔ)設(shè)施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基礎(chǔ)設(shè)施外,系統(tǒng)主體還包括SparkStreaming、ETL、產(chǎn)品端3個(gè)重要組成部分。圖1-4所示是用戶畫像數(shù)倉(cāng)架構(gòu)圖,下面對(duì)其進(jìn)行詳細(xì)介紹。

?Hive:存儲(chǔ)用戶標(biāo)簽計(jì)算結(jié)果、用戶人群計(jì)算結(jié)果、用戶特征庫(kù)計(jì)算結(jié)果。
?MySQL:存儲(chǔ)標(biāo)簽元數(shù)據(jù),監(jiān)控相關(guān)數(shù)據(jù),導(dǎo)出到業(yè)務(wù)系統(tǒng)的數(shù)據(jù)。
?HBase:存儲(chǔ)線上接口實(shí)時(shí)調(diào)用類數(shù)據(jù)。
?Elasticserch:支持海量數(shù)據(jù)的實(shí)時(shí)查詢分析,用于存儲(chǔ)用戶人群計(jì)算、用戶群透視分析所需的用戶標(biāo)簽數(shù)據(jù)(由于用戶人群計(jì)算、用戶群透視分析的條件轉(zhuǎn)化成的SQL語(yǔ)句多條件嵌套較為復(fù)雜,使用Impala執(zhí)行也需花費(fèi)大量時(shí)間)。
用戶標(biāo)簽數(shù)據(jù)在Hive中加工完成后,部分標(biāo)簽通過(guò)Sqoop同步到MySQL數(shù)據(jù)庫(kù),提供用于BI報(bào)表展示的數(shù)據(jù)、多維透視分析數(shù)據(jù)、圈人服務(wù)數(shù)據(jù);另一部分標(biāo)簽同步到HBase數(shù)據(jù)庫(kù)用于產(chǎn)品的線上個(gè)性化推薦。
1.3 主要覆蓋模塊
搭建一套用戶畫像方案整體來(lái)說(shuō)需要考慮8個(gè)模塊的建設(shè),如圖1-5所示。

1.4 開發(fā)階段流程
1.4.1 開發(fā)上線流程
用戶畫像建設(shè)項(xiàng)目流程,如圖1-6所示。

1.4.2 各階段關(guān)鍵產(chǎn)出
表1-1 用戶畫像項(xiàng)目各階段關(guān)鍵產(chǎn)出

?標(biāo)簽開發(fā):根據(jù)業(yè)務(wù)需求和應(yīng)用場(chǎng)景梳理標(biāo)簽指標(biāo)體系,調(diào)研業(yè)務(wù)上定義的數(shù)據(jù)口徑,確認(rèn)數(shù)據(jù)來(lái)源,開發(fā)相應(yīng)的標(biāo)簽。標(biāo)簽開發(fā)在整個(gè)畫像項(xiàng)目周期中占有較大比重。
?ETL調(diào)度開發(fā):梳理需要調(diào)度的各任務(wù)之間的依賴關(guān)系,開發(fā)調(diào)度腳本及調(diào)度監(jiān)控告警腳本,上線調(diào)度系統(tǒng)。
?打通服務(wù)層接口:為了讓畫像數(shù)據(jù)走出數(shù)據(jù)倉(cāng)庫(kù),應(yīng)用到用戶身上,需要打通數(shù)據(jù)倉(cāng)庫(kù)和各業(yè)務(wù)系統(tǒng)的接口。
?畫像產(chǎn)品化:需要產(chǎn)品經(jīng)理與業(yè)務(wù)人員、技術(shù)開發(fā)人員一起對(duì)接業(yè)務(wù)需求點(diǎn)和產(chǎn)品功能實(shí)現(xiàn)形式,畫產(chǎn)品原型,確定工作排期。Java Web端開發(fā)完成后,需要數(shù)據(jù)開發(fā)人員向?qū)?yīng)的庫(kù)表中灌入數(shù)據(jù)。
?開發(fā)調(diào)優(yōu):在畫像的數(shù)據(jù)和產(chǎn)品端搭建好架構(gòu)、能提供穩(wěn)定服務(wù)的基礎(chǔ)上,為了讓調(diào)度任務(wù)執(zhí)行起來(lái)更加高效、提供服務(wù)更加穩(wěn)健,需要對(duì)標(biāo)簽計(jì)算腳本、調(diào)度腳本、數(shù)據(jù)同步腳本等相關(guān)計(jì)算任務(wù)進(jìn)行重構(gòu)優(yōu)化。
?面向業(yè)務(wù)方推廣應(yīng)用:用戶畫像最終的價(jià)值產(chǎn)出點(diǎn)是業(yè)務(wù)方應(yīng)用畫像數(shù)據(jù)進(jìn)行用戶分析,多渠道觸達(dá)運(yùn)營(yíng)用戶,分析ROI,提升用戶活躍度或營(yíng)收。因此,面向業(yè)務(wù)人員推廣畫像系統(tǒng)的使用方式、提供針對(duì)具體業(yè)務(wù)場(chǎng)景的解決方案顯得尤為重要。在該階段,相關(guān)人員需要撰寫畫像的使用文檔,提供業(yè)務(wù)支持。
1.5 畫像應(yīng)用的落地
畫像開發(fā)過(guò)程中,還需要開發(fā)人員組織數(shù)據(jù)分析、運(yùn)營(yíng)、客服等團(tuán)隊(duì)的人員進(jìn)行畫像應(yīng)用上的推廣。對(duì)于數(shù)據(jù)分析人員來(lái)說(shuō),可能會(huì)關(guān)注用戶畫像開發(fā)了哪些表、哪些字段以及字段的口徑定義;對(duì)運(yùn)營(yíng)、客服等業(yè)務(wù)人員來(lái)說(shuō),可能更關(guān)注用戶標(biāo)簽定義的口徑,如何在Web端使用畫像產(chǎn)品進(jìn)行分析、圈定用戶進(jìn)行定向營(yíng)銷,以及應(yīng)用在業(yè)務(wù)上數(shù)據(jù)的準(zhǔn)確性和及時(shí)性。
1.6 某用戶畫像案例
1.6.1 案例背景介紹
某圖書電商網(wǎng)站擁有超過(guò)千萬(wàn)的網(wǎng)購(gòu)用戶群體,所售各品類圖書100余萬(wàn)種。用戶在平臺(tái)上可進(jìn)行瀏覽、搜索、收藏、下單、購(gòu)買等行為。商城的運(yùn)營(yíng)需要解決兩個(gè)問(wèn)題:一方面在企業(yè)產(chǎn)品線逐漸擴(kuò)張、信息資源過(guò)載的背景下,如何在兼顧自身商業(yè)目標(biāo)的同時(shí)更好地滿足消費(fèi)者的需求,為用戶帶來(lái)更個(gè)性化的購(gòu)物體驗(yàn),通過(guò)內(nèi)容的精準(zhǔn)推薦,更好地提高用戶的點(diǎn)擊轉(zhuǎn)化率;另一方面在用戶規(guī)模不斷增長(zhǎng)的背景下,運(yùn)營(yíng)方考慮建立用戶流失預(yù)警機(jī)制,及時(shí)識(shí)別將要流失的用戶群體,采取運(yùn)營(yíng)措施挽回用戶。商城自建立以來(lái),數(shù)據(jù)倉(cāng)庫(kù)中積累著大量的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)及埋點(diǎn)數(shù)據(jù)。如何充分挖掘沉淀在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)的價(jià)值,有效支持用戶畫像的建設(shè),成為當(dāng)前的重要工作。
1.6.2 相關(guān)元數(shù)據(jù)
在本案例中,可以獲取的數(shù)據(jù)按其類型分為:業(yè)務(wù)類數(shù)據(jù)和用戶行為數(shù)據(jù)。其中業(yè)務(wù)類數(shù)據(jù)是指用戶在平臺(tái)上下單、購(gòu)買、收藏物品、貨物配送等與業(yè)務(wù)相關(guān)的數(shù)據(jù);用戶行為數(shù)據(jù)是指用戶搜索某條信息、訪問(wèn)某個(gè)頁(yè)面、點(diǎn)擊某個(gè)按鈕、提交某個(gè)表單等通過(guò)操作行為產(chǎn)生(在解析日志的埋點(diǎn)表中)的數(shù)據(jù)。
涉及數(shù)據(jù)倉(cāng)庫(kù)中的表主要包括用戶信息表、商品訂單表、圖書信息表、圖書類目表、App端日志表、Web端日志表、商品評(píng)論表等。下面就用戶畫像建模過(guò)程中會(huì)用到的一些數(shù)據(jù)表做詳細(xì)介紹。
1.用戶信息表
用戶信息表(見表1-2)存放有關(guān)用戶的各種信息,如用戶姓名、年齡、性別、電話號(hào)碼、歸屬地等信息。

2.商品訂單表
商品訂單表(見表1-3)存放商品訂單的各類信息,包括訂單編號(hào)、用戶id、用戶姓名、訂單生成時(shí)間、訂單狀態(tài)等信息。

3.埋點(diǎn)日志表
埋點(diǎn)日志表(見表1-4)存放用戶訪問(wèn)App時(shí)點(diǎn)擊相關(guān)控件的打點(diǎn)記錄。通過(guò)在客戶端做埋點(diǎn),從日志數(shù)據(jù)中解析出來(lái)。

4.訪問(wèn)日志表
訪問(wèn)日志表(見表1-5)存放用戶訪問(wèn)App的相關(guān)信息及用戶的LBS相關(guān)信息,通過(guò)在客戶端埋點(diǎn),從日志數(shù)據(jù)中解析出來(lái)。

5.商品評(píng)論表
商品評(píng)論表(見表1-6)存放用戶對(duì)商品的評(píng)論信息。

6.搜索日志表
搜索日志表(見表1-7)存放用戶在App端搜索相關(guān)的日志數(shù)據(jù)。

7.用戶收藏表
用戶收藏表(見表1-8)記錄用戶收藏圖書的數(shù)據(jù)。

8.購(gòu)物車信息表
購(gòu)物車信息表(見表1-9)記錄用戶將圖書加入購(gòu)物車的數(shù)據(jù)。

1.6.3 畫像表結(jié)構(gòu)設(shè)計(jì)
不同業(yè)務(wù)背景有不同的設(shè)計(jì)方式,這里提供兩種設(shè)計(jì)思路:一是每日全量數(shù)據(jù)的表結(jié)構(gòu);二是每日增量數(shù)據(jù)的表結(jié)構(gòu)。
1.日全量數(shù)據(jù)
日全量數(shù)據(jù)表中,在每天對(duì)應(yīng)的日期分區(qū)中插入截止到當(dāng)天為止的全量數(shù)據(jù),用戶進(jìn)行查詢時(shí),只需查詢最近一天的數(shù)據(jù)即可獲得最新全量數(shù)據(jù)。下面以一個(gè)具體的日全量表結(jié)構(gòu)的例子來(lái)進(jìn)行說(shuō)明。

Hive語(yǔ)法說(shuō)明
(1)在Hive 中進(jìn)行查詢的時(shí)候 Select 語(yǔ)句 查詢一般會(huì)掃描整個(gè)表內(nèi)容,會(huì)消耗很多時(shí)間去掃描一些不需要的字段。有時(shí)候我們只需要掃描表中關(guān)心的一部分?jǐn)?shù)據(jù),因此建表時(shí)引入了partition概念。 分區(qū)表指的是在創(chuàng)建表時(shí)指定的partition的分區(qū)空間。 如果需要?jiǎng)?chuàng)建有分區(qū)的表,需要在create表的時(shí)候調(diào)用可選參數(shù)partitioned by,詳見表創(chuàng)建的語(yǔ)法結(jié)構(gòu)。 (2)分區(qū)的實(shí)現(xiàn)
- 一個(gè)表可以擁有一個(gè)或者多個(gè)分區(qū),每個(gè)分區(qū)以文件夾的形式單獨(dú)存在表文件夾的目錄下。 2.表和列名不區(qū)分大小寫。 3.分區(qū)是以字段的形式在表結(jié)構(gòu)中存在,通過(guò)describe table命令可以查看到字段存在,但是該字段不存放實(shí)際的數(shù)據(jù)內(nèi)容,僅僅是分區(qū)的表示。 4.建表的語(yǔ)法(建分區(qū)可參見PARTITIONED BY參數(shù)):
CREATE [EXTERNAL]
TABLE
[IF NOT EXISTS] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...)
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]
- 分區(qū)建表分為2種,一種是單分區(qū),也就是說(shuō)在表文件夾目錄下只有一級(jí)文件夾目錄。另外一種是多分區(qū),表文件夾下出現(xiàn)多文件夾嵌套模式。 5.1 單分區(qū)建表語(yǔ)句:create table day_table (id int, content string) partitioned by (dt string);單分區(qū)表,按天分區(qū),在表結(jié)構(gòu)中存在id,content,dt三列。 5.2 雙分區(qū)建表語(yǔ)句:create table day_hour_table (id int, content string) partitioned by (dt string, hour string);雙分區(qū)表,按天和小時(shí)分區(qū),在表結(jié)構(gòu)中新增加了dt和hour兩列。
(3) 內(nèi)部表與外部表的 區(qū)別
1.創(chuàng)建外部表需要添加 external 字段。而內(nèi)部表不需要
2.外部表刪除表時(shí),HDFS中的數(shù)據(jù)文件不會(huì)一起被刪除。而內(nèi)部表刪除表時(shí),表數(shù)據(jù)及HDFS中的數(shù)據(jù)文件都會(huì)被刪除。
日全量表格說(shuō)明
這里userid表示用戶id,labelweight表示標(biāo)簽權(quán)重,theme表示標(biāo)簽歸屬的二級(jí)主題,labelid表示一個(gè)標(biāo)簽id。通過(guò)“日期+標(biāo)簽歸屬的二級(jí)主題+標(biāo)簽id”的方式進(jìn)行分區(qū),設(shè)置三個(gè)分區(qū)字段更便于開發(fā)和查詢數(shù)據(jù)。該表結(jié)構(gòu)下的標(biāo)簽權(quán)重僅考慮統(tǒng)計(jì)類型標(biāo)簽的權(quán)重,如:歷史購(gòu)買金額標(biāo)簽對(duì)應(yīng)的權(quán)重為金額數(shù)量,用戶近30日訪問(wèn)天數(shù)為對(duì)應(yīng)的天數(shù),該權(quán)重值的計(jì)算未考慮較為復(fù)雜的用戶行為次數(shù)、行為類型、行為距今時(shí)間等復(fù)雜情況。
通過(guò)表名末尾追加“_all”的規(guī)范化命名形式,可直觀看出這是一張日全量表。
2.日增量數(shù)據(jù)
日增量數(shù)據(jù)表,即在每天的日期分區(qū)中插入當(dāng)天業(yè)務(wù)運(yùn)行產(chǎn)生的數(shù)據(jù),用戶進(jìn)行查詢時(shí)通過(guò)限制查詢的日期范圍,就可以找出在特定時(shí)間范圍內(nèi)被打上特定標(biāo)簽的用戶。下面以一個(gè)具體的日增量表結(jié)構(gòu)的例子來(lái)說(shuō)明。

這里,labelid表示標(biāo)簽名稱;cookieid表示用戶id;act_cnt表示用戶當(dāng)日行為次數(shù),如用戶當(dāng)日瀏覽某三級(jí)品類商品3次,則打上次數(shù)為3;tag_type_id為標(biāo)簽類型,如母嬰、3C、數(shù)碼等不同類型;act_type_id表示行為類型,如瀏覽、搜索、收藏、下單等行為。分區(qū)方式為按日期分區(qū),插入當(dāng)日數(shù)據(jù)。
通過(guò)表名末尾追加“_append”的規(guī)范化命名形式,可直觀看出這是一張日增量表。
例如,某用戶在“20180701”日瀏覽某3C電子商品4次(act_cnt),即給該用戶(userid)打上商品對(duì)應(yīng)的三級(jí)品類標(biāo)簽(tagid),標(biāo)簽類型(tag_type_id)為3C電子商品,行為類型(act_type_id)為瀏覽。這里可以通過(guò)對(duì)標(biāo)簽類型和行為類型兩個(gè)字段配置維度表的方式,對(duì)數(shù)據(jù)進(jìn)行管理。例如對(duì)于行為類型(act_type_id)字段,可以設(shè)定1為購(gòu)買行為、2為瀏覽行為、3為收藏行為等,在行為標(biāo)簽表中以數(shù)值定義用戶行為類型,在維度表中維護(hù)每個(gè)數(shù)值對(duì)應(yīng)的具體含義。
該日增量數(shù)據(jù)表可視為ODS層用戶行為標(biāo)簽明細(xì)。在查詢過(guò)程中,例如對(duì)于某用戶id為001的用戶,查詢其在“20180701”日到“20180707”日被打上的標(biāo)簽,可通過(guò)命令:select*from dw.userprofile_act_feature_append whereuserid='001'and data_date>='20180701'and data_date<='20180707'查詢。該日增量的表結(jié)構(gòu)記錄了用戶每天的行為帶來(lái)的標(biāo)簽,但未計(jì)算打在用戶身上標(biāo)簽的權(quán)重,計(jì)算權(quán)重時(shí)還需做進(jìn)一步建模加工。標(biāo)簽權(quán)重算法詳見4.6節(jié)的內(nèi)容。
3.關(guān)于寬表設(shè)計(jì)
用戶畫像表結(jié)構(gòu)如何設(shè)計(jì),沒有一定要遵循的固定的格式,符合業(yè)務(wù)需要、能滿足應(yīng)用即可。下面通過(guò)兩個(gè)寬表設(shè)計(jì)的案例,提供另一種解決方案的思路。用戶屬性寬表設(shè)計(jì)(見表1-10),主要記錄用戶基本屬性信息。

用戶日活躍寬表設(shè)計(jì)(見表1-11),主要記錄用戶每天訪問(wèn)的信息。

1.7 定性類畫像
度外,定性刻畫也是常見手段。定性類畫像多見于用戶研究等運(yùn)營(yíng)類崗位,通過(guò)電話調(diào)研、網(wǎng)絡(luò)調(diào)研問(wèn)卷、當(dāng)面深入訪談、網(wǎng)上第三方權(quán)威數(shù)據(jù)等方式收集用戶信息,幫助其理解用戶。
第2章 數(shù)據(jù)指標(biāo)體系
數(shù)據(jù)指標(biāo)體系是建立用戶畫像的關(guān)鍵環(huán)節(jié),也是在標(biāo)簽開發(fā)前要進(jìn)行的工作,具體來(lái)說(shuō)就是需要結(jié)合企業(yè)的業(yè)務(wù)情況設(shè)定相關(guān)的指標(biāo)。
互聯(lián)網(wǎng)相關(guān)企業(yè)在建立用戶畫像時(shí)一般除了基于用戶維度(userid)建立一套用戶標(biāo)簽體系外,還會(huì)基于用戶使用設(shè)備維度(cookieid)建立相應(yīng)的標(biāo)簽體系?;赾ookieid維度的標(biāo)簽應(yīng)用也很容易理解,當(dāng)用戶沒有登錄賬戶而訪問(wèn)設(shè)備時(shí),也可以基于用戶在設(shè)備上的行為對(duì)該設(shè)備推送相關(guān)的廣告、產(chǎn)品和服務(wù)。
建立的用戶標(biāo)簽按標(biāo)簽類型可以分為統(tǒng)計(jì)類、規(guī)則類和機(jī)器學(xué)習(xí)挖掘類,相關(guān)內(nèi)容在1.1.2節(jié)中有詳細(xì)介紹。從建立的標(biāo)簽維度來(lái)看,可以將其分為用戶屬性類、用戶行為類、用戶消費(fèi)類和風(fēng)險(xiǎn)控制類等常見類型。下面詳細(xì)介紹用戶標(biāo)簽體系的構(gòu)成及應(yīng)用場(chǎng)景。
2.1 用戶屬性維度
2.1.1 常見用戶屬性
用戶屬性是刻畫用戶的基礎(chǔ)。常見用戶屬性指標(biāo)包括:用戶的年齡、性別、安裝時(shí)間、注冊(cè)狀態(tài)、城市、省份、活躍登錄地、歷史購(gòu)買狀態(tài)、歷史購(gòu)買金額等。
用戶屬性維度的標(biāo)簽建成后可以提供客服電話服務(wù),為運(yùn)營(yíng)人員了解用戶基本情況提供幫助。用戶屬性標(biāo)簽包含統(tǒng)計(jì)類、規(guī)則類、機(jī)器學(xué)習(xí)挖掘類等類型。統(tǒng)計(jì)類標(biāo)簽的開發(fā)較為簡(jiǎn)單,機(jī)器學(xué)習(xí)挖掘類標(biāo)簽將在4.3節(jié)中通過(guò)具體案例進(jìn)行講解。本節(jié)主要介紹常見用戶屬性標(biāo)簽主要包括的維度。表2-1給出了常用的用戶屬性維度標(biāo)簽。

2.1.2 用戶性別
用戶性別可細(xì)分為自然性別和購(gòu)物性別兩種。自然性別是指用戶的實(shí)際性別,一般可通過(guò)用戶注冊(cè)信息、填寫調(diào)查問(wèn)卷表單等途徑獲得。該標(biāo)簽只需要從相應(yīng)的表中抽取數(shù)據(jù)即可,加工起來(lái)較為方便。用戶購(gòu)物性別是指用戶購(gòu)買物品時(shí)的性別取向。例如,一位實(shí)際性別為男性的用戶,可能經(jīng)常給妻子購(gòu)買女性的衣物、包等商品,那么這位用戶的購(gòu)物性別則是女性。
2.2 用戶行為維度
用戶行為是另一種刻畫用戶的常見維度,通過(guò)用戶行為可以挖掘其偏好和特征。常見用戶行為維度指標(biāo)(見表2-2)包括:用戶訂單相關(guān)行為、下單/訪問(wèn)行為、用戶近30天行為類型指標(biāo)、用戶高頻活躍時(shí)間段、用戶購(gòu)買品類、點(diǎn)擊偏好、營(yíng)銷敏感度等相關(guān)行為。

2.3 用戶消費(fèi)維度
對(duì)于用戶消費(fèi)維度指標(biāo)體系的建設(shè),可從用戶瀏覽、加購(gòu)、下單、收藏、搜索商品對(duì)應(yīng)的品類入手,品類越細(xì)越精確,給用戶推薦或營(yíng)銷商品的準(zhǔn)確性越高。如圖2-1所示,根據(jù)用戶相關(guān)行為對(duì)應(yīng)商品品類建設(shè)指標(biāo)體系,本案例精確到商品三級(jí)品類。
表2-3為用戶消費(fèi)維度的標(biāo)簽設(shè)計(jì)。

這里通過(guò)一個(gè)場(chǎng)景來(lái)介紹構(gòu)建用戶消費(fèi)維度的標(biāo)簽的應(yīng)用。某女裝大促活動(dòng)期間,渠道運(yùn)營(yíng)人員需要篩選出平臺(tái)上的優(yōu)質(zhì)用戶,并通過(guò)短信、郵件、Push等渠道進(jìn)行營(yíng)銷,可以通過(guò)圈選“瀏覽”“收藏”“加購(gòu)”“購(gòu)買”“搜索”與該女裝相關(guān)品類”的標(biāo)簽來(lái)篩選出可能對(duì)該女裝感興趣的潛在用戶,進(jìn)一步組合其他標(biāo)簽(如“性別”“消費(fèi)金額”“活躍度”等)篩選出對(duì)應(yīng)的高質(zhì)量用戶群,推送到對(duì)應(yīng)渠道。因此將商品品類抽象成標(biāo)簽后,可通過(guò)品類+行為的組合應(yīng)用方式找到目標(biāo)潛在用戶人群。
2.4 風(fēng)險(xiǎn)控制維度
互聯(lián)網(wǎng)企業(yè)的用戶可能會(huì)遇到薅羊毛、惡意刷單、借貸欺詐等行為的用戶,為了防止這類用戶給平臺(tái)帶來(lái)?yè)p失和風(fēng)險(xiǎn),互聯(lián)網(wǎng)公司需要在風(fēng)險(xiǎn)控制維度構(gòu)建起相關(guān)的指標(biāo)體系,有效監(jiān)控平臺(tái)的不良用戶。結(jié)合公司業(yè)務(wù)方向,例如可從賬號(hào)風(fēng)險(xiǎn)、設(shè)備風(fēng)險(xiǎn)、借貸風(fēng)險(xiǎn)等維度入手構(gòu)建風(fēng)控維度標(biāo)簽體系。下面詳細(xì)介紹一些常見的風(fēng)險(xiǎn)控制維度的標(biāo)簽示例,如表2-4所示。

2.5 社交屬性維度
社交屬性用于了解用戶的家庭成員、社交關(guān)系、社交偏好、社交活躍程度等方面,通過(guò)這些信息可以更好地為用戶提供個(gè)性化服務(wù)。表2-5是常用的社交屬性維度標(biāo)簽示例。

2.6 其他常見標(biāo)簽劃分方式
本章前5節(jié)從用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險(xiǎn)控制、社交屬性共五大維度劃分歸類了用戶標(biāo)簽指標(biāo)體系。但對(duì)用戶標(biāo)簽體系的歸類并不局限于此,通過(guò)應(yīng)用場(chǎng)景對(duì)標(biāo)簽進(jìn)行歸類也是常見的標(biāo)簽劃分方式。圖2-4展示了具體的畫像標(biāo)簽應(yīng)用場(chǎng)景劃分。

2.7 標(biāo)簽命名方式
無(wú)參考價(jià)值。
2.8 本章小結(jié)
本章主要介紹了如何結(jié)合業(yè)務(wù)場(chǎng)景去搭建刻畫用戶的數(shù)據(jù)指標(biāo)體系。其中2.1節(jié)到2.5節(jié)介紹了一種從用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險(xiǎn)控制和社交屬性5個(gè)維度建立用戶標(biāo)簽體系的思路,2.6節(jié)提供了一種基于應(yīng)用場(chǎng)景搭建指標(biāo)體系的思路。
本文為讀書筆記,更多精彩內(nèi)容請(qǐng)自行購(gòu)買書籍。