一、推薦系統(tǒng)
二、阿里云智能推薦AIRec
三、用戶畫像介紹
四、用戶行為日志
1、用戶行為日志
用戶行為數(shù)據(jù)在系統(tǒng)上最簡單的存在形式就是日志。
用戶行為事件三要素:
? 操作(action):定義一個操作動作(如點擊、拖拽)
? 參數(shù)/屬性:參數(shù)可以是任何和這個事件相關(guān)的屬性,包括觸發(fā)這個事件的(人、時間、地點、設(shè)備、操作的業(yè)務(wù)信息)
? 屬性值:參數(shù)/屬性的值參
2、埋點方式比較
| 埋點方式 | 數(shù)據(jù)時效 | 數(shù)據(jù)可靠(安全) | 數(shù)據(jù)可回溯 | 埋點成本 | 對業(yè)務(wù)的影響 | 用戶流量開銷 | 新埋點是否對所有客戶端版本生效 |
|---|---|---|---|---|---|---|---|
| 傳統(tǒng)代碼埋點 | X | X | X | X | X | X | X |
| 可視化埋點 | X | X | X | X | √ | √ | √ |
| 無埋點 | X | X | X | √ | √ | √ | √ |
| Measurement Protocol | √ | √ | X | X | X | √ | X |
3、數(shù)據(jù)結(jié)構(gòu)
behavior表
| 字段名 | 字段類型 | 是否必需 | 字段含義 | 字段值枚舉 | 字段值說明 | 字段值示例 |
|---|---|---|---|---|---|---|
| item_id | string | 是 | 內(nèi)容ID | 用戶自填 | 如果全部數(shù)據(jù)均無法與內(nèi)容表匹配,服務(wù)無法啟動 | 34513 |
| item_type | string | 是 | 內(nèi)容的類型 | image | item_type | string |
| article | article | article | article | article | article | article |
| video | video | video | video | video | video | video |
| shortvideo | shortvideo | shortvideo | shortvideo | shortvideo | shortvideo | shortvideo |
| item | item | item | item | item | item | item |
| recipe | image | recipe | image | recipe | ||
| bhv_type | string | 是 | 行為類型,例如曝光、停留、點擊、收藏、下載等 | expose | bhv_type | string |
| click | 正利數(shù)據(jù)click的條數(shù)需要小于負利數(shù)據(jù)expose的條數(shù),否則系統(tǒng)會判斷數(shù)據(jù)異常,無法啟動服務(wù) | expose | click | 正利數(shù)據(jù)click的條數(shù)需要小于負利數(shù)據(jù)expose的條數(shù),否則系統(tǒng)會判斷數(shù)據(jù)異常,無法啟動服務(wù) | expose | click |
| bhv_value | string | 是 | 行為詳情,例如點擊次數(shù),停留時長,購買件數(shù)等 | 用戶自填 | 500 | |
| user_id | BIGINT | 是 | 用戶ID | 用戶自填 | 1234567 | |
| trace_id | string | 是 | 請求追蹤/埋點ID。用于在AB實驗時區(qū)分 調(diào)用了阿里推薦引擎 | Alibaba | trace_id | string |
| selfhold | 如果調(diào)用了阿里推薦引擎,該字段為Alibaba;如果沒有調(diào)用阿里推薦引擎,該字段可以置為selfhold | Alibaba | selfhold | 如果調(diào)用了阿里推薦引擎,該字段為Alibaba;如果沒有調(diào)用阿里推薦引擎,該字段可以置為selfhold | Alibaba | selfhold |
| trace_info | string | 推薦 | 請求埋點信息。一次推薦接口調(diào)用時會返回該信息,日志記錄時帶上即可 | 用戶自填 | 阿里流量必需 | 阿里流量必需 |
| platform | string | 推薦 | 客戶端平臺。 | 用戶自填 | ios/andriod/h5 | ios |
| imei | string | 推薦 | 用戶設(shè)備ID,imei,device_id,idfa | 用戶自填 | QLKDJSFALKDSAJLK | |
| app_version | string | 推薦 | app的版本號 | 用戶自填 | 4.1.10 | |
| net_type | string | 推薦 | 網(wǎng)絡(luò)型號 | 用戶自填 | 2G/3G/4G/WIFI | 4G |
| ip | string | 推薦 | 客戶端IP信息 | 用戶自填 | 234.45.13.14 | |
| login | string | 推薦 | 是否登錄用戶 | 0 | login | string |
| 1 | 0:未登錄 | 1 | 0:未登錄 | 1 | 0:未登錄 | 1 |
| 1:登錄 | 1 | 1:登錄 | 1 | 1:登錄 | 1 | 1:登錄 |
| report_src | string | 推薦 | 上報來源類型 | 1 | report_src | string |
| 2 | 1:服務(wù)端,2:客戶端。 | 2 | 2 | 1:服務(wù)端,2:客戶端。 | 2 | 2 |
| scene_id | string | 推薦 | 場景ID | 用戶自填 | 英文分號分隔的若干場景ID | 1001,1002 |
| bhv_time | string | 推薦 | 行為發(fā)生的時間戳,單位s | 用戶自填 | 1520327038 | |
| device_model | string | 推薦 | 設(shè)備型號 | 用戶自填 | iphoneX | |
| longitude | string | 推薦 | 位置經(jīng)度 | 用戶自填 | 128.4 | |
| latitude | string | 推薦 | 位置緯度 | 用戶自填 | 78.1 | |
| module_id | string | 推薦 | 模塊ID | 用戶自填 | 114 | |
| page_id | string | 推薦 | 頁面ID | 用戶自填 | 4 | |
| position | string | 推薦 | 內(nèi)容所在的位置信息 | 用戶自填 | 5 |
behavior type
| expose | 曝光 | expose | 曝光 |
|---|---|---|---|
| click | 點擊 | click | 點擊 |
| like | 點贊 | like | 點贊 |
| unlike | 踩 | unlike | 踩 |
| comment | 評論 | comment | 評論 |
| collect | 收藏 | collect | 收藏 |
| stay | 停留時長 | stay | 停留時長 |
| share | 分享 | share | 分享 |
| download | 下載 | download | 下載 |
| tip | 打賞 | tip | 打賞 |
| subscribe | 關(guān)注 | subscribe | 關(guān)注 |
4、埋點
? 服務(wù)端
除了『停留時長』之外,大部分用戶行為可以在服務(wù)端直接記錄,通過SDK直接提交用戶行為日志
? 客戶端
支持使用緩沖區(qū),通過API接口批量上傳用戶行為日志
5、存儲介質(zhì)
數(shù)據(jù)源可選擇的方案有OSS、LogHub、TableStore等,優(yōu)先考慮選擇使用OSS作為數(shù)據(jù)源(阿里云智能推薦系統(tǒng)相關(guān)服務(wù))。
目前阿里云智能推薦系統(tǒng)暫時只支持數(shù)據(jù)源為ODPS(MaxCompute),因此需要通過DI數(shù)據(jù)集成投遞到MaxCompute中,未來智能推薦支持OSS等數(shù)據(jù)源后,可移除此部分多余動作。
6、總體架構(gòu)圖

用戶行為日志存儲系統(tǒng).png
附:參考文章
用戶行為的深度追蹤——事件與埋點
日志采集與用戶行為鏈路分析
SPM 超級位置模型
淘寶SPM解讀