推薦系統(tǒng)架構(gòu)-4 用戶行為日志

一、推薦系統(tǒng)

二、阿里云智能推薦AIRec

三、用戶畫像介紹

四、用戶行為日志

1、用戶行為日志

用戶行為數(shù)據(jù)在系統(tǒng)上最簡單的存在形式就是日志。
用戶行為事件三要素:
? 操作(action):定義一個操作動作(如點擊、拖拽)
? 參數(shù)/屬性:參數(shù)可以是任何和這個事件相關(guān)的屬性,包括觸發(fā)這個事件的(人、時間、地點、設(shè)備、操作的業(yè)務(wù)信息)
? 屬性值:參數(shù)/屬性的值參

2、埋點方式比較

埋點方式 數(shù)據(jù)時效 數(shù)據(jù)可靠(安全) 數(shù)據(jù)可回溯 埋點成本 對業(yè)務(wù)的影響 用戶流量開銷 新埋點是否對所有客戶端版本生效
傳統(tǒng)代碼埋點 X X X X X X X
可視化埋點 X X X X
無埋點 X X X
Measurement Protocol X X X X

3、數(shù)據(jù)結(jié)構(gòu)

behavior表

字段名 字段類型 是否必需 字段含義 字段值枚舉 字段值說明 字段值示例
item_id string 內(nèi)容ID 用戶自填 如果全部數(shù)據(jù)均無法與內(nèi)容表匹配,服務(wù)無法啟動 34513
item_type string 內(nèi)容的類型 image item_type string
article article article article article article article
video video video video video video video
shortvideo shortvideo shortvideo shortvideo shortvideo shortvideo shortvideo
item item item item item item item
recipe image recipe image recipe
bhv_type string 行為類型,例如曝光、停留、點擊、收藏、下載等 expose bhv_type string
click 正利數(shù)據(jù)click的條數(shù)需要小于負利數(shù)據(jù)expose的條數(shù),否則系統(tǒng)會判斷數(shù)據(jù)異常,無法啟動服務(wù) expose click 正利數(shù)據(jù)click的條數(shù)需要小于負利數(shù)據(jù)expose的條數(shù),否則系統(tǒng)會判斷數(shù)據(jù)異常,無法啟動服務(wù) expose click
bhv_value string 行為詳情,例如點擊次數(shù),停留時長,購買件數(shù)等 用戶自填 500
user_id BIGINT 用戶ID 用戶自填 1234567
trace_id string 請求追蹤/埋點ID。用于在AB實驗時區(qū)分 調(diào)用了阿里推薦引擎 Alibaba trace_id string
selfhold 如果調(diào)用了阿里推薦引擎,該字段為Alibaba;如果沒有調(diào)用阿里推薦引擎,該字段可以置為selfhold Alibaba selfhold 如果調(diào)用了阿里推薦引擎,該字段為Alibaba;如果沒有調(diào)用阿里推薦引擎,該字段可以置為selfhold Alibaba selfhold
trace_info string 推薦 請求埋點信息。一次推薦接口調(diào)用時會返回該信息,日志記錄時帶上即可 用戶自填 阿里流量必需 阿里流量必需
platform string 推薦 客戶端平臺。 用戶自填 ios/andriod/h5 ios
imei string 推薦 用戶設(shè)備ID,imei,device_id,idfa 用戶自填 QLKDJSFALKDSAJLK
app_version string 推薦 app的版本號 用戶自填 4.1.10
net_type string 推薦 網(wǎng)絡(luò)型號 用戶自填 2G/3G/4G/WIFI 4G
ip string 推薦 客戶端IP信息 用戶自填 234.45.13.14
login string 推薦 是否登錄用戶 0 login string
1 0:未登錄 1 0:未登錄 1 0:未登錄 1
1:登錄 1 1:登錄 1 1:登錄 1 1:登錄
report_src string 推薦 上報來源類型 1 report_src string
2 1:服務(wù)端,2:客戶端。 2 2 1:服務(wù)端,2:客戶端。 2 2
scene_id string 推薦 場景ID 用戶自填 英文分號分隔的若干場景ID 1001,1002
bhv_time string 推薦 行為發(fā)生的時間戳,單位s 用戶自填 1520327038
device_model string 推薦 設(shè)備型號 用戶自填 iphoneX
longitude string 推薦 位置經(jīng)度 用戶自填 128.4
latitude string 推薦 位置緯度 用戶自填 78.1
module_id string 推薦 模塊ID 用戶自填 114
page_id string 推薦 頁面ID 用戶自填 4
position string 推薦 內(nèi)容所在的位置信息 用戶自填 5

behavior type

expose 曝光 expose 曝光
click 點擊 click 點擊
like 點贊 like 點贊
unlike unlike
comment 評論 comment 評論
collect 收藏 collect 收藏
stay 停留時長 stay 停留時長
share 分享 share 分享
download 下載 download 下載
tip 打賞 tip 打賞
subscribe 關(guān)注 subscribe 關(guān)注

4、埋點

? 服務(wù)端
除了『停留時長』之外,大部分用戶行為可以在服務(wù)端直接記錄,通過SDK直接提交用戶行為日志
? 客戶端
支持使用緩沖區(qū),通過API接口批量上傳用戶行為日志

5、存儲介質(zhì)

數(shù)據(jù)源可選擇的方案有OSS、LogHub、TableStore等,優(yōu)先考慮選擇使用OSS作為數(shù)據(jù)源(阿里云智能推薦系統(tǒng)相關(guān)服務(wù))。
目前阿里云智能推薦系統(tǒng)暫時只支持數(shù)據(jù)源為ODPS(MaxCompute),因此需要通過DI數(shù)據(jù)集成投遞到MaxCompute中,未來智能推薦支持OSS等數(shù)據(jù)源后,可移除此部分多余動作。

6、總體架構(gòu)圖

用戶行為日志存儲系統(tǒng).png

附:參考文章

用戶行為的深度追蹤——事件與埋點
日志采集與用戶行為鏈路分析
SPM 超級位置模型
淘寶SPM解讀

五、總體架構(gòu)設(shè)計

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容