1 召回算法和業(yè)界最佳實踐進階
各種Embedding方法
各種k-means方法kdtree和kball樹
2 用戶建模(召回、排序都會用到)
預(yù)測用戶下一個瀏覽或者購買的類目,性別預(yù)測,年齡預(yù)測等。
3 用戶特征和Item特征的常用方法
Wrappers:一個一個試
Embedded:加入正則
Filters:feature-label相關(guān)性
- 連續(xù)型特征離散二值化
離散化:等寬分桶(按值分),均勻分桶(按樣本數(shù)分),k-means
二值化:要么該特征one-hot,或者three-hot - 過程
特征預(yù)排序通過信息增益IG,添加特征,細篩選特征 - 泛化和自解釋
泛化是歷史記錄沒有的
自解釋是有歷史記錄的 - 四種類型
數(shù)值
類別
時間
文本
4 主流技術(shù)方向思考及相應(yīng)model的改進方案
講了一遍冷啟動
講了這三個算法
推薦流程概念 33:40
- 核心指標(biāo)
GMV:一定時間內(nèi)的商品成交總額
QPS
RT:系統(tǒng)響應(yīng) < 0.1s
優(yōu)化排序:讓模型參數(shù)減少,層數(shù)減少,但是效果會降低,是tradeoff
推薦和搜索有什么關(guān)系?
1.推薦做的好,搜索的流量下降
2.搜索這個工具是必要的
推薦做的好 -> 用戶粘性,用戶留存 -> DAU GMV
(短視頻/電影)推薦系統(tǒng)和電商推薦系統(tǒng)相比,區(qū)別是什么?
視頻推薦多看重時長,電商推薦看是否購買
量級的不同,存儲方式,計算量,算法都不同 - 核心業(yè)務(wù)
首猜:首頁猜你喜歡
詳情頁(相關(guān)推薦,播放頁,關(guān)燈頁)