7M推薦系統(tǒng) - S2 內(nèi)部推薦和排序架構(gòu)

1 召回算法和業(yè)界最佳實踐進階

各種Embedding方法
各種k-means方法kdtree和kball樹

2 用戶建模(召回、排序都會用到)

預(yù)測用戶下一個瀏覽或者購買的類目,性別預(yù)測,年齡預(yù)測等。

3 用戶特征和Item特征的常用方法

Wrappers:一個一個試
Embedded:加入正則
Filters:feature-label相關(guān)性

  • 連續(xù)型特征離散二值化
    離散化:等寬分桶(按值分),均勻分桶(按樣本數(shù)分),k-means
    二值化:要么該特征one-hot,或者three-hot
  • 過程
    特征預(yù)排序通過信息增益IG,添加特征,細篩選特征
  • 泛化和自解釋
    泛化是歷史記錄沒有的
    自解釋是有歷史記錄的
  • 四種類型
    數(shù)值
    類別
    時間
    文本

4 主流技術(shù)方向思考及相應(yīng)model的改進方案

講了一遍冷啟動

講了這三個算法

推薦流程概念 33:40

  • 核心指標(biāo)
    GMV:一定時間內(nèi)的商品成交總額
    QPS
    RT:系統(tǒng)響應(yīng) < 0.1s
    優(yōu)化排序:讓模型參數(shù)減少,層數(shù)減少,但是效果會降低,是tradeoff
    推薦和搜索有什么關(guān)系?
    1.推薦做的好,搜索的流量下降
    2.搜索這個工具是必要的
    推薦做的好 -> 用戶粘性,用戶留存 -> DAU GMV
    (短視頻/電影)推薦系統(tǒng)和電商推薦系統(tǒng)相比,區(qū)別是什么?
    視頻推薦多看重時長,電商推薦看是否購買
    量級的不同,存儲方式,計算量,算法都不同
  • 核心業(yè)務(wù)
    首猜:首頁猜你喜歡
    詳情頁(相關(guān)推薦,播放頁,關(guān)燈頁)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容