EGES學習筆記

一種引入邊信息的變權(quán)重GES方法。

  • 建圖模塊采用networkx,session建立使用用戶自定義+deepwalk。
  • 適用場景,限于user行為較少,但商品冷啟動時,商品類別、價格等邊信息較豐富的場景,并不是所有場景都適用。
  • 一般場景(用戶行為并不特別少+商品類別信息模糊),建議W2V+deepwalk效果要優(yōu)于EGES。


    image.png

    算法的目的是生成商品的表示向量,對商品兩兩之間做點積,計算商品之間的相似度。對用戶有過行為的每個商品,召回一批最相似的商品,這個階段文章稱為matching,然后將這些商品送給第二個階段ranking做排序。


    image.png

邊信息引入

類別、價格、品牌,引入邊信息填補用戶行為不足無法建立有效訓練session的缺陷。
邊信息校驗,TSNE獲取主元,如果邊信息有效會呈現(xiàn)散點聚類的效果。


image.png

訓練環(huán)節(jié)與行為數(shù)據(jù)在同一向量空間上訓練。

建圖過程

采用用戶點擊、加購數(shù)據(jù),按照經(jīng)驗時間限定session,不宜過長。

emdedding加權(quán)

image.png

由不變權(quán)重改為變權(quán)重方式,每次更新權(quán)重參數(shù)


image.png

取e為了使權(quán)重非負。

deepwalk進行resession

image.png

先利用行為數(shù)據(jù)進行初步session劃分,然后利用加購頻次來定義變權(quán)重,構(gòu)建sku-sku的pair對。利用deepwalk獲取權(quán)重最大的session序列。

訓練環(huán)節(jié)

image.png

走skip-gram的方式,無全連接層。

線上使用

配合faiss進行相似度匹配

參考

原文鏈接 https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1803.02349.pdf
https://zhuanlan.zhihu.com/p/70198918

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容