一種引入邊信息的變權(quán)重GES方法。
- 建圖模塊采用networkx,session建立使用用戶自定義+deepwalk。
- 適用場景,限于user行為較少,但商品冷啟動時,商品類別、價格等邊信息較豐富的場景,并不是所有場景都適用。
-
一般場景(用戶行為并不特別少+商品類別信息模糊),建議W2V+deepwalk效果要優(yōu)于EGES。
image.png
算法的目的是生成商品的表示向量,對商品兩兩之間做點積,計算商品之間的相似度。對用戶有過行為的每個商品,召回一批最相似的商品,這個階段文章稱為matching,然后將這些商品送給第二個階段ranking做排序。
image.png
邊信息引入
類別、價格、品牌,引入邊信息填補用戶行為不足無法建立有效訓練session的缺陷。
邊信息校驗,TSNE獲取主元,如果邊信息有效會呈現(xiàn)散點聚類的效果。

image.png
訓練環(huán)節(jié)與行為數(shù)據(jù)在同一向量空間上訓練。
建圖過程
采用用戶點擊、加購數(shù)據(jù),按照經(jīng)驗時間限定session,不宜過長。
emdedding加權(quán)

image.png
由不變權(quán)重改為變權(quán)重方式,每次更新權(quán)重參數(shù)

image.png
取e為了使權(quán)重非負。
deepwalk進行resession

image.png
先利用行為數(shù)據(jù)進行初步session劃分,然后利用加購頻次來定義變權(quán)重,構(gòu)建sku-sku的pair對。利用deepwalk獲取權(quán)重最大的session序列。
訓練環(huán)節(jié)

image.png
走skip-gram的方式,無全連接層。
線上使用
配合faiss進行相似度匹配
參考
原文鏈接 https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1803.02349.pdf
https://zhuanlan.zhihu.com/p/70198918

