深度推薦系統(tǒng)與CTR預估2019年上半年值得精讀的論文

1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google

作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;

論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;

位列首位的當屬Youtube推薦強化學習的兩篇論文。雖然強化學習目前在推薦系統(tǒng)和CTR預估領域工業(yè)界由于系統(tǒng)復雜、效果未有顯著提升等眾所周知的原因確實不夠成熟也尚未大規(guī)模應用起來。但是Youtube推薦的這兩篇論文從某種程度上讓強化學習的應用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實驗效果顯示這個是YouTube單個項目近兩年來最大的reward增長,也從某種程度上會激發(fā)各大公司的研究者們繼續(xù)跟進的興趣。

這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應用在動作空間數(shù)以百萬計的Youtube在線推薦系統(tǒng)中。

2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google

作者:Eugene Ie, Vihan Jain, Jing Wang, ..., Jim McFadden, Tushar Chandra, Craig Boutilier;

論文:t.cn/AiKFHvYU;

這是Youtube推薦應用強化學習的第二彈,主要貢獻是提出了一種名為SLATEQ的Q-Learning算法,優(yōu)化推薦系統(tǒng)里面同時展示給用戶多個item情況的長期收益LTV(Long-term Value),將長期收益加入排序多目標中進行建模優(yōu)化。重點在于與baseline使用的深度網(wǎng)絡和輸入特征都完全一樣。詳見:Youtube推薦已經(jīng)上線RL了,強化學習在推薦廣告工業(yè)界大規(guī)模應用還遠嗎?

3. Deep Learning Recommendation Model for Personalization and Recommendation Systems

作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,..., Bill Jia, Liang Xiong, Misha Smelyanskiy;

論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;

FaceBook推薦最新論文,通過建模與系統(tǒng)協(xié)同設計提出一種butterfly-shuffle的機制來提升模型并行化,離線訓練上在沒有任何超參調(diào)優(yōu)下收斂速度與準確率優(yōu)于DCN,并開源了代碼。

4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei

作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;

論文:t.cn/AipAFS3p;

華為 at WWW 2019,提出基于卷積神經(jīng)網(wǎng)絡的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預估模型進行組合。

5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba

作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;

論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;

阿里 at KDD 2019,提出DSTN模型用于點擊率CTR預估,考慮更多空域與時域的輔助信息包括上下文展示過的ad以及歷史點擊/未點擊ad來更好地預測目標item的點擊率。從論文實驗數(shù)據(jù)看,效果大幅度超過DeepFM和GRU,并開源了代碼。

6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks

作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;

論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;

最新的深度CTR預估模型AutoInt,通過過Multi-head注意力機制將特征投射到多個子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過xDeepFM等達到最好。

7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent

作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin

論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;

騰訊 at KDD2019,微信看一看團隊對傳統(tǒng)Look-alike進行了改造,提出實時Look-alike算法RALM,解決推薦系統(tǒng)多樣性問題,效果好于YoutubeDNN。

8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems

作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;

論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;

還記得阿里 at KDD 2018的深度樹匹配召回模型TDM嗎?升級版JTM提出索引與模型同時優(yōu)化的方案,大幅提升召回效果。

9. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba

作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;

論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;

阿里 at IJCAI2019,考慮到不同用戶行為序列的session內(nèi)行為同構與session之間行為異構的特性提出了基于sesssion的CTR預估模型DSIN。使用self-attention機制抽取session內(nèi)用戶興趣,使用Bi-LSTM針對用戶跨session興趣進行建模。

10. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent

作者:Fuxing Hong, Dongbo Huang, Ge Chen;

論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;

騰訊 at AAAI2019,提出IFM通過特征以及特征組不同角度靈活學習特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來捕捉高階交互,效果優(yōu)于DeepFM并開源了代碼。

11. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall

作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, ..., Qiwei Chen, Wei Li, Dik Lun Lee

論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;

阿里天貓?zhí)岢鯩IND模型通過Dynamic Routing的方法從用戶行為和用戶屬性信息中動態(tài)學習出多個表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來提升召回的豐富度和準確度,效果好于YoutubeDNN。

12. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba

作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;

論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;

阿里 at IJCAI2019,提出DeepMCP模型通過匹配、關聯(lián)、預測三個子模塊更好地建模用戶-ad,ad之間以及特征-CTR關系,效果優(yōu)于DeepFM并開源了代碼。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容