前言
-
ACL2020的一篇長文,主要介紹基于匹配思想進行新聞推薦改進的工作
該團隊相關(guān)工作詳見個人專題《新聞推薦研究》
-
背景/問題:
- 新聞推薦的核心是用戶興趣與候選新聞的匹配問題(matching)
- 重要的新聞?wù)Z義特征也隱含在不同粒度(granularity)的文本段落中。
- 當前研究把用戶表征成單一向量與候選新聞進行匹配,可能損失很多推薦的細粒度特征
-
主要工作/關(guān)鍵創(chuàng)新:
- 表征方面:提出多層級的用戶/新聞表征,使用層級擴張卷積來構(gòu)建表征(hierarchical dilated convolutions)
- 匹配方面:提出細粒度的興趣匹配機制(Fine-grained Interest Matching),在多層表征的基礎(chǔ)上構(gòu)建不同粒度的文本段(特征)相似度矩陣,得到多通道的匹配度矩陣,使用3D-conv來提取高階重要特征來預測用戶和新聞的匹配程度(點擊概率)
模型

整體模型架構(gòu)如上所示
1. 新聞表征模塊



同時,計算路徑大大縮短,沒有使用池化等下采樣方法,降低了信息丟失的負面影響。在并行能力在減少內(nèi)存消耗方面優(yōu)于RNN和基于注意力的方法。
2. 交叉交互模塊 Cross Interation


最后將這些相似度矩陣組織成3D結(jié)構(gòu)的圖像Q,這個需要有點變換思想,相當于原來的矩陣合并到一起應該是n(L+1)N_dkN_c,文中按照圖片的組織形式進行展示,一張圖片為nN_dk*N_c的三維空間,同時圖片有多個通道(L+1)個:


然后通過多層3D卷積網(wǎng)絡(luò)來進行特征提?。?div id="u0z1t8os" class="image-package">







