色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<sup id="qqcqg"><dl id="qqcqg"></dl></sup>

<input id="qqcqg"><pre id="qqcqg"></pre></input>

<table id="qqcqg"><tr id="qqcqg"></tr></table>

<dfn id="qqcqg"></dfn>

登錄注冊寫文章

推薦系統(tǒng)遇上深度學習(六十八)-建模多任務學習中任務相關性的模型MMoE

文哥的學習日記

推薦系統(tǒng)遇上深度學習(六十八)-建模多任務學習中任務相關性的模型MMoE

本文介紹的論文題目是：《Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts》
論文下載地址為：https://dl.acm.org/citation.cfm?id=3220007

多任務學習最近越來越受歡迎，咱們前面也介紹過幾篇阿里多任務學習的模型，不過多任務學習的效果受不同任務之間的相關性影響較大，因此本文基于Mixture-of-Experts (MoE)模型，提出了一種顯式建模任務相關性的模型Multi-gate Mixture-of-Experts (MMoE) ，一起來學習一下。

1、背景

近年來，深度神經網絡的應用越來越廣，如推薦系統(tǒng)。推薦系統(tǒng)通常需要同時優(yōu)化多個目標，如電影推薦中不僅需要預測用戶是否會購買，還需要預測用戶對于電影的評分，在比如電商領域同時需要預測物品的點擊率CTR和轉化率CVR。因此，多任務學習模型成為研究領域的一大熱點。

許多多任務學習模型取得了不錯的效果，但是實踐中多任務學習模型并不總比單任務模型效果更突出。這主要是因為不同任務之間的相關性低（如數據的分布不同等等）導致的。

是不是真的如上述所說，任務之間的相關性會影響多任務學習的效果呢，咱們先在第二節(jié)中做一個實驗。

2、任務相關性實驗

2.1 一般的多任務學習模型框架

一般的多任務學習模型框架如下：

對于不同的任務，底層的參數和網絡結構是共享的，然后上層經過不同的神經網絡得到對應任務的輸出。假設底層輸出是f(x)，那么第k個任務的輸出y_k為：

其中h^k是第k個任務上層神經網絡的參數。

2.2 任務相關性實驗

接下來，我們通過一個實驗來探討任務相關性和多任務學習效果的關系。

假設模型中包含兩個回歸任務，而數據通過采樣生成，并且規(guī)定輸入相同，輸出label不同。那么任務的相關性就使用label之間的皮爾遜相關系數來表示，相關系數越大，表示任務之間越相關，數據生成的過程如下：

首先，生成了兩個垂直的單位向量u₁和u₂，并根據兩個單位向量生成了模型的系數w₁和w₂，如上圖中的第二步。w₁和w₂之間的cosine距離即為p，大伙可以根據cosine的計算公式得到。

隨后基于正態(tài)分布的到輸入數據x，而y根據下面的兩個式子的到：

注意，這里x和y之間并非線性的關系，因為模型的第二步是多個sin函數，因此label之間的皮爾遜相關系數和參數w₁和w₂之間的cosine距離并不相等，但是呈現(xiàn)出一個正相關的關系，如下圖：

因此，本文中使用參數的cosine距離來近似表示任務之間的相關性。

2.3 實驗結果

基于上述數據生成過程以及任務相關性的表示方法，分別測試任務相關性在0.5、0.9和1時的多任務學習模型的效果，如下圖：

可以看到的是，隨著任務相關性的提升，模型的loss越小，效果越好，從而印證了前面的猜想。

3、MMoE模型

3.1 MoE模型

先來看一下Mixture-of-Experts (MoE)模型（文中后面稱作 One-gate Mixture-of-Experts (OMoE)），如下圖所示：

可以看到，相較于一般的多任務學習框架，共享的底層分為了多個expert，同時設置了一個Gate，使不同的數據可以多樣化的使用共享層。此時共享層的輸出可以表示為：

其中f_i代表第i個expert的輸出，g_i代表第第i個expert對應的權重，是基于輸入數據得到的，計算公式為g(x) = softmax(W_gx)。

3.2 MMoE模型

相較于MoE模型，Multi-gate Mixture-of-Experts (MMoE)模型為每一個task設置了一個gate，使不同的任務和不同的數據可以多樣化的使用共享層，模型結構如下：

此時每個任務的共享層的輸出不同，第k個任務的共享層輸出計算公式如下：

隨后每個任務對應的共享層輸出，經過多層全連接神經網絡得到每個任務的輸出：

從直觀上考慮，如果兩個任務并不十分相關，那么經過Gate之后，二者得到的權重系數會差別比較大，從而可以利用部分expert網絡輸出的信息，近似于多個單任務學習模型。如果兩個任務緊密相關，那么經過Gate得到的權重分布應該相差不多，類似于一般的多任務學習框架。

4、實驗結果

先回顧上面介紹的三種多任務學習的架構：

實驗分為三部分：人工合成數據集（即本文第二部分所介紹的人工生成的數據集）、UCI census-income dataset和Large-scale Content Recommendation

4.1 人工合成數據集-實驗結果

4.2 UCI census-income dataset-實驗結果

這塊文中介紹了幾種多任務學習的模式，這里就不過多介紹了。

4.3 Large-scale Content Recommendation-實驗結果

這篇論文的介紹就到這里啦，這一篇是在我閱讀youtube多任務學習論文中發(fā)現(xiàn)的，所以下一篇會介紹youtube今年的論文《Recommending What Video to Watch Next: A Multitask Ranking System》，期待一下吧。

可能我的理解還有不到位的地方，歡迎大家一起討論對這篇文章的理解~

關注小編的公眾號“小小挖掘機”，后臺回復“進群”，一起來交流學習推薦系統(tǒng)吧！

最后編輯于：2020.09.30 19:51:44

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成，瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發(fā)布，文章內容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內容

推薦系統(tǒng)遇上深度學習(六十六)-[阿里]基于多任務學習的CVR預估模型ESM2
今天介紹的文章名稱是《Conversion Rate Prediction via Post-Click Beha...
文哥的學習日記閱讀 5,329評論 1贊 9
推薦系統(tǒng)遇上深度學習(三十七)--基于多任務學習的可解釋性推薦系統(tǒng)
論文名稱：《Why I like it: Multi-task Learning for Recommendati...
文哥的學習日記閱讀 4,884評論 2贊 33

老J講師培訓干貨（002）講師自我介紹
講師自我介紹，是講師在課程前曖場破冰的重要環(huán)節(jié)，可以說非常非常重要，因為學員對講師的第一印象，將直接影響整個課程的...
萬能的老J閱讀 3,484評論 6贊 11
天使在人間
和妮薩老師相遇在晨光里的森林，一身白衣宛如林中仙子，輕盈，通透，又有溫度。你帶著我去看、去聽、去聞、去分享、去深呼...
李星妮閱讀 393評論 0贊 0
電商相關視頻課程資源
網易微課堂/電商數據分析網易電商數據分析實戰(zhàn)攻略聯(lián)系作者獲取視頻《電商設計手冊》
phperstar閱讀 411評論 0贊 0

友情鏈接更多精彩內容

16贊17贊

贊賞

手機看全文

新闻| 常山县| 西乌珠穆沁旗| 萨迦县| 崇信县| 温泉县| 天等县| 锡林浩特市| 荔浦县| 苍南县| 东源县| 辽源市| 镇赉县| 昭通市| 鄂托克前旗| 西昌市| 宣城市| 瑞安市| 平潭县| 桐柏县| 工布江达县| 凌云县| 石首市| 米易县| 宕昌县| 寿光市| 莎车县| 永新县| 梨树县| 梁河县| 遂溪县| 鹿邑县| 鄂伦春自治旗| 苏尼特左旗| 德格县| 延吉市| 久治县| 福海县| 石楼县| 佛教| 英超|

<dfn id="8eiqq"></dfn>