Deep Learning over Multi-field Categorical Data

ctr預(yù)估

ctr中傳統(tǒng)的FM,以神經(jīng)網(wǎng)絡(luò)的角度來(lái)看可以等效為下圖:


FM

對(duì)比FM公式來(lái)看,第一項(xiàng)為圖中最左邊常數(shù),第二項(xiàng)為每個(gè)field的權(quán)重,第三項(xiàng)為每?jī)蓚€(gè)field的交叉項(xiàng)權(quán)重且該權(quán)重可分解為兩個(gè)k階向量,相當(dāng)于各個(gè)field二階interaction的embedding。但顯然這個(gè)結(jié)構(gòu)與通常意義上的神經(jīng)網(wǎng)絡(luò)還是不一致的,所以作者提出了FNN,使得模型可以像神經(jīng)網(wǎng)絡(luò)一樣反向傳播訓(xùn)練。

FNN

FNN底層是一層多multifield embedding,其權(quán)重由FM預(yù)訓(xùn)練得到的各部分權(quán)重初始化。

細(xì)節(jié):采用交叉熵作為損失函數(shù),embedding層加l2正則或dropout,三層hidden選擇diamond型的size進(jìn)行tuning

overfit處理方法比較

總結(jié):
論文的核心其實(shí)就是embedding的初始化,剩下的部分就是一個(gè)基本的deep模型,通過(guò)成熟的FM分解算法初始化latent權(quán)重,總感覺(jué)有點(diǎn)殺牛用雞刀的感覺(jué);但從另一個(gè)角度考慮,大部分的神經(jīng)網(wǎng)絡(luò)模型對(duì)向量之間的處理都是采用加法操作,而FM 則是通過(guò)向量之間的乘法來(lái)衡量?jī)烧咧g的關(guān)系,乘法關(guān)系其實(shí)相當(dāng)于邏輯“且”的關(guān)系,但是加法僅相當(dāng)于邏輯中“或”的關(guān)系,顯然“且”比“或”更能嚴(yán)格區(qū)分目標(biāo)變量。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 改進(jìn)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法(下) 權(quán)重初始化 創(chuàng)建了神經(jīng)網(wǎng)絡(luò)后,我們需要進(jìn)行權(quán)重和偏差的初始化。到現(xiàn)在,我們一直是根據(jù)...
    nightwish夜愿閱讀 2,071評(píng)論 0 0
  • 改進(jìn)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法(上) 當(dāng)一個(gè)高爾夫球員剛開(kāi)始學(xué)習(xí)打高爾夫時(shí),他們通常會(huì)在揮桿的練習(xí)上花費(fèi)大多數(shù)時(shí)間。慢慢地...
    nightwish夜愿閱讀 3,192評(píng)論 2 8
  • 月亮像海洋 海洋托著月光 平靜又涌動(dòng) 剎那間 潮汐像是餓狼要疾吞世界 零點(diǎn)零一秒之內(nèi)的全面死亡 一轉(zhuǎn)眼 又靜的映照...
    靈犀Jing閱讀 800評(píng)論 0 0
  • 事實(shí)上糾結(jié)了很久到底要不要寫這篇年記。早早就想過(guò)用這樣的標(biāo)題來(lái)概括自己的2015年,大半的周末奔波于杭州和w兩個(gè)地...
    秦旅閱讀 379評(píng)論 1 1
  • LM5 大家好,一周已經(jīng)過(guò)去一大半了,這幾個(gè)晚上都很晚到家,家里人都睡著了,和寶貝只有早上的十分鐘不到的交流,還因...
    sophia夏閱讀 238評(píng)論 0 0

友情鏈接更多精彩內(nèi)容