干貨整理_機器學習在推薦系統(tǒng)中的應(yīng)用_AI游學小分隊_20170922

9月20日,第四范式資深算法科學家@程曉澄 進行了一次直播分享《機器學習在推薦熊中的應(yīng)用》;下面,是個人的干貨總結(jié) ~

注:直播回看地址https://v.douyu.com/show/oERALvEn3Pn71Vw0

一、推薦系統(tǒng)的誕生土壤和早期演進

1、推薦系統(tǒng)的誕生土壤

1)長尾理論的興起:較長的尾部的受眾群體可能超過頭部

2)線下銷售的二八法則:80%的利潤來自20%的商品

3)互聯(lián)網(wǎng)發(fā)布門檻和成本降低后,網(wǎng)站的業(yè)務(wù)情況取決于長尾內(nèi)容的分發(fā)

2、什么是好的帖子:聰明才智+經(jīng)驗rank

1)產(chǎn)品經(jīng)理和運營人員提供個人經(jīng)驗(是否最近更新、引入?yún)^(qū)間和置信度進行評估)

2)通過公式衡量的rank(根據(jù)網(wǎng)站拓撲圖,和網(wǎng)站初始得分、收斂排名、跳出概率有關(guān)),作為當時衡量網(wǎng)站推廣水平的重要指標。

3、亞馬遜的協(xié)同過濾

1)用戶買過商品后,會有一定概率購買相似商品

(兩個商品的相似通過評分矩陣來刻畫;相似程度通過cos函數(shù)計算出來)

2)給用戶推薦他朋友們喜歡的商品類別

(通過喜好相似度不同的朋友做加權(quán)平均計算;用cos函數(shù)的歸一化解決打分標準不同的問題;peason系數(shù)去除打分本身的偏差)

4、經(jīng)驗評估和協(xié)同過濾的不足(需要有更豐富的假設(shè)并對用戶的正負反饋進行自我修正、自我選擇)

1)對用戶喜好的假設(shè)條件不一定成立

2)不一定適用于每個用戶和每一件商品item

3)每個item、category的權(quán)重和表達的信息含量可能不一樣

5、機器學習

1)f函數(shù)代表世界上的真理(未知的)可推斷出用戶的喜好

2)根據(jù)歷史數(shù)據(jù),有一個假設(shè)空間h,在算法A中搜索到最接近真理f的假設(shè)g

3)損失函數(shù)cost衡量g和f的接近程度

4)f函數(shù)可能代表點擊率、觀看時長、評分或其他量化體驗或營收的值

6、矩陣分解的推薦方式

1)y代表用戶對商品item的評分,根據(jù)u(用戶id)和i(item id)

2)通過用戶的喜好維度和商品自身的屬性計算出用戶的喜好程度

7、矩陣分解的局限

1)無法刻畫新用戶和新內(nèi)容

2)無法利用用戶的信息、內(nèi)容的特征(可從線下經(jīng)驗中學習)

8、為機器學習模型注入更多的特征

1)猜想空間不限于公式、興趣維度、rank方法(用戶信息、商品信息、當前上下文信息,歷史銷售記錄),每一種特征的權(quán)重由模型自己去學習

2)監(jiān)督學習成為廣告投放、搜索排序、電商內(nèi)容推薦領(lǐng)域的核心引擎

二、推薦系統(tǒng)當下的基本架構(gòu)

1、候選集召回

1)候選集內(nèi)容達到百億級甚至是千億級(商品、內(nèi)容、搜索結(jié)果),直接用模型計算時間成本比較高

2)初篩的方式:

-排序召回(最新、最熱、最近、最新光顧、各種經(jīng)驗上的評分公式)

-簡單模型、rank召回(item based/user based、矩陣分解)

-規(guī)則召回(天氣、近期搜索瀏覽、朋友的購買、同期過往習慣等)

3)通過A/B test找到更好的初篩方式

2、模型排序

1)排序考慮更多的因素(時間、季節(jié)、運營者信息、連接方式、行為序列、社交關(guān)系、歷史行為內(nèi)容序列、GPS坐標、IP地址)

2)先進的排序模型:Wide&Deep Models

觀看、收藏、購買、搜索序列(RNN)

圖片信息(CNN)、文字信息(word2vec)

一般用前一層的hidden layer去做決策,為了得到更好的結(jié)果會把模型的思考結(jié)果分得更細。

3、生成推薦結(jié)果

僅對結(jié)果做排序用戶無法滿足,需進一步優(yōu)化體驗:

1)多樣化

2)已知內(nèi)容和用戶可能不喜歡的新領(lǐng)域

3)準確性vs多樣性vs新穎性

三、搭建一個推薦系統(tǒng)

1、線上請求

1)選擇候選規(guī)則并過濾

2)通過模型獲取參數(shù)并計算

3)根據(jù)多樣化、去重規(guī)則生成推薦列表

4)內(nèi)容不夠展示時需要擴充召回范圍填充內(nèi)容

2、線下數(shù)據(jù)流閉環(huán)

1)根據(jù)全部候選集信息存儲的表格做搜索并記錄

2)用戶特征和物品特征的拼接、行為反饋數(shù)據(jù)拼接到特征上

3、數(shù)據(jù)分析、算法實驗

1)可響應(yīng)產(chǎn)品、性能、算法需求的架構(gòu)(不斷迭代)

2)可同時進行大量實驗的環(huán)境機制,用以獲取豐富的數(shù)據(jù)

4、面臨的挑戰(zhàn)

1)速度方面:

-數(shù)據(jù)的增長不受技術(shù)限制,在有限時間內(nèi)完成模型訓練

-使用更多特征、更復(fù)雜的模型會提高效果,和成本之間如何取舍

-需要有專門為機器學習任務(wù)優(yōu)化的計算框架

2)可擴展性方面:

-業(yè)務(wù)增長的速度不僅是量的增長,更是維度的增長(更多場景、更多用戶和內(nèi)容種類)

-快速發(fā)展的創(chuàng)業(yè)公司需要能匹配自己增長全周期的機器學習解決方案(做得早且效果好可以形成自己的壁壘)

5、研究方向

1)能收集到更真實無壓力反饋的產(chǎn)品形式、交互設(shè)計

2)更多種類的特征:挖掘圖像、音頻、文本特征、Session類特征

特征工程:通過特征組合、特征變換,豐富假設(shè)空間

3)模型抽象與相匹配的優(yōu)化算法

四、Q&A環(huán)節(jié)

1、當前最主流的推薦算法?

邏輯回歸算法

前沿的應(yīng)用:FTRL、LR(極其豐富的特征,簡單線性模型,并發(fā)性能好以及并發(fā)訓練實踐上有較多積累)

2、對于一個沒有什么其他用戶交互信息的新用戶,一般怎么做推薦?

用戶訪問到網(wǎng)站和app時有原始數(shù)據(jù)(手機類型、網(wǎng)絡(luò)類型、GPS地理信息、社交賬號信息),特征組合后識別出特定的人群,會有對應(yīng)的統(tǒng)計特征

3、深度學習在推薦中的應(yīng)用?

特定場景只能拿到很少的信息,可以通過深度學習挖掘未主動提供的信息(頭像、顏值、直播的背景音樂風格、直播的內(nèi)容、新聞的文本)

4、對于物料更新比較頻繁的應(yīng)用(比如新聞推薦),id類特征是否能提升效果?

從冷啟動的角度,對信息豐富的用戶做聚類,把新內(nèi)容對他們隨機分發(fā),收集不同類型用戶的反饋,得到新聞id更適合的人群,再用粗糙的規(guī)模做更大量的分發(fā),過了分發(fā)初期后,模型能訓練出更好的推薦結(jié)果。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容