seo今日頭條公開(kāi)推薦算法

  今日頭條的推薦算法,相信是做自媒體朋友最為關(guān)心的吧,就在前不幾的頭條大會(huì)上,今日頭條資深架構(gòu)師曹歡歡首次公開(kāi)揭秘。

  1月11日,今日頭條在總部舉辦了一場(chǎng)推薦算法交流會(huì),因?yàn)閳?bào)名人數(shù)遠(yuǎn)遠(yuǎn)超過(guò)了預(yù)期,交流會(huì)還臨時(shí)換了場(chǎng)地。

  冷啟動(dòng)(新用戶首次使用)是否可以通過(guò)第三方數(shù)據(jù)來(lái)避免推薦不準(zhǔn)?算法應(yīng)該如何平衡廣告內(nèi)容和資訊內(nèi)容?推薦的“準(zhǔn)”和信息繭房的矛盾,應(yīng)該如何協(xié)調(diào)?

  今日頭條公開(kāi)算法的基本原理,并接受建言,體現(xiàn)出了一家平臺(tái)對(duì)技術(shù)發(fā)展的責(zé)任感與誠(chéng)意,這將對(duì)算法應(yīng)用乃至整個(gè)互聯(lián)網(wǎng)行業(yè),起到巨大的積極推動(dòng)作用。

  今日頭條副總編輯徐一龍

  會(huì)議由今日頭條副總編輯徐一龍主持。徐一龍?jiān)谡劦浇袢疹^條對(duì)行業(yè)公開(kāi)、透明自己算法原理的初衷時(shí)說(shuō),算法也是一種“法”,都是通過(guò)一定的規(guī)則和方法,達(dá)成預(yù)期的一種效果。算法和法律法規(guī)一樣,如果施行的好,都很高效,也都要求透明。

  曹歡歡博士在現(xiàn)場(chǎng)分享了今日頭條推薦算法的基本原理,并詳細(xì)介紹了算法模型設(shè)計(jì)維度與策略。包括如何在線訓(xùn)練大規(guī)模推薦模型,典型召回策略的設(shè)計(jì)方法,多目標(biāo)如何融合等核心問(wèn)題。此外,他還重點(diǎn)講解了今日頭條的內(nèi)容安全機(jī)制及相關(guān)舉措,公開(kāi)了風(fēng)險(xiǎn)內(nèi)容識(shí)別技術(shù)以及泛低質(zhì)內(nèi)容識(shí)別技術(shù)。

  他表示:“算法分發(fā)并非是把所有決策都交給機(jī)器,我們會(huì)不斷糾偏,設(shè)計(jì)、監(jiān)督并管理算法模型。希望這次分享能讓更多的人理解算法,并共同參與到算法模型的制定中來(lái),以改善算法,更好的為用戶服務(wù),讓算法為社會(huì)創(chuàng)造更大的價(jià)值?!?/p>

  現(xiàn)場(chǎng)觀眾

  此次今日頭條將算法透明化,并接受建言,屬于行業(yè)首例。算法原則歷來(lái)屬于公司行業(yè)機(jī)密,極少有公司會(huì)對(duì)外公布。今日頭條方面表示,人工智能發(fā)展帶來(lái)的挑戰(zhàn),是人類此前沒(méi)有遭遇過(guò)的。當(dāng)企業(yè)發(fā)展壯大時(shí),有責(zé)任也有義務(wù),與行業(yè)一道積極思考與研究新技術(shù)可能帶來(lái)的機(jī)遇和風(fēng)險(xiǎn)。

  據(jù)介紹,阿里、騰訊、百度、美團(tuán)、新浪、網(wǎng)易等科技公司的算法工程師和產(chǎn)品經(jīng)理都去了??磥?lái)大家對(duì)今日頭條到底用了什么推薦算法,那是相當(dāng)?shù)暮闷妗?/p>

  在當(dāng)天的交流會(huì)上,今日頭條資深算法架構(gòu)師、中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)博士曹歡歡帶來(lái)了題為《讓算法公開(kāi)透明》的分享,首次面向行業(yè)公開(kāi)算法原理。

  今日頭條資深算法架構(gòu)師曹歡歡講解今日頭條算法原理

  他表示:“算法分發(fā)并非是把所有決策都交給機(jī)器,我們會(huì)不斷糾偏,設(shè)計(jì)、監(jiān)督并管理算法模型。希望這次分享能讓更多的人理解算法,并共同參與到算法模型的制定中來(lái),以改善算法,更好的為用戶服務(wù),讓算法為社會(huì)創(chuàng)造更大的價(jià)值?!?/p>

  據(jù)曹歡歡介紹,今日頭條旗下幾款產(chǎn)品都在沿用同一套大的算法推薦系統(tǒng),但根據(jù)業(yè)務(wù)不同,每套系統(tǒng)的架構(gòu)會(huì)有所調(diào)整。 曹歡歡在現(xiàn)場(chǎng)的PPT里公布了頭條使用的五種推薦算法,包括傳統(tǒng)的協(xié)同過(guò)濾模型,監(jiān)督學(xué)習(xí)算法Logistic Regression模型,基于深度學(xué)習(xí)的Factorization Machine,以及DNN和GBDT。 曹歡歡介紹說(shuō),現(xiàn)在很難有一套通用的架構(gòu)模型適用于所有的推薦場(chǎng)景,所以很多公司會(huì)做多個(gè)算法的組合,比如現(xiàn)在很流行將LR和DNN結(jié)合,甚至前幾年Facebook也是將LR和GBDT算法做結(jié)合。今日頭條也基本是一套大算法,根據(jù)業(yè)務(wù)不同再具體調(diào)整結(jié)構(gòu)。 在解釋了算法之后,曹歡歡進(jìn)一步解密了頭條的推薦如何工作。曹歡歡表示,主要有四類最重要的用戶特征,將會(huì)輸入給算法,影響到推薦算法的工作。

  第一類是相關(guān)性特征,就是評(píng)估內(nèi)容的屬性和維度與用戶是否匹配。顯性的匹配包括關(guān)鍵詞匹配、分類匹配、來(lái)源匹配、主題匹配等。像FM模型中也有一些隱性匹配,從用戶向量與內(nèi)容向量的核心距離可以得出。 第二類是環(huán)境特征,包括地理位置、時(shí)間。這些既是bias(基礎(chǔ))特征,也能以此構(gòu)建一些匹配特征。 第三類是熱度特征。包括全局熱度、分類熱度,主題熱度,以及關(guān)鍵詞熱度等。熱度信息在大的推薦系統(tǒng)特別在冷啟動(dòng)的時(shí)候非常有效。 第四類是協(xié)同特征,它可以在部分程度上幫助解決所謂算法越推越窄的問(wèn)題。協(xié)同特征并非考慮用戶已有歷史。而是通過(guò)用戶行為分析不同用戶間相似性,比如點(diǎn)擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴(kuò)展模型的探索能力。

  分享過(guò)后,曹歡歡在還解答了各位對(duì)算法的疑問(wèn),包括今日頭條如何實(shí)現(xiàn)冷啟動(dòng),廣告和內(nèi)容該怎樣平衡,怎樣準(zhǔn)確地拓展用戶興趣圖譜等切實(shí)的工程性問(wèn)題。同時(shí),也聽(tīng)取了大家對(duì)今日頭條算法的意見(jiàn)和建議。

SEO優(yōu)化https://www.leosem.com/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容