今日頭條的推薦算法
(原鏈接https://36kr.com/p/5114077)
待解決的問(wèn)題:資訊、用戶和環(huán)境之間的匹配關(guān)系,擬合用戶對(duì)內(nèi)容滿意度的函數(shù)。
內(nèi)容有很多特征,如何提取才能做好推薦,是需要仔細(xì)考慮的。
用戶特征,包括興趣、職業(yè)、年齡等,還有許多可以刻畫(huà)用戶隱藏的興趣。
環(huán)境特征,用戶可以在不同場(chǎng)景、在工作、交通、旅游等場(chǎng)景下,信息偏好是不同的。
模型依據(jù)上述特征會(huì)給出預(yù)估,推測(cè)所推薦的內(nèi)容在此場(chǎng)景下是否適合用戶。
那些無(wú)法直接衡量的目標(biāo)怎么辦?
比如說(shuō)廣告和特型內(nèi)容頻控。問(wèn)答型的內(nèi)容推薦,目標(biāo)不光是讓用戶瀏覽,還包括吸引用戶貢獻(xiàn)內(nèi)容。這些內(nèi)容如何混排,控制頻率等都需要考慮。
還有,平臺(tái)為了生態(tài)以及社會(huì)責(zé)任感,需要打擊低俗內(nèi)容、降權(quán)等。這些算法無(wú)法完成,需要進(jìn)一步干預(yù)。
典型的推薦特征。
相關(guān)性,即評(píng)估內(nèi)容和用戶是否匹配。環(huán)境特征,包括地理位置、時(shí)間。熱度特征,全局熱度、分類熱度等。協(xié)同特征,通過(guò)用戶行為分析不同用戶建的相似性。