寫給產(chǎn)品和運營人的內(nèi)容推薦框架筆記

許多專業(yè)人士的知識結(jié)構(gòu)特點都是:在太少的地方知道的太多。

我們總是希望他們能講點什么,但很遺憾的是,許多專業(yè)人士已經(jīng)逐漸喪失了和大眾對話的能力,他們一開口,講的東西大多人都很難輕易聽懂。

在職場,分工的邊界開始變得模糊,大多人需要的是對許多方面都有一定的了解,但又不需要特別精通,從而能和其他人有更流暢的合作,對項目有更宏觀的理解,對非專業(yè)的知識也能有框架性的認識。

所以本文梳理了內(nèi)容推薦算法的基礎邏輯,沒有任何公式和算法程序,10分鐘就可以對內(nèi)容推薦的方方面面有整體的理解。

為了讓文章盡可能簡化,所有不必要的內(nèi)容都沒有在文中寫出,但羅列了許多參考文章,可以進一步擴展閱讀。各位在人人都是產(chǎn)品經(jīng)理、鳥哥筆記、搜狗微信搜索等網(wǎng)站檢索,就可以輕易得到文章。

絕大多數(shù)已知的事情在邏輯上都是非常簡單的,難的地方在于細節(jié)的處理、技術(shù)的實現(xiàn)。但在“認識”這個階段,對邏輯的理解非常重要,所以這是一個既重要又簡單的部分。

在“實踐”階段則要復雜的多,需要我們自己在做的過程中反復琢磨,找到真正適合自己的方案。?

全文分為6個基礎邏輯。


傳統(tǒng)內(nèi)容獲取方式

#在個性化推薦技術(shù)大規(guī)模應用以前,人們在線獲取信息的方式主要依靠搜索引擎、瀏覽站點首頁兩種方式。

#使用搜索引擎的場景下,用戶的需求主動而明確,可以通過關(guān)鍵詞獲取精準的信息。

#瀏覽站點首頁的場景下,用戶的需求主動而模糊,可以獲得平臺推薦給你的信息,這種推薦對所有用戶一般是無差別的,比如各大站點首頁的輪播圖、專欄、熱榜等。相關(guān)的技術(shù)是“熱點算法”。

#最近幾年開始流行的個性化推薦提供足夠定制化的信息,每個人都是獨一無二的個體,極為個性化的偏好都能得到滿足。

「擴展閱讀」

#互聯(lián)網(wǎng)時代最主要的三種獲取信息方式-文章-米可-人人都是產(chǎn)品經(jīng)理

#淺談互聯(lián)網(wǎng)信息獲取方式的演變以及對SEO的影響-文章-SEO技術(shù)流-微信公眾號


內(nèi)容分發(fā)方式

#內(nèi)容分發(fā)是從平臺的角度來說的,可以分為訂閱分發(fā)、編輯分發(fā)、社交分發(fā)、推薦分發(fā)。

#微信公眾號的基本的邏輯是訂閱分發(fā),網(wǎng)易首頁的輪播圖和欄目是編輯分發(fā),微信「看一看」中的“朋友在看”屬于社交分發(fā),今日頭條APP首頁的“推薦”欄目更多屬于推薦分發(fā)。

#許多產(chǎn)品都會把三種方式結(jié)合使用,比如知乎首頁就有「推薦」、「關(guān)注」和「熱榜」,甚至有的平臺會把這三類都整合在一個信息流中。

「擴展閱讀」

#聊一聊信息分發(fā)的嬗變史-文章-善寶橘-人人都是產(chǎn)品經(jīng)理

#互聯(lián)網(wǎng)信息分發(fā)簡明史-文章-金葉宸-人人都是產(chǎn)品經(jīng)理

#知乎的內(nèi)容分發(fā)策略及運行機制是怎樣的?-文章-Lcarusd-人人都是產(chǎn)品經(jīng)理

#內(nèi)容分發(fā)三分天下?編輯、算法與社交-文章-Ella-人人都是產(chǎn)品經(jīng)理


搜索引擎&推薦系統(tǒng)

#搜索引擎推薦系統(tǒng)是人們獲取信息最主要的兩種方式,它們之間關(guān)系密切。

#前面已經(jīng)說過,使用搜索引擎獲取信息時,用戶的需求主動而明確,而使用推薦系統(tǒng)的用戶,需求往往被動而模糊

#搜索引擎的結(jié)果對不同特征的人可以有一定的不同,但很難做到個性化,推薦引擎則可以做到千人千面,滿足每個用戶的個性化需求。

#從給用戶呈現(xiàn)的內(nèi)容來看,可以把搜索引擎看作推薦引擎的某種簡化,如果一個用戶只對一個關(guān)鍵詞感興趣,那么推薦引擎的結(jié)果就近似于搜索引擎的結(jié)果。

「擴展閱讀」

#推薦系統(tǒng)和搜索引擎的關(guān)系是什么?-文章-陳運文-人人都是產(chǎn)品經(jīng)理

#內(nèi)容算法:第一章:走近內(nèi)容推薦:推薦系統(tǒng)架構(gòu)初探-圖書-閆澤華-實體書

#一文解讀垂直搜索引擎和個性化推薦的應用邏輯-文章-Sarah-人人都是產(chǎn)品經(jīng)理


推薦系統(tǒng)&用戶畫像

#內(nèi)容推薦,就是把合適的內(nèi)容推薦給需要的用戶,推薦系統(tǒng)需要搞定三個大的模塊用戶、內(nèi)容、算法。而用戶畫像屬于用戶模塊,是推薦系統(tǒng)的重要組成部分。

#雖然用戶畫像還有產(chǎn)品或行業(yè)研究等使用場景,但相對次要,在討論推薦問題的場景下,可以直接把用戶畫像看作推薦系統(tǒng)的組成部分。

#用戶的每一次操作都有兩種意義。一是對內(nèi)容進行「群體評估」,用自己的行為決定某篇內(nèi)容的好壞,二是「個體進化」的意義,通過自身的每一次選擇與反饋,持續(xù)地改進自身的用戶畫像。

#用戶畫像就像為每個人構(gòu)建一個數(shù)字軀體,用戶畫像越完善,推薦系統(tǒng)獲得的語義就越豐富,推薦給用戶的內(nèi)容就越精準,用戶就可以獲得更好的體驗。

「擴展閱讀」

#一文讀懂推薦系統(tǒng)用戶畫像-文章-菠蘿王子-人人都是產(chǎn)品經(jīng)理

#實例解析:生活中的用戶畫像-文章-接地氣的陳老師-人人都是產(chǎn)品經(jīng)理


斷物&識人

斷物和識人,一個關(guān)注內(nèi)容,一個關(guān)注用戶,簡單來說都是“貼標簽”。標簽是我們對多維事物的降維理解,抽象出事物更具有表意性、更為顯著的特點。

#「斷物」有三種方式:分類、標簽、聚類。

#「分類」是樹狀的,是自上而下依次劃分的。在分類體系里,每個節(jié)點都有嚴格的父類繼承關(guān)系,在兄弟節(jié)點層都具有可以被完全枚舉的屬性值。

#應用分類時必須考慮分類權(quán)威性和信息完備性問題,避免因為子節(jié)點覆蓋不全或分類錯誤導致的認知問題。

#知乎的「話題樹」就是一個典型的分類體系。

#「標簽」是網(wǎng)狀的,更強調(diào)表達屬性關(guān)系而非繼承關(guān)系,只有權(quán)重大小之分,不強調(diào)包含與被包含關(guān)系。這就使得相對于分類而言,標簽的靈活性更強。

#在權(quán)威性方面,標簽是較弱的,每個用戶都可以參與進來,基于自己的偏好貼標簽,可以借助規(guī)模效應實現(xiàn)對信息表意完備性的覆蓋。

#豆瓣圖書的關(guān)鍵詞,就是一個典型的標簽系統(tǒng)。

#「聚類」可以用來應對難以用標簽準確描述的東西,比如說一個人長得漂亮,是由一系列復雜而模糊的綜合特征來決定的。

#聚類并不是以標簽詞的方式來定義事物是怎樣的,而是基于某一維度的特征將相關(guān)物品組成一個集合,并告訴你這個新的物品同哪個集合相似。這種分類算法相對并不直觀,對普通用戶來說一般處于黑盒狀態(tài)。

#抖音可能會給你推薦「愛跳舞的小姐姐」、也可能會給你推薦「美食做法」,其中的算法就包含對短視頻的聚類。

#「識人」可以更加簡單地理解為給用戶“貼標簽”,來描述用戶的特征,也就是用戶畫像。

#用戶畫像數(shù)據(jù)分為靜態(tài)和動態(tài)兩類。

#「靜態(tài)用戶畫像數(shù)據(jù)」是獨立于產(chǎn)品場景之外的屬性,比如性別、學歷、年齡等。

#「動態(tài)用戶畫像數(shù)據(jù)」,包括用戶在產(chǎn)品場景中所產(chǎn)生的的顯式和隱式行為。

#顯式行為包括對內(nèi)容的點贊、評論、分享、對作者關(guān)注等。

#隱式行為包括在頁面的停留時間、用戶操作軌跡等。

#通常顯式行為的權(quán)重更高,但由于顯式行為更稀疏,所以需要隱式行為來補充驗證。?

「擴展閱讀」

#內(nèi)容算法:第二章:推薦的起點:斷物識人-圖書-閆澤華-實體書

#如何構(gòu)建用戶標簽體系?-文章-日久情疏-人人都是產(chǎn)品經(jīng)理

#用戶標簽實踐:如何建立標簽體系實現(xiàn)精準營銷?-文章-lei-人人都是產(chǎn)品經(jīng)理

#什么是用戶畫像和標簽?-文章-Pinko-人人都是產(chǎn)品經(jīng)理


基于內(nèi)容的推薦&基于用戶的推薦

基于內(nèi)容的推薦指的是「相似性推薦」。

#「相似性推薦」算法中的相似性通過內(nèi)容的標簽重合度來體現(xiàn)。

#在眾多圖書中,兩本書的標簽重合度較高,如果用戶選擇了其中一本,系統(tǒng)就應當優(yōu)先推薦給這位用戶另一本。

#上圖中,《運營之光》和《從零開始做運營》的標簽重合度更高,可以給買其中一本的用戶推薦另一本,而不是推薦《內(nèi)容算法》。

#考慮到不同標簽的區(qū)分度不同,可以進一步細化,引入TF-IDF方式給不同的標簽設定權(quán)重。

#TF-IDF的邏輯很簡單,出現(xiàn)頻率越高的標簽區(qū)分度越低,給的權(quán)重也應該越低。

#這種基于內(nèi)容屬性的推薦好處是只依賴物品本身的特征而不依賴用戶的行為,讓新的物品和冷僻的物品都能得到展示。但也有一些問題。

#第一個問題,推薦質(zhì)量的優(yōu)劣完全取決于特征構(gòu)建的完備性,但這是一項困難的系統(tǒng)工程。

#第二個問題,單純的內(nèi)容屬性推薦沒有考慮到用戶對物品的態(tài)度,用戶的品味和調(diào)性很難得到詮釋和表達。

#「相似性推薦」理解起來比較直觀,但因為它存在的問題在海量內(nèi)容平臺上非常嚴重,所以下面一種方式才是目前應用范圍較廣的推薦方法。?


基于用戶的推薦指的是「協(xié)同過濾」。?

#「基于用戶行為的協(xié)同過濾」引入了用戶的消費行為特征,以此來計算用戶相似性物品相似性。

#協(xié)同推薦分為三個子類:基于物品的協(xié)同、基于用戶的協(xié)同、基于模型的協(xié)同。

#「基于用戶的協(xié)同」就是找到和你口味相似的人群,并把他們喜歡的新東西推薦給你。

#上圖中,用戶1和3都喜歡內(nèi)容A和C,判斷這兩個用戶偏好相似,當用戶3閱讀內(nèi)容D時,同樣把內(nèi)容D推薦給相似的用戶1。

#「基于物品的協(xié)同」,如果很多用戶都閱讀了同樣的兩個內(nèi)容,系統(tǒng)就認為這兩個內(nèi)容相似。一個新的用戶閱讀其中一個,系統(tǒng)就會把另一個推薦給這位用戶。

#上圖中,內(nèi)容A和C都被用戶2和3喜歡,系統(tǒng)判斷這兩個內(nèi)容相似,所以當一個新的用戶1喜歡A后,也應該把相似的內(nèi)容C推薦給用戶1。

#「基于模型的協(xié)同」是用用戶的喜好信息來訓練算法模型,實時預測用戶可能的點擊率,是深度學習技術(shù)的應用。

#基于用戶行為的協(xié)同過濾,特點是我們不需要對物品或信息進行完整的標簽化分析和建模,實現(xiàn)了領(lǐng)域無關(guān),因此應用廣泛。

「擴展閱讀」

#內(nèi)容算法:第三章:推薦算法:物以類聚,人以群分-圖書-閆澤華-實體書

#分析:基于文本內(nèi)容推薦和協(xié)同過濾推薦-文章-SincerityY-人人都是產(chǎn)品經(jīng)理

#推薦策略產(chǎn)品經(jīng)理:什么是協(xié)同過濾推薦算法?-文章-鳳城狂客-人人都是產(chǎn)品經(jīng)理#

#協(xié)同過濾算法:在抖音狂給1000個小姐姐點贊的事被老婆發(fā)現(xiàn)了!-文章-菠蘿王子-人人都是產(chǎn)品經(jīng)理?


設計一款推薦系統(tǒng),除了整體邏輯和具體算法,期間還會遇到各種各樣需要考慮的問題,比如去重問題、權(quán)重問題、推薦密度問題、易反感內(nèi)容處理、時空限定類內(nèi)容處理、反作弊、偶然和極端情況等等,都需要我們逐步考慮進來。

另外,理解整體邏輯后,我們還需要知道,推薦算法是有很多不同的典型使用場景的。比如基于用戶消費歷史的商品推薦、視頻播放結(jié)束后繼續(xù)觀看的場景、搜索的場景、時下流行內(nèi)容的推薦、熱榜推薦的熱度算法等等,每一類場景都能找到典型的產(chǎn)品,但一定要根據(jù)分類找到更有參考價值的案例,以免邏輯混亂。

以上內(nèi)容,寫給那些對內(nèi)容推薦非常陌生的產(chǎn)品和運營人員,可以作為入門理解的首選文章。當然,一個成熟的推薦系統(tǒng)從設計到落地要復雜得多,每一個不同的細節(jié)問題、每一個使用場景都有相關(guān)的文章或圖書,可以進一步檢索學習。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容