
初識閆老師,是在他文章下面留言,咨詢關于內容運營的問題,閆老師給出非常詳細的回答,當時給我的感覺便是富有內才且謙虛嚴謹。
簡書出版推薦了三本書籍,作為一個路人粉給閆老師打call,購買了《內容算法》。
感謝閆老師將經(jīng)驗、實踐、知識梳理成文。以一杯咖啡的價格可以讀到好作品(少買一件衣服,多看好多本書),非常感恩。
任何愿意將自我價值進行輸出和分享的「老師」都值得感恩,利他者人恒利之。
如果給《內容算法——把內容變成價值的效率系統(tǒng)》打標簽,我愿意稱它為內容推薦領域的頭部作品,因為書籍內容最in且受眾最廣。

內容運營者入門,自媒體的工具書,內容推薦科普書對該書簡練的三詞定評。
推薦者們的推薦語寫得也很講究,借用文章中的理論,內容的標題和封面決定了內容的打開率,這些推薦語極大的引起了廣大讀者的興趣。
從而引出一個話題,作為一個推薦者,或者用于封面的推薦語,為什么沒有把書夸得天花亂墜、用詞考究?
有兩個原因:第一,防止言過其實,讀者有很高的期望,結果內容消費體驗斷崖式的落差;第二,用詞考究意味著讀者無法在一秒鐘理解,那么傳播性變差,因此影響書籍成為暢銷書。
上個星期,跟百萬粉絲擁有者深夜發(fā)媸徐老師互動的過程中,電光火石間,突然梳理出關于內容運營兩個層面的內容:
作為內容創(chuàng)作者來說,關鍵在于如何可持續(xù)性的產(chǎn)出優(yōu)質內容,是生存的關鍵。
對于內容平臺運營者來說,在上一層的基礎上,如何將用戶感興趣的內容推送給用戶,并在此基礎上保持內容的消費體驗和內容的多樣性,是勝出的關鍵。
先說第一層,如何可持續(xù)性的產(chǎn)出優(yōu)質內容?
如果單憑一己之力,難。
每寫完一篇優(yōu)質的內容,會有一種身體被掏空的節(jié)奏,在這種情況下要可持續(xù)運營和吸粉,不得不買稿、洗稿、培養(yǎng)風格類似的寫手、建立寫作模板,保證篇篇10萬+,基本上涵蓋了現(xiàn)在自媒體的升級方式。
再說第二層,如何推薦合適的內容給用戶?
在純人工推薦的時代,編輯的認知和風格決定推薦的內容帶有強烈的個人印記。
所以編輯面臨的最大的爭議便是作者質問:“為什么我的文章那么好,不推薦?那些很low的文章還上了首頁?”。
于是讀者質疑:“首頁都是些什么文章啊,雞湯!還沒我寫的好?!?/p>
那個時候,總是思考一個問題,到底什么是好文章?怎么樣才能做到讓更多的人喜歡和滿意。
在人工推薦的時代,我們需要高鑒賞水平的編輯,即高認知且不固執(zhí)。
為什么說高認知,因為這樣他才有好的鑒賞力,欣賞真正好的內容。
同時,他還要不固執(zhí),如果只考慮內容好才推薦,而平臺的讀者80%都在平均認知基準線上時,內容雖好,對讀者無用,看不懂他們便放棄了。
作為內容推薦機制從1.0人工推薦,到2.0算法推薦演進的過程中,也存在很多疑惑,在看書的過程中疑惑不斷加深,以前的問題又重復出現(xiàn)了,本質的問題沒有想透徹,但行業(yè)演進時,這些問題會更加凸顯且亟待解決。
1.什么是好內容?
我們可以區(qū)分什么是絕對的不好的內容,但對好內容沒有一個平均的標準。認知水平高的人,看到文章水平低于其認知的,會覺得內容low。
2.什么是優(yōu)質作者?
同上,有沒有一個平臺平均的評判標準,雖然每個人的看法不一樣,但在同一標準下不會出現(xiàn)兩個作者差距太大。
3.好內容和優(yōu)質作者對平臺的意義在哪里,有多重要?
如果真的是我們定義的優(yōu)質作者流失了,那么流失的原因是算法分發(fā)導致的流量不夠,還是有流量但收入不夠(比如無法分發(fā)廣告獲利)
4.現(xiàn)狀是是首頁的算法偏差導致推薦的內容low,還是因為本我超越超我(想看的和下意識點擊的內容完全不一樣)?
如果是推薦冷啟動階段,算法偏差的可能性更大。
5.到底是以內容為導向還是以用戶為導向?
如果是內容為導向,那么一篇深度的行業(yè)分析,雖然沒有娛樂新聞點擊率高,到價值更高,故而推薦時應提高其權重。但是好內容不一定有廣泛的閱讀基礎。
如果是用戶導向,那么不僅推薦用戶感興趣的內容,并且還應該適當推薦多元化的內容,擴展對用戶的了解,保持用戶看到內容的多樣性。
6.如果推薦權重包含社交、編輯推薦、系統(tǒng)推薦三大塊,平臺有沒有權重傾斜,比如權重的比重是1:1:2。
在看完書以后,以上問題,基本得到解答,過程中做了一些筆記和些許感悟,分享如下:
1.有的權重上升,有的下降,每次選擇和反饋,都在進化自己的數(shù)字軀體
2.內容斷供,體驗跳崖,所以要豐富用戶畫像,在某一內容斷供時,有其他內容補上
3.有人習慣好評,有人習慣低分,要根據(jù)用戶的歷史平均分作為基準進行歸一化處理,以衡量用戶評分背后的認可度
4.給標簽匹配推薦權重,高頻率標簽推薦權重低,低頻率標簽推薦權重高。如果標簽詞粒度不夠細,不能夠全面描述書的內容,就難計算出置信的相似度,達不到足夠好的推薦效果。「推薦質量的優(yōu)劣完全依賴于特征構建的完備性,這是一項系統(tǒng)工程?!?/p>
5.推薦算法:物以類聚,人以群分
抱著找茬的心態(tài)來看書,在這一節(jié),因為作者翻譯的詞句不同,如在人以群分模塊中,作者提到協(xié)同推薦可以分為三個子類,其中的Item-base的協(xié)同,作者翻譯為物品協(xié)同,而中國知網(wǎng)將其翻譯為項目協(xié)同,個人認為項目協(xié)同,歧意更少。
- 物以類聚:基于內容屬性的相似性推薦,系統(tǒng)化而全面的標簽體系,不同頻率標簽權重不同(頻率高,權重低,頻率低,權重高),推薦得分較高的內容(即相似度較高的內容),用戶每重新點擊下一個內容,算法重復上次動作,推薦新一輪類似內容,這就是為什么看著看著《爸爸去哪兒》的前段,跳到《媽媽是超人》了,因為一個名叫嗯哼的小朋友。
比如,淘寶買東西,「猜你喜歡」欄目會出現(xiàn)基于最近搜索的內容的推薦。
- 人以群分:基于用戶行為的協(xié)同過濾
Item-base項目協(xié)同:基于用戶選擇的項目(也可以理解為物品),先計算已評價項目和待預測項目的相似度,并以相似度作為權重,加權各已評價項目的分數(shù),得到待預測項目的預測值。例如:要對項目 A 和項目 B 進行相似性計算,要先找出同時對 A 和 B 打過分的組合,對這些組合進行相似度計算。
User-base用戶協(xié)同:比如,亞馬遜會出現(xiàn),購買了這本書的用戶還購買了……還瀏覽了……
PS:人以群分實現(xiàn)相對比物類分要慢一步,因為對用戶畫像的收集不完善的情況下,推薦是不精準的。
協(xié)同推薦的缺點是:
(1)用戶對商品的評價非常稀疏,這樣基于用戶的評價所得到的用戶間的相似性可能不準確(即稀疏性問題);
(2)隨著用戶和商品的增多,系統(tǒng)的性能會越來越低;
(3)如果從來沒有用戶對某一商品加以評價,則這個商品就不可能被推薦(即最初評價問題)。
因此,現(xiàn)在的電子商務推薦系統(tǒng)都采用了幾種技術相結合的推薦技術。
羅振宇的《時間的朋友》,根據(jù)收貨地址判斷這個區(qū)域人的認知水平,決定發(fā)真貨、高仿、盜版等,哈哈哈哈,認知水平低要交學費的,智商稅。
6.繼續(xù)看場景
考慮到存在家庭賬號共享的行為,算法也會進一步基于設備信息來判斷當前用戶是誰,從而展示同一賬號下,相應用戶的觀看歷史。
7.交互界面影響或引導用戶按照系統(tǒng)所期望的方式,提供更多的數(shù)據(jù),完善算法。對推薦系統(tǒng)而言,交互界面>數(shù)據(jù)>算法。
8.推薦算法的內核:提高分發(fā)的效率(讓每一個用戶更多的去點擊)。難怪,沒有考慮質量,這是為什么今日頭條上很low的內容,如標題黨,會獲得更多的點擊,導致好的內容質量得不到更多的曝光。(書中提到高階用戶對今日頭條詬病較多的一點。)
這點知乎做得更好,會有對內容質量的點贊,是踩是贊,還是以后不再推薦類似的「用戶」、「話題」、「標簽」等。
9.推薦系統(tǒng)評估指標
- 推薦準確度,表現(xiàn)為用戶的點擊率和對后續(xù)消費行為的預判
- 推薦覆蓋度(多樣性),相比于熱門排序,長尾內容會得到更多展示。同時也要避免入坑,比如僅關注全局的多樣性指標,而不關注個體的多樣性指標。
用現(xiàn)在的標準來評價簡書的推薦系統(tǒng),還可以提升,精確度不錯,推薦了很多《紅樓夢》評論的文章給我。長尾內容也比以前做得好,非以熱門論英雄。(問題是很多作者的鑒賞力有限,會積極分享文章到朋友圈的人,也許就是那波容易受熱門文章影響,且鑒賞力不夠,喜歡分享文章對自己進行標榜的人。所以現(xiàn)在分享文章到朋友圈的讀者少了,分享自己的文章的頻率較之前差不多。)
10.人工評估系統(tǒng),facebook的案例
有三個部分:一對一用戶訪談,外包團隊做的千量級的人工評估,面向普通用戶的萬量級在應用內投放的問卷。
形式如下:
(1)給出兩篇內容,讓用戶進行點對點的對比。
(2)給出單篇內容提供打分選項,建議用戶從內容和自身偏好的相關性、內容的信息量等角度給予1-5分的評分。
(3)給出開放性問題來收集用戶對自己信息流的反饋。
PS:問人工評估過程中選取的文章是如何選???
我猜想兩種方式,一是用戶看過的文章,二是根據(jù)不同算法推薦出來的兩篇文章,看哪種算法更好。
11.用戶畫像數(shù)據(jù)分為靜態(tài)和動態(tài)數(shù)據(jù)
- 靜態(tài)數(shù)據(jù):用戶獨立于場景之外的屬性,如性別、年齡、婚姻、常住地址、教育程度等
- 動態(tài)數(shù)據(jù):用戶在產(chǎn)品場景中產(chǎn)生的顯式和隱式行為,顯式行為如點贊、評論、收藏、分享、關注等,隱式行為,如停留頁面時長、點擊頁面次數(shù)、用戶操作行為軌跡等,通常顯式的行為權重高于隱式的行為,因為顯式行為比較少,需要隱式行為作為補充。
12.內容冷啟動階段,推薦系統(tǒng)更依賴于內容本身固有屬性,可分為內容展現(xiàn)緯度和內容消費緯度。
- 內容展現(xiàn)緯度:列表頁展現(xiàn)給用戶的信息,如標題、封面和發(fā)布時間等
優(yōu)化:
根據(jù)內容不同,探尋面對不同人群的更適合的表現(xiàn)形式,對于一篇文章,圖文展現(xiàn)比純標題文字展現(xiàn)效果好,對于一個視頻,全屏展示視頻瀑布流比較好。
- 內容消費緯度:包含作者層內容消費緯度(作者的粉絲群體更應該看到該作者的新內容,一個過往表現(xiàn)更好的作者可以得到更高的冷啟動推薦量;內容層內容消費緯度是指分類信息、關鍵詞、命中的實體和話題等,用于判斷內容與用戶的偏好是否匹配。)
優(yōu)化:
一方面,挖掘完善不同內容的特征,比如對視頻而言,時長、畫面清晰度均可成為補充特征;對短內容而言,冷啟動階段,放大作者的權重,優(yōu)先推薦給其粉絲群體。
另一方面,引導作者完善內容信息,如給視頻增加簡介、標注,選擇自定義封面而非視頻截圖,而且封面最好和標題、內容相匹配。平臺提供雙標題、雙封面等功能,幫助創(chuàng)作者更好的傳播自己的內容。
PS:避開超流量話題,比如雙十一和鹿晗戀情等流量黑洞。
13.圖文載體可供系統(tǒng)分析的信息相對豐富,可以統(tǒng)計文章詞頻,分析內容。對視頻載體或短內容來說,由于文本信息匱乏,系統(tǒng)會更傾向于從標題、描述、作者緯度來預估點擊率和內容質量,也由于標題的誤導,導致好的內容沒有得到合適的曝光。
14.所以,我們還有隱私嗎?完全被通訊錄留了電話的人出賣了也不知道。


15.冷啟動階段,推薦技術的本質是留住用戶,不斷推薦用戶喜歡的內容。產(chǎn)品的主場景留住用戶,產(chǎn)品的增值場景可以追求用戶興趣探索,除了用戶關注的內容,還會穿插部分擴展推薦性質的內容。經(jīng)歷過冷啟動后,已實現(xiàn)用戶留存,推薦系統(tǒng)需要犧牲短期點擊率來探索用戶更廣泛的興趣,從而獲得用戶長期留存率提升。
16.內容供應層面,不斷引入更多內容品類和品牌,同時設置首頁展示或廣告位(即生推),幫助這類內容通過探索,快速找到基礎用戶。生推適合大品類、受眾廣、大規(guī)模生產(chǎn)的內容,不適合容易引起爭議和讓人反感的內容。
生推前,基于專家判斷制定簡單的人群定向規(guī)則,用規(guī)則引導新品類、新品牌的加權分發(fā),將全人群的強展示轉為特定人群的強展示,從而換取更高的點擊率。
17.只要用戶停留足夠長,用戶的興趣探索就越完善。應對小眾興趣,一是擴充系統(tǒng)的資源地,二是通過產(chǎn)品設計,鼓勵用戶進行強表達行為(關注、收藏)發(fā)現(xiàn)更多興趣模塊。
PS:一次關注行為比一次點擊行為更加經(jīng)得起長時間的衰減。
18.冷啟動階段,作者占很大的權重,所以對作者的評價體系要合理可信。頭條號有原創(chuàng)度、健康度、垂直度、關注度和傳播度。
19.對原創(chuàng)的保護是各平臺的共識和基礎建設。微信公眾號的原創(chuàng)標識、轉載跳轉到原文,今日頭條檢測23個平臺,系統(tǒng)6小時內完成檢測,抓取疑似侵權鏈接,交于第三方幫助作者實現(xiàn)維權。
平臺要建立揚善的正面引導,懲惡樹立平臺規(guī)則,比如打擊**公告,公布被打擊的名單等。(與我的觀點不謀而合)。
20.常見的推薦問題
-
推薦重復
3
4
最后一種情況,分別推薦即可。
【建議解釋頭條號的雙封面和雙標題權限】就是同一個產(chǎn)品擁有兩個版本的封面,用兩種不同的方式來表達同一個內容。 如同一本書,正反兩面都是封面。
針對B類情況,意味著同一個用戶,未點擊同一個內容的第一個標題和封面,系統(tǒng)會把第二個標題和封面推薦給他,提高內容的曝光率,也不會增加用戶一看列表頁覺得重復的暴走感。
[真的很有腦洞?。?/p>
- 推薦密集
造成原因是短期熱點+對用戶興趣點理解不夠,故而密集推薦。


之前就遇到過某個作者內容霸屏的情況,采用不同緯度打散的規(guī)則。比如一個讀者關心財經(jīng)和體育,關注了樊剛、虎撲和網(wǎng)易運動欄目,正在NBA期間,采取多維規(guī)則前:
NBA 虎撲
NBA 2 虎撲
湖人 虎撲
NBA 網(wǎng)易運動欄目
湖人 網(wǎng)易運動欄目
六個紅包 樊剛
買房打臉言論 樊剛
改變規(guī)則后:
NBA 虎撲
湖人 網(wǎng)易運動欄目
六個紅包 樊剛
NBA 2 虎撲
買房打臉言論 樊剛
NBA 網(wǎng)易運動欄目
湖人 虎撲
看列表,視覺的密集感下降了。
21.易反感內容
- 題材問題:恐怖血腥類、神鬼類、迷信類等
- 質量問題:根據(jù)用戶點擊后迅速退出、舉報、負面評論等判斷
對這類內容進行收集和標注,為模型訓練做準備,研發(fā)識別模型,產(chǎn)品經(jīng)理對模型的準確度和召回度進行評估:
- 強化閱讀體驗,重視讀者:重視召回率,寧錯刪不漏刪。
- 強化作者體驗,重視文章:適當降低置信度,或者增加人工復審撈回流程。
對易反感內容,用戶不點擊,則敏感內容應推遲多個周期后才推薦。
22.關于好內容的標準


23.機器學習大面積取代人工判斷的時代到來,產(chǎn)品經(jīng)理要干嘛?訓練機器。
- 設定目標:
- 指定保底方案:現(xiàn)在首頁的文章出現(xiàn)不少廣告之類,還可以通過人工審核或用戶舉報
- 發(fā)現(xiàn)問題:比如大家反應出現(xiàn)的推薦字數(shù)很少的內容,設定修正目標,比如內容至少要多于多少字,多哪些內容可以豁免。
24.有價值用戶長期留存
【誰在付費?打賞、購買課程、充值會員的。以及哪些作者引起了用戶的這種行為?!?/p>
25.好的個性化需要克制,引入更多緯度的人工評估進行決策權衡,以可量化的短期指標損失來保證不能輕易量化的消費體驗。
26.同樣是好內容,有些人是在寫藝術品,有些人寫消費品。
所以有些寫作課,有人覺得low,可能是他在寫藝術品,看不上寫消費品的作者教授的方法。
27.影響內容的第一次打開率的最直接的因素:
- 活躍粉絲數(shù)量
- 內容包裝好壞
標題和封面即包裝。咪蒙說:“不能一秒看懂的標題,不適合傳播”。用詞斟酌過,沒有用好和壞等詞來形容,堅持我一以貫之的價值觀,一秒看懂的標題簡單+直白+有G點。
占據(jù)流量太久的甲方,換到乙方?jīng)]法干活了。在人工選擇階段,會控制標題黨,在算法分發(fā)的情況下,就靠用戶自己用腳投票了。
自媒體成為標題黨,是因為懂得他們在做內容快消品的生意。而平臺控制標題黨,是為了保證用戶的閱讀體驗,有如下方法:
- 用爛的+廣告法規(guī)定的,設立規(guī)則直接禁
- 歧義、蹭名人,借助用戶反饋發(fā)現(xiàn)
- 基于作者過往的歷史,提供不同授信空間
寫一秒就懂的標題和有內涵的標題,在技能圖譜中,屬于不同的象限。
28.REO(Recommend Engine Optimization)機器推薦優(yōu)化
- 文字:正常寫作即可,涉及英文內容,補充對應中文譯名
- 圖文:增加熱門關鍵詞,騙過推薦系統(tǒng)進行推薦,早期OK,一旦相應的識別規(guī)則上線,將直接影響對應自媒體賬號的可信度
- 視頻:現(xiàn)有技術可做基于幀的圖片分析或音軌分析,但未大規(guī)模應用。寫好內容介紹即可,不過分追求標題的精妙,直白的概括內容關鍵即可。
自媒體關注推薦系統(tǒng)的長期利益訴求,成為一個系統(tǒng)信賴的品牌。
與平臺運營者保持良好溝通,加入官方的運營群和核心功能測試時積極反饋使用感受等。
29.關于活動拉新
實物禮品用于鼓勵已有活躍的老粉絲,虛擬禮品用于激活和拉新。
30.用戶對內容消費意圖,分為功利性訴求(通過考試和學知識)和非功利性訴求(長見識)。
能提高工作效率或收入的知識和經(jīng)驗最被用戶認可,有63.3%的人愿意付費。有關職業(yè)與學業(yè)的發(fā)展建議,我有40%的付費意愿。內容產(chǎn)品的功利性是包裝方向,付費內容一定可以解決的是聽者的自我焦慮感。
人們只會對自己覺得對自己有價值、超預期的內容付費。

