40《內(nèi)容算法》| 文章閱讀量很低?原來是沒通過“冷啟動”這一關

漫游第40篇讀書筆記

創(chuàng)作的繁榮、載體的多元、分發(fā)的進化,內(nèi)容信息消費在快速的發(fā)展和迭代過程中,但一定有可以讓我們慢下來的東西——那是內(nèi)容的核。——閆澤華


大家好,我是漫游。

今天和您分享的是《內(nèi)容算法:把內(nèi)容變成價值的效率系統(tǒng)》,作者閆澤華。

什么是內(nèi)容推薦算法?

“信息繭房”是算法之過嗎?

為什么你的文章閱讀量很低?


關于本書

信息爆炸的時代,我們每一個人都是內(nèi)容的消費者。打開手機APP,為什么你看到的是體壇賽況,而我看到的是影視娛樂?為什么別人的文章閱讀量10萬+,而我的只有幾十個?這背后是內(nèi)容推薦系統(tǒng)的匹配與算法分發(fā)結(jié)果。

我們大多數(shù)人并不了解推薦算法的運作邏輯,因此多少都會心存成見與誤解,比如標題黨、內(nèi)容Low、信息繭房等等。本書作者具有互聯(lián)網(wǎng)從業(yè)者和自媒體創(chuàng)作者雙重從業(yè)經(jīng)驗,通過產(chǎn)品經(jīng)理、自媒體兩個角度,他為外行人系統(tǒng)介紹了內(nèi)容推薦的系統(tǒng)架構(gòu)、算法迭代、平臺應用,以及自媒體的變現(xiàn)與發(fā)展路徑。

斷物識人:內(nèi)容推薦算法的起點

互聯(lián)網(wǎng)經(jīng)歷了一個從“人找信息”到“信息找人”的轉(zhuǎn)變,內(nèi)容的分發(fā)也從搜索系統(tǒng)進化到推薦系統(tǒng)。這兩者的系統(tǒng)架構(gòu)有相似之處,都是要實現(xiàn)信息與用戶意圖之間的匹配;不同之處在于搜索系統(tǒng)中,用戶意圖能夠借由“關鍵詞”明確表達,而推薦系統(tǒng)中沒有。

推薦是特定場景下人和信息更有效率的連接。首先算法系統(tǒng)要對內(nèi)容、對用戶進行識別,作者用“物以類聚,人以群分”描述這個過程,最簡單的識別方式就是“貼標簽”。

標簽是我們對多維事物的降維理解,抽象出事物更具有表意性、更為顯著的特點。不同于分類的樹狀體系,標簽是網(wǎng)狀的,而且靈活性強,既可以通過平臺的專家系統(tǒng)產(chǎn)出,也能夠依靠普通網(wǎng)友生成。

對于內(nèi)容,以音樂網(wǎng)站為例,可以按照流行、古典、民族、搖滾、民謠等流派標簽進行識別,還可以依據(jù)跑步、自習、睡眠等場景標簽進行區(qū)分。對標簽難以準確表意和概括的領域,算法系統(tǒng)會通過聚類的方式進行描述,以便對內(nèi)容進行準確識別。

對人的識別是“用戶畫像”,更直白說就是給目標用戶貼標簽的過程。我們填寫的注冊信息,搜索輸入的每一個關鍵詞,每一次的點擊和觀看習慣,以及點贊、收藏、評論和轉(zhuǎn)發(fā),都是系統(tǒng)中用戶畫像數(shù)據(jù)的來源。

內(nèi)容和用戶的識別只是開始,更重要的是物與人的匹配。

內(nèi)容分發(fā):連接內(nèi)容與人

內(nèi)容分發(fā)的方式主要有三種:編輯(中心人工主導)分發(fā)、算法(機器主導)分發(fā)、社交(離散人工主導)分發(fā),三種方式各有千秋。

編輯分發(fā)的優(yōu)勢在于依靠編輯的專業(yè)性,完成從海量內(nèi)容到有限展示位的過濾和篩選,內(nèi)容的平均質(zhì)量相對較高。但人工的判斷難免出現(xiàn)偏差,“叫好不叫座”的情況時有發(fā)生。

算法分發(fā)的引入,實現(xiàn)了“千人千面”的效果,展示位數(shù)量得到極大擴展?,F(xiàn)實中,平臺采用人工+機器的分發(fā)方式,內(nèi)容審查、質(zhì)量評估、推送范圍、推送級別等環(huán)節(jié)仍然依靠編輯和審核團隊的把控與決策。

社交媒體廣泛應用后,內(nèi)容的分發(fā)逐漸去中心化,每一個人都成為編輯,成了內(nèi)容分發(fā)的中心。但社交分發(fā)也出現(xiàn)新的問題,比如流量逐漸被大V、營銷號壟斷,流量獲取的成本劇增;內(nèi)容質(zhì)量逐漸下降,朋友圈一度充斥著各種微商廣告、轉(zhuǎn)發(fā)集贊、打卡/曬娃貼。

各大平臺也因此不斷升級各自的分發(fā)算法,通過調(diào)整各影響因素的不同權重,優(yōu)化內(nèi)容排序,對低質(zhì)或過度傳播的信息進行降頻過濾等等手段,實現(xiàn)匹配效率和質(zhì)量的優(yōu)化,從而提升用戶的使用體驗。

算法是基于我們對現(xiàn)實世界的理解進行的抽象和建模,編輯、社交因素都可以轉(zhuǎn)化為算法推薦的參考因素。從這個角度看,算法分發(fā)可以說是內(nèi)容分發(fā)的終極解決方案。

現(xiàn)實中,各平臺采用多分發(fā)融合的模式:依賴中心化編輯引導和干預,依靠去中心化用戶生產(chǎn)傳播,應用機器學習提升效率。對此,作者的觀點是:多分發(fā)方式的融合一定是未來分發(fā)的主流。

信息繭房:推薦算法不背這個鍋

當前內(nèi)容分發(fā)全面進入推薦分發(fā)時代,然而現(xiàn)實中,輿論卻時不時對其口誅筆伐,比如公眾對于標題黨的抱怨,對身處“信息繭房”的擔憂。但作者指出,推薦算法不該背這個鍋。

標題黨是最近才出現(xiàn)的嗎?其實不然,標題黨的鼻祖可追溯至1985年出版的《知音》。作者列舉了幾個知音文章的標題,其中之一是《再大的恨放下吧,喚醒前夫贏得親情一片天》(2007年第35期)。品一品,是不是熟悉的味道?

在大量依賴政府撥款補貼的期刊中,《知音》依靠零售市場自負盈虧,一度成為全球前五強的大刊,發(fā)行量常年穩(wěn)居中國雜志發(fā)行第一,月銷量一度達到700萬份。

“信息繭房”一詞來自于哈佛大學法學院教授、美國前總統(tǒng)奧巴馬的法律顧問凱斯·桑斯坦2006年的著作《信息烏托邦——眾人如何生產(chǎn)知識》。 桑斯坦在書中指出:在信息傳播中,由于公眾對自身的信息需求并非全面,公眾只注意自己選擇的東西和使自己愉悅的領域,久而久之,會將自身桎梏于像蠶繭一般的“繭房”之中。

紙媒時代,我們同樣根據(jù)個人喜好來訂閱報紙和期刊,有人讀《知音》,有人看《人民日報》,它們也構(gòu)成一個個“繭房”。不論是紙媒時代的銷量,還是網(wǎng)媒時代的閱讀量,都是用戶主動選擇的結(jié)果。

推薦系統(tǒng)是一個會極度放大優(yōu)缺點的系統(tǒng),因此也極大地放大了我們對信息繭房的擔憂情緒。但正如書中所言,就算你跳得出算法分發(fā),也跳不出社交分發(fā);跳得出社交分發(fā),也跳不出自己的認知選擇邊界。“繭房”始終存在,真正過濾你的,是你的認知泡泡。

冷啟動:決定一篇內(nèi)容的命運

什么是冷啟動?一篇新內(nèi)容對推薦系統(tǒng)來說是完全陌生的,系統(tǒng)需要收集一定的曝光量和互動量(閱讀、評論、分享等)等基礎數(shù)據(jù)來進行后續(xù)的推薦。通過探索性展示,推薦系統(tǒng)完成從0到1基礎數(shù)據(jù)的積累過程,這就是冷啟動,其效果的好壞直接關系到后續(xù)的分發(fā)推薦。

在冷啟動過程中,如果內(nèi)容沒能得到足夠的正面反饋(點擊、閱讀、互動),系統(tǒng)就會認為這個內(nèi)容是不受歡迎的,為了控制負面影響,會逐步降低推薦量,也即冷啟動失敗;反之,內(nèi)容會被推薦系統(tǒng)快速放大,推薦量逐步提升,就可能成為爆款。于是有了“冷啟動決定一篇內(nèi)容的命運”的說法。

通過前文,不難理解內(nèi)容推薦流程中存在兩個關鍵節(jié)點:一是系統(tǒng)能夠準確識別;二是成功通過冷啟動。各平臺給自媒體小白的新手教程里,都會提到兩個重要因素:標題、封面

過機器這關,標題、封面就要易于機器識別和理解,諸如用詞避免歧義,使用英文要附中文解釋等技巧,需要創(chuàng)作者學習掌握。

對于冷啟動的考驗,由于“用戶只給你1秒鐘”,好的標題和封面便是關鍵。因此作者建議:如果點擊率太差,別廢話,回爐改封面和標題去。

因為冷啟動的關鍵作用,各平臺也開發(fā)了一些工具來提高冷啟動的成功率,比如雙標題、雙封面。有數(shù)據(jù)顯示,同樣內(nèi)容在不同標題+封面下,點擊率有很大的差異。雙標題、雙封面就是兩次冷啟動的機會,創(chuàng)作者要充分利用平臺提供的這些功能。

一篇內(nèi)容既要服務于機器,也要服務于人,只有這樣,你的內(nèi)容才能夠在推薦系統(tǒng)中獲得良好的分發(fā)量。當然,通過冷啟動只是第一步,后面還有閱讀體驗和運營水平的較量。

作者也是一名自媒體從業(yè)者,對于自媒體如何運營、如何變現(xiàn)、如何成長進化等話題,他結(jié)合案例進行了一一介紹,但限于本書體量,并不深入,權當入門了解。

結(jié)語

在《內(nèi)容算法》中,作者從推薦系統(tǒng)和自媒體兩個角度,介紹了內(nèi)容推薦算法的迭代應用與自媒體的發(fā)展。不管是平臺從業(yè)者、自媒體創(chuàng)作者,還是內(nèi)容消費者,都能對隱藏在界面背后復雜且精密的內(nèi)容推薦算法加深了解。

創(chuàng)作的繁榮、載體的多元、分發(fā)的進化,內(nèi)容信息消費在快速的發(fā)展和迭代過程中。但正如作者所言,一定有可以讓我們慢下來的東西——那是內(nèi)容的核。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容