桑文峰講大數(shù)據(jù)原理應(yīng)用、閆澤華講大數(shù)據(jù)分發(fā),2本同時(shí)看更香

今天來說一下2本書《走進(jìn)內(nèi)容推薦時(shí)代:寫給內(nèi)容行業(yè)從業(yè)者的推薦分發(fā)入門書》、《數(shù)據(jù)驅(qū)動(dòng):從方法到實(shí)踐》

為什么兩本書一起做評(píng)價(jià)?

兩本書作者有相似的經(jīng)歷。

內(nèi)容有一些共同點(diǎn),用這個(gè)書評(píng)來整理一下。

最重要的是一個(gè)系統(tǒng)的書籍,兩本書底層邏輯是關(guān)于大數(shù)據(jù)、算法的。

兩本書的結(jié)構(gòu)


從結(jié)構(gòu)上來看,2本書很難建立關(guān)聯(lián),但

仔細(xì)讀完里面的章節(jié),會(huì)發(fā)現(xiàn)他們有很多相同的知識(shí)點(diǎn)。目前我思考出5個(gè)維度。歡迎大家補(bǔ)充。

5個(gè)維度上來看這2本書

1、算法大數(shù)據(jù)內(nèi)容

算法會(huì)導(dǎo)致“信息繭房”,而好的算法可以提高業(yè)務(wù)指標(biāo)(百度知道回答量提升7.5%案例),拋開信息本身,百度知道用于拓展新用戶,用好的算法給新用戶推薦他們有可能感興趣的內(nèi)容(在2007年這個(gè)思路還是很先進(jìn)的)。優(yōu)化算法>更精準(zhǔn)的內(nèi)容匹配>不斷拓展邊界,這也是平臺(tái)、分發(fā)服務(wù)上要做的,在用戶對(duì)信息對(duì)內(nèi)容的現(xiàn)有訴求上,勇于探索其他機(jī)會(huì)點(diǎn),而這個(gè)機(jī)會(huì)點(diǎn)隨著數(shù)據(jù)量的豐富、內(nèi)容的挖掘,會(huì)變得越來越有效。

2、平臺(tái)視角——關(guān)于算法和推薦

由于作者背景,在這2本書中,他們用平臺(tái)的視角在思考和寫作。而這點(diǎn)對(duì)于沒有在百度和今日頭條經(jīng)歷的,在這本書中會(huì)領(lǐng)域到。


關(guān)于數(shù)據(jù)驅(qū)動(dòng)決策

數(shù)據(jù)驅(qū)動(dòng)這類是新概念,以前大家習(xí)慣叫做數(shù)據(jù)分析。桑的書籍中四個(gè)決策:產(chǎn)品改進(jìn)、運(yùn)營(yíng)優(yōu)化、營(yíng)銷分析、商業(yè)決策。

個(gè)性化的好,是生意。

好的個(gè)性化,是理想。

個(gè)性化的好,是不斷追求數(shù)據(jù)指標(biāo)。在技術(shù)水平不足以支撐目標(biāo)的時(shí)候,就越來越容易圍繞馬斯洛需求模型的塔座轉(zhuǎn)圈。所以,我們才看到網(wǎng)絡(luò)上會(huì)有那么多調(diào)侃“××驚訝體”“××愛國(guó)體”的內(nèi)容。

而好的個(gè)性化,是需要克制欲望的,需要引入更多維度的人工評(píng)估進(jìn)行決策權(quán)衡,以可量化的短期指標(biāo)損失來保證不能輕易量化的消費(fèi)體驗(yàn)。


既然說到平臺(tái)視角,我也在用戶視角思考了下:

我一直用的統(tǒng)計(jì)類產(chǎn)品(百度統(tǒng)計(jì))是用戶視角,如何和這個(gè)平臺(tái)視角結(jié)合起來呢?

作為國(guó)內(nèi)第二批站長(zhǎng),第一批自媒體人員,從業(yè)中貌似缺少平臺(tái)思維,沒做好原因之一

3、數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品內(nèi)容

提到大數(shù)據(jù),肯定少不了數(shù)據(jù)驅(qū)動(dòng)這一理念,神策作為一個(gè)提供數(shù)據(jù)服務(wù)的公司,數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品測(cè),他們有不少案例,書中很大章節(jié)也在圍繞數(shù)據(jù)驅(qū)動(dòng)這個(gè)點(diǎn)展開,其核心理念是他們的幾個(gè)模型:

行為事件分析

漏斗分析

留存分析

分布分析

點(diǎn)擊分析

用戶路徑

用戶分群

屬性分析

閆在書中,也提到數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品、數(shù)據(jù)驅(qū)動(dòng)內(nèi)容的知識(shí)點(diǎn)。如平臺(tái)側(cè)如何通過大數(shù)據(jù)反饋優(yōu)化分發(fā)規(guī)則,內(nèi)容側(cè)通過數(shù)據(jù)反饋來做規(guī)劃(案例如下)

數(shù)據(jù)分析輔助內(nèi)容創(chuàng)作在國(guó)外最典型的樣本非BuzzFeed(一家美國(guó)新聞聚會(huì)網(wǎng)站)莫屬了。員工總數(shù)逾千人,擁有全球新聞團(tuán)隊(duì)、自己的視頻制作工作室、尖端數(shù)據(jù)運(yùn)算中心和內(nèi)部創(chuàng)意廣告機(jī)構(gòu),每月全網(wǎng)超過50億次閱讀——這就是BuzzFeed,怎么看都是一個(gè)龐大的媒體集團(tuán)。然而,當(dāng)我們深入了解BuzzFeed的工作流程后就會(huì)發(fā)現(xiàn),與其說它是一家媒體公司,不如說它是一家科技公司?!皵?shù)據(jù)驅(qū)動(dòng)內(nèi)容創(chuàng)作”,是BuzzFeed給自己貼上的標(biāo)簽。

4、用戶畫像上的觀點(diǎn)

內(nèi)容畫像、數(shù)據(jù)畫像是大數(shù)據(jù)的本質(zhì)。閆提到推薦的起點(diǎn):斷物識(shí)人,識(shí)人就是用戶畫像。

桑的書中更近一層:用戶智能

5、兩本書提到的分發(fā)

閆澤華的書中關(guān)于分發(fā)的內(nèi)容隨處可見,而桑文峰則是在個(gè)性化推薦系統(tǒng)的架構(gòu)的角度上去說的??梢哉f了解分發(fā)的前因后果,把這2本書結(jié)合起來看會(huì)更好(本文只做重點(diǎn)提煉,后續(xù)會(huì)對(duì)這個(gè)維度單獨(dú)寫幾篇感想)。

重點(diǎn):以短視頻推薦案例為例,我們通過神策分析對(duì)這個(gè)短視頻產(chǎn)品的業(yè)務(wù)數(shù)據(jù)做了一些簡(jiǎn)單的分析,用于指導(dǎo)我們后續(xù)的策略研發(fā)。這些分析指標(biāo)包括活躍用戶量、視頻量、視頻平均播放次數(shù)、視頻平均觀看時(shí)長(zhǎng)等。從這個(gè)分析中,我們得到了一個(gè)初步的結(jié)論,對(duì)比每日眾多的活躍用戶量,相當(dāng)比例的視頻的播放次數(shù)非常有限,為長(zhǎng)尾冷門視頻。因此,在進(jìn)行個(gè)性化推薦時(shí),我們會(huì)嘗試激活其中的高質(zhì)量視頻,同時(shí)也會(huì)挖掘熱門視頻,吸引用戶觀看產(chǎn)生更多的行為,以便后續(xù)業(yè)務(wù)迭代升級(jí)。與此同時(shí),在這個(gè)分析過程中,我們也確定了此次個(gè)性化推薦的評(píng)價(jià)體系,也是日后迭代優(yōu)化的目標(biāo),即從視頻平均觀看時(shí)長(zhǎng)、用戶留存、視頻播放CTR(Click★rough Rate,點(diǎn)擊通過率)這幾個(gè)指標(biāo)來衡量。

這里提到一點(diǎn):用戶分群、還是內(nèi)容分群,這就涉及到推薦分發(fā)的2個(gè)常見模型:

基于用戶:

基于內(nèi)容:

附錄:

搜索引擎部分,雖然內(nèi)容比較少。

自媒體的部分,暫做簡(jiǎn)單的提煉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容