當(dāng)技術(shù)遇到內(nèi)容

當(dāng)技術(shù)遇到內(nèi)容

知乎最近完成了C輪融資,估值3億美元,融資5000萬美元,此輪融資由騰訊領(lǐng)投,是否有跟投方目前尚未可知。而騰訊投資了知乎后,作為投資的條件之一,知乎正在和搜狗展開合作。什么合作呢?內(nèi)容搜索。

內(nèi)容#

前幾天為什么深圳會發(fā)生泥石流?有沒有救援的最新進(jìn)展?長時(shí)間健身可以一定程度上改變?nèi)菝矄??蒸汽朋克與賽博朋克的區(qū)別在哪里?高頻交易有哪些著名的算法?國內(nèi)有哪些冷門但是有特色的旅游景點(diǎn)?

當(dāng)前的新聞,人們關(guān)注的熱點(diǎn),我們發(fā)的微博,在網(wǎng)上寫的一些專業(yè)知識、生活經(jīng)驗(yàn)和人生見解,只要是互聯(lián)網(wǎng)上能看到的皆為內(nèi)容。

內(nèi)容社區(qū)是指通過內(nèi)容傳播的差異化,來順應(yīng)和促進(jìn)目標(biāo)受眾的分化與融合,形成彼此獨(dú)立,同時(shí)又交叉互補(bǔ)。簡單來講就是一個(gè)讓大家互相學(xué)習(xí),互相交流的地方,在知識爆炸的年代,內(nèi)容社區(qū)的發(fā)展尤為搶眼。

內(nèi)容的產(chǎn)生#

內(nèi)容的產(chǎn)生一般分為兩種模式:

UGC(User Generated Content) 用戶產(chǎn)生內(nèi)容。很早之前的一些博客和QQ空間,都是大家自己寫一些日常感悟,然后大家互相訪問,形成一種聯(lián)系。還有最近幾年比較火的問答式內(nèi)容社區(qū),大部分問題是用戶間互相答疑,如百度知道、直乎,但是現(xiàn)在UGC的模式一般不會單純的應(yīng)用到某一個(gè)內(nèi)容社區(qū)。

PGC(Professionally Generated Content)專家產(chǎn)生內(nèi)容。這個(gè)在以前一些健康社區(qū)或者類似這種專業(yè)性比較強(qiáng)的社區(qū)會采用這種模式,專家寫文章我們看,或者我們提問題專家來解答。還有微博的大V,也是PGC的模式。

說到這里前兩年某天的一個(gè)晚上,新浪微博高層召開了一個(gè)會議,集體決策微博后面的方向是以UGC為主還是以PGC為主,結(jié)論是PGC為主,所以大V的認(rèn)證就風(fēng)起云涌,普通用戶的模式就是關(guān)注一堆大V,然后刷微博就是去看這些大V發(fā)的內(nèi)容,然后評論,從這之后加上微信的誕生,微博漸漸讓普通用戶失去了興趣,各種KPI大幅下滑。

說個(gè)題外話,雖然微博的活躍用戶量急劇下滑,但是微博的PGC和“猜你感興趣的用戶推薦”功能誕生,讓微博重新注入了一些活力。PGC加上這個(gè)新功能,會讓我們很容易找到感興趣領(lǐng)域里面的牛人,而且有些牛人是很愿意在微博上分享一些東西的。對于專業(yè)性強(qiáng)的領(lǐng)域,微博還是占有一席之地。但是相對于知乎來講,微博貌似又略顯遜色。

那到底是用UGC還是用PGC,內(nèi)容社區(qū)的生態(tài)與技術(shù)又有什么關(guān)系呢?我們先看一下知乎是怎么做的。

知乎#

知乎從2010年12月19日開始運(yùn)轉(zhuǎn),其間用戶內(nèi)測40多天,2011年1月26日上線。2011年3月,知乎宣布獲得創(chuàng)新工場天使輪投資。

早期如何積累用戶##

做一家內(nèi)容社區(qū),人氣是決定成敗最關(guān)鍵的因素之一。知乎又是如何從0到1地聚集人氣呢?

最開始,直乎的創(chuàng)始人從自己的圈子里邀請那些最具有分享精神和專業(yè)知識的朋友加入知乎,先給每位測試用戶寫一封介紹郵件,然后再發(fā)送注冊邀請(知乎在很長一段時(shí)間里一直在使用邀請注冊制),等他們使用了一段時(shí)間后,再收集用戶反饋。綠洲在沙漠里不干涸的唯一方法,就是面積要足夠大。如何做到足夠大?知乎必須保證最初的水源(種子用戶)不會輕易就蒸發(fā)掉。

知乎創(chuàng)始人周源解釋稱,其實(shí)人們通常以為的那些忙到只會埋頭工作的人,往往是最愿意花大量時(shí)間表達(dá)自己想法的人。而最初的用戶,以國內(nèi)IT、互聯(lián)網(wǎng)創(chuàng)投圈的精英人士為主。其中創(chuàng)業(yè)者的比例較大——?jiǎng)?chuàng)業(yè)者的問題特別多又特別廣泛,很自然地就會把很多東西串聯(lián)在一起。

據(jù)說,最初經(jīng)歷了幾十天蟄伏后,知乎已經(jīng)有了200多位用戶,首批綠洲建造者中既有像李開復(fù)、王興、王小川、徐小平和馬化騰這樣的富有創(chuàng)新精神的企業(yè)家和風(fēng)險(xiǎn)投資家,也有一批雖然名不見經(jīng)傳但在各自專業(yè)領(lǐng)域相當(dāng)優(yōu)秀的開拓者。據(jù)說,在知乎上線后的前40天,他們就創(chuàng)造了8000個(gè)問題和2萬個(gè)回答。

有大的投資機(jī)構(gòu)引入的(李開復(fù)就是創(chuàng)新工廠的創(chuàng)始人也是知乎的投資人)資源和創(chuàng)始團(tuán)隊(duì)本身積累的一些資源能給創(chuàng)業(yè)公司帶來非常多的益處,知乎就利用這些資源很好的解決了冷啟動(dòng)的問題。

現(xiàn)狀##

截至2015年7月,官方統(tǒng)計(jì)的數(shù)據(jù)如下

注冊用戶 29,000,000
問題總數(shù) 6,130,000
月獨(dú)立用戶 110,000,000
回答總數(shù) 19,190,000
月頁面瀏覽 300,000,000
全站回答次數(shù) 4,129,000,000

技術(shù)面的應(yīng)用##

在今年的一次大數(shù)據(jù)會議上,知乎提到在技術(shù)方面做了如下的事情:

  1. 提取出用戶行為數(shù)據(jù),對于用戶的興趣和擅長有了比較準(zhǔn)確的識別;
  2. 答案排序算法讓高質(zhì)的回答排在前面,給予用戶正面的鼓勵(lì),激發(fā)用戶解答問題的熱情;
  3. 開發(fā)出基于用戶行為分析的防Spammer系統(tǒng)(垃圾內(nèi)容過濾):悟空。
  4. 邀請回答(通過相關(guān)算法預(yù)測某個(gè)用戶回答某問題的可能性和回答質(zhì)量,有 90% 的邀請是通過這種推薦結(jié)果發(fā)出的);
  5. 每周精選,針對每個(gè)用戶做個(gè)性化的計(jì)算,已經(jīng)做到了30%的打開率和14%的點(diǎn)擊率;
  6. 相關(guān)問題(通過大數(shù)據(jù)分析把類似的問題展示給用戶)。

這里拿第2 點(diǎn)來講一下,先說答案排序這個(gè)功能,該功能對于用心去回復(fù)問題的人有非常大的鼓勵(lì),對于知乎有如此高的活躍用戶留存率(14個(gè)月82.8%)功不可沒。

隨著用戶量的不斷增加,早期的簡單排序算法出現(xiàn)了問題,友情贊同比較多,讓專業(yè)性不足的答案被推到了靠前的位置。后來知乎采用了威爾遜得分算法并做了一些自定義的更新來進(jìn)行答案的排序。

該算法的核心思想是:如果把一個(gè)回答展示給很多人看并讓他們投票,內(nèi)容質(zhì)量不同的回答會得到不同比例的贊同和反對票數(shù),最終得到一個(gè)反映內(nèi)容質(zhì)量的得分。當(dāng)投票的人比較少時(shí),可以根據(jù)已經(jīng)獲得的票數(shù)估計(jì)這個(gè)回答的質(zhì)量得分,投票的人越多則估計(jì)結(jié)果越接近真實(shí)得分。如果新一個(gè)回答獲得了 1 票贊同 0 票反對,也就是說參與投票的用戶 100% 都選了贊同,但是因?yàn)閿?shù)量太少,所以得分也不會太高。如果一小段時(shí)間后這個(gè)回答獲得了 20 次贊同 1 次反對,那么基于新算法,我們就有較強(qiáng)的信心把它排在另一個(gè)有 50 次贊同 20 次反對的回答前面。原因是我們預(yù)測當(dāng)這個(gè)回答同樣獲得 50 次贊同時(shí),它獲得的反對數(shù)應(yīng)該會小于 20。

威爾遜得分算法最好的特性就是,即使前一步錯(cuò)了,現(xiàn)在這個(gè)新回答排到了前面,獲得了更多展示,在它得到更多投票后,算法便會自我修正,基于更多的投票數(shù)據(jù)更準(zhǔn)確地計(jì)算得分,從而讓排序最終能夠真實(shí)地反映內(nèi)容的質(zhì)量。

過多的營銷不如讓自己的用戶得到真正的尊重,知乎通過這些技術(shù)手段做到了。相比于知乎的精細(xì)化處理,某度可真需要放點(diǎn)心思在上面了。

搜狗能帶來什么#

知乎現(xiàn)在有知乎日報(bào)會推送當(dāng)下流行、和用戶感興趣的一些東西,但是對于內(nèi)容社區(qū)用戶一個(gè)非常大的需求就是當(dāng)用戶碰到一個(gè)問題,針對問題直接去找答案,如果能快速的找到最高質(zhì)的答案將會給用戶帶來很大的愉悅感,對用戶留存會有非常積極的影響。

在上一節(jié)里面提到的6點(diǎn)里面沒有與搜索相關(guān)的內(nèi)容,看來知乎以前在這方面確實(shí)有所不足,有些用戶直接指出知乎的站內(nèi)搜索功能為零,而且國內(nèi)某度的搜索,基本會把自家問答、經(jīng)驗(yàn)類產(chǎn)品的答案排在最前,知乎的高質(zhì)內(nèi)容很難被發(fā)現(xiàn)。

引入搜狗搜索技術(shù)之后,知乎站內(nèi)搜索的DCG評測(Discounted cumulative gain,它是一個(gè)衡量搜索引擎算法的指標(biāo))評分已經(jīng)從0.39提升至0.64,增幅顯著,而知乎用戶的反饋也直接印證了這一效果。發(fā)布會當(dāng)天,知乎上即出現(xiàn)了多條評價(jià)搜索效果的問題,知乎產(chǎn)品負(fù)責(zé)人也公開表示希望大家就搜索體驗(yàn)多提意見。參與討論的用戶中,九成以上都給予了“以前搜不到的內(nèi)容現(xiàn)在可以輕松搜到了”、“感覺靠譜了非常多”、甚至是“天亮了”之類表示滿意的回復(fù)。

起碼從現(xiàn)在看起來,這次合作是雙贏的。

反饋

當(dāng)技術(shù)遇到內(nèi)容#

從知乎的案例可以看出,知乎是一家名副其實(shí)的技術(shù)公司,知乎采用了大量的技術(shù)手段去對內(nèi)容做分析,對內(nèi)容的排序、推薦等算法不斷的做優(yōu)化,加上這次新增的內(nèi)容搜索技術(shù),這些技術(shù)應(yīng)用的目的是真正的讓自己的用戶得到尊重。

讓我們再來回顧一下知乎的發(fā)展歷程:

  1. 前期為了避免冷啟動(dòng),運(yùn)用投資人和創(chuàng)始人的人脈資源去讓一些互聯(lián)網(wǎng)專家做內(nèi)容輸出,這就是文章開頭所說的PGC;
  2. 通過PGC輸出的高質(zhì)內(nèi)容吸引到大量的新戶,其中也包含有相關(guān)領(lǐng)域的專家,這時(shí)UGC已經(jīng)慢慢成為主導(dǎo)了,用大數(shù)據(jù)分析,優(yōu)化各種算法來讓新戶輸出的高質(zhì)內(nèi)容得到推到首頁、置頂?shù)莫?jiǎng)勵(lì),同時(shí)也通過技術(shù)手段屏蔽了大量的垃圾內(nèi)容。這樣在吸引更多新戶的同時(shí),也最大限度保證了用戶的留存;
  3. 正確認(rèn)識到自己有內(nèi)容搜索的軟肋,敞開大門和搜狗合作,錦上添花;

除了熱啟動(dòng)動(dòng)用了必不可少的人脈資源外,技術(shù)在知乎的整個(gè)運(yùn)營過程當(dāng)中占了非常大的比重,也起了關(guān)鍵性的作用。所以對于內(nèi)容社區(qū)來講,利用強(qiáng)大的技術(shù)做背后支撐是必不可少的。

我相信不管是知乎還是其他內(nèi)容社區(qū),只要不斷的關(guān)注用戶本身的需求,本身的感受,把高質(zhì)內(nèi)容過多的給予曝光,給用戶以尊重,對這件事情給予充分的認(rèn)真,你就贏了。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容