《騰訊全球合作伙伴2017大會(huì)白皮書》AI解讀之一:內(nèi)容IGC

題圖

文·HCY崇遠(yuǎn)

01 寫在之前

2017年11月08號(hào),騰訊全球合作伙伴大會(huì)2017在成都舉行,別誤會(huì),俺不在現(xiàn)場(chǎng),雖然我也很想去看看,當(dāng)時(shí)的我在大深圳某個(gè)旮旯里打代碼。但通過(guò)一個(gè)貌似親臨現(xiàn)場(chǎng)的朋友的資料轉(zhuǎn)發(fā),所以我?guī)缀踉诘谝粫r(shí)間里拿到了這份騰訊全球合作伙伴大會(huì)2017的資料,又名《2017互聯(lián)網(wǎng)科技創(chuàng)新白皮書》。

當(dāng)時(shí)的我只是好奇翻開(kāi)瀏覽了幾頁(yè),結(jié)果深深不能自拔,在我還尚未看完的情況下,急急轉(zhuǎn)發(fā)到了好幾個(gè)群里,我認(rèn)為,好東西應(yīng)該分享。

作為中國(guó)數(shù)一數(shù)二的科技公司,騰訊終于繼百度ALL IN AI,阿里宣布全面進(jìn)入大數(shù)據(jù)時(shí)代之后,宣布其AI開(kāi)放戰(zhàn)略,在我看來(lái)其實(shí)并不算意外,遲早要玩的嘛。在我看來(lái),現(xiàn)在言談AI威脅論、言及AI時(shí)代尚為時(shí)過(guò)早,但是,如果此時(shí)不上車,那就是為時(shí)已晚了。

所以,在這次的技術(shù)白皮書中,必然涉及了大量的AI相關(guān)的信息,而整個(gè)白皮書總共200多頁(yè),可謂是制作精良。誠(chéng)然,由于PR需求,書中必然會(huì)夾帶著騰訊的私貨,但并不妨礙我們摘取其中有用的部分,特別是一些AI發(fā)展的方向,技術(shù)的趨勢(shì)。

這點(diǎn)在我看來(lái),尤為需要重視,這是為什么呢?我曾不止在一篇文中提到過(guò),大數(shù)據(jù)以及AI想要達(dá)到產(chǎn)業(yè)變革性的地步,唯有走向線下、走向傳統(tǒng),而擁有將互聯(lián)網(wǎng)貫通線下線下,打通線上線下數(shù)據(jù)的,只有國(guó)內(nèi)一線的大公司、也唯有一線的大公司,諸如BAT、甚至包括類似京東順豐這樣的企業(yè)。

那么,以這個(gè)邏輯看,他們的技術(shù)導(dǎo)向,也將決定了國(guó)內(nèi)大部分的領(lǐng)先技術(shù)的走向、AI落地的節(jié)奏等等,所以,騰訊這次提供的技術(shù)白皮書對(duì)于那些想要對(duì)AI發(fā)展趨勢(shì)一窺的朋友來(lái)說(shuō),值得一觀。

說(shuō)完寫這個(gè)系列的緣由,我們?cè)賮?lái)說(shuō)說(shuō),為什么第一篇寫“內(nèi)容IGC”,原因很簡(jiǎn)單,利益相關(guān),我們正在做類似的事情,所以感觸頗大,就拿出來(lái)先說(shuō)說(shuō)事了。

02 AI能創(chuàng)作嗎?

說(shuō)IGC之前,先來(lái)聊一個(gè)話題,不知道大家對(duì)機(jī)器人寫作持什么樣的觀點(diǎn)。你認(rèn)為通過(guò)AI手段,機(jī)器真的能幫助我們創(chuàng)作嗎?注意,是創(chuàng)作,不是簡(jiǎn)單的寫出來(lái)就好了。

或許我們從一些其他途徑或多或少聽(tīng)過(guò)機(jī)器創(chuàng)作的一些例子,比如,騰訊機(jī)器人Dreamwriter實(shí)現(xiàn)機(jī)器寫稿,最早出現(xiàn)是2016年里約奧運(yùn)會(huì)寫冠軍簡(jiǎn)報(bào)的時(shí)候,這個(gè)騰訊在白皮書中也有著重提到過(guò)。這算AI創(chuàng)作嗎?

又比如,之前《錦繡未央》火起來(lái)之后,被十多位作家聯(lián)名狀告抄襲,之后又隨之報(bào)道出《寫作神器,日更3萬(wàn),抄300本書不是夢(mèng)》。網(wǎng)絡(luò)小說(shuō)寫作神器,隨之大火。小說(shuō)寫作神器,這算AI創(chuàng)作嗎?

又比如,早一段時(shí)間,微軟小冰又放大招了,小冰更名為了“少女詩(shī)人小冰”,額,是的,小冰會(huì)寫詩(shī)了,上傳一張圖片,小冰會(huì)根據(jù)圖片進(jìn)行詩(shī)歌創(chuàng)作,還像模像樣的。這算AI創(chuàng)作嗎?

在我看來(lái),這都不算創(chuàng)作,我不記得有誰(shuí)說(shuō)過(guò)來(lái)著,在未來(lái),AI能替代人類很大一部分工作,但有一種工作很難替代,那就是藝術(shù)的創(chuàng)作。在我理解,不止是藝術(shù),只要是能夠稱得上創(chuàng)作的東西,對(duì)于AI來(lái)說(shuō),很難,最起碼目前階段很難。

以騰訊的Dreamwriter來(lái)說(shuō),目前它已經(jīng)寫出了XX字的稿件的了,這沒(méi)毛病,但是在我看來(lái)阿D寫的那些財(cái)經(jīng)簡(jiǎn)訊以及體育簡(jiǎn)訊,最多就算寫作,離創(chuàng)作這個(gè)詞遠(yuǎn)著呢。那些東西,目前也就是僅僅能夠做到快速進(jìn)行資訊瀏覽、達(dá)到獲取信息的目的而已,離藝術(shù)、離聲情并茂、離風(fēng)格個(gè)性還遠(yuǎn)著呢,你讓它寫個(gè)像我這篇瀟灑的文字試試?(哈哈,臉不紅)

而所謂的網(wǎng)絡(luò)小說(shuō)寫作神器,那就更不堪了,依托于大量的素材庫(kù),以及素材打標(biāo),設(shè)置好的橋段寫作模板,通過(guò)完善的標(biāo)簽體系以及規(guī)則模型,輸出各種小說(shuō)套路情節(jié),實(shí)在難以把它論之為AI創(chuàng)作,不細(xì)談。

少女詩(shī)人小冰,看似是最像AI創(chuàng)作的東西了,寫詩(shī)嘛,詩(shī)都不算藝術(shù),難道你打的代碼是藝術(shù)?小冰寫詩(shī)的核心邏輯是,通過(guò)深度學(xué)習(xí)學(xué)習(xí)了1920年以來(lái)519位詩(shī)人的作品,反復(fù)迭代訓(xùn)練了10000多次。但實(shí)際上,小冰寫的東西雖然偶有“佳作”,但很多時(shí)候?qū)懗鰜?lái)所謂的“詩(shī)”,也僅僅只是表面押韻、對(duì)仗工整,但細(xì)究卻狗屁不是。

為什么會(huì)出現(xiàn)這種情況,因?yàn)楸举|(zhì)來(lái)說(shuō),少女詩(shī)人小冰的輸出依然不是它自己的東西,只是那519位詩(shī)人作品的重組再輸出而已,他圈子里很難脫離這個(gè)范圍,原則上依然是個(gè)經(jīng)驗(yàn)學(xué)習(xí)的過(guò)程,與阿D寫財(cái)經(jīng)體育簡(jiǎn)訊并沒(méi)有什么本質(zhì)的區(qū)別。而外在區(qū)別在于簡(jiǎn)訊的信息解構(gòu)、以及信息的重組會(huì)更簡(jiǎn)單,詩(shī)就沒(méi)這么容易了。所以,在我看來(lái),不是付諸于情感、藝術(shù)、以及個(gè)性化的文化輸出,AI很難做到創(chuàng)作,最起碼目前很難做到。

03 什么是內(nèi)容IGC?

回到內(nèi)容IGC的話題,既然AI難以做到創(chuàng)作,那么正如白皮書中所說(shuō)的,算法完全介入內(nèi)容生產(chǎn)可能是個(gè)偽命題。那么AI在內(nèi)容生產(chǎn)的維度上是不是就無(wú)計(jì)可施了呢?

不是的,正是本文核心想要表達(dá)的,人機(jī)協(xié)作IGC(Intelligence-generated Content)生產(chǎn)模式。

人和機(jī)器協(xié)同生產(chǎn)的狀態(tài),可以歸為兩種方式:

一是機(jī)器替代人類部分工作,將重復(fù)性、規(guī)范寫作和客觀數(shù)據(jù)聚合類勞動(dòng)用機(jī)器替代,致力于幫助內(nèi)容創(chuàng)作者減少重復(fù)性勞動(dòng),節(jié)省更多精力去撰寫更加優(yōu)質(zhì)的內(nèi)容。

二是機(jī)器服務(wù)人類生產(chǎn)內(nèi)容,人工智能可以通過(guò)語(yǔ)料、素材與數(shù)據(jù)的搜集處理與高效率加工等完成內(nèi)容生產(chǎn)工作,內(nèi)容生產(chǎn)者在基礎(chǔ)上充分發(fā)揮人類的演繹、推理和聯(lián)想的能力,從而完成更深層次的內(nèi)容處理工作。

通過(guò)這兩種模式能夠?qū)C(jī)器和人有機(jī)的結(jié)合起來(lái),使得內(nèi)容生產(chǎn)流程和組織結(jié)構(gòu)更加的靈活高效。

以上為摘自引用部分解釋,摘自騰訊白皮書。我認(rèn)為寫的很落地,事兒也很明白,AI創(chuàng)作從目前看真的還有點(diǎn)距離,那么退而求其次,通過(guò)AI來(lái)輔助創(chuàng)作,這事是可以的,并且是可以落地的。

比如,上面說(shuō)的第一種情況,其實(shí)就是騰訊的阿D正在做的事,那些體育、財(cái)經(jīng)類的簡(jiǎn)訊其實(shí)就是規(guī)范寫作、以及客觀的進(jìn)行數(shù)據(jù)聚合。那么,有意義嗎?屁話,當(dāng)然有意義了,機(jī)器能夠?qū)崟r(shí)監(jiān)控海量數(shù)據(jù)源,然后識(shí)別有意義的信息,快速進(jìn)行重組再輸出,形成簡(jiǎn)訊,讓你以最快的速度了解到事情的過(guò)程。

那么,這個(gè)簡(jiǎn)訊看著刻板嗎?好像是有點(diǎn)。那么簡(jiǎn)訊的信息有有用嗎?好像是有的。那不就得了,你試試人工盯著幾十個(gè)數(shù)據(jù)源網(wǎng)站,然后實(shí)時(shí)的判斷信息對(duì)平臺(tái)是否有用,如果有用,快速的進(jìn)行簡(jiǎn)訊報(bào)道,這事兒你玩的過(guò)機(jī)器嗎?所以,是有用的。

而對(duì)于第二種情況來(lái)說(shuō),那就是我?guī)ьI(lǐng)我們數(shù)據(jù)團(tuán)隊(duì)在做的一個(gè)事兒了。

04 數(shù)據(jù)、算法輔助人類高效進(jìn)行創(chuàng)作

首先說(shuō)一下簡(jiǎn)單背景,我們是SEE,提供微信生態(tài)中電商服務(wù)、知識(shí)付費(fèi)服務(wù),以及數(shù)據(jù)服務(wù)。

撇開(kāi)電商跟知識(shí)付費(fèi)不說(shuō),對(duì)于微信生態(tài)中,數(shù)據(jù)能提供什么服務(wù)呢?或者說(shuō)我們的數(shù)據(jù)能提供什么服務(wù)呢?2017年6月30,槽邊往事的和菜頭曾推了一篇文章《也談公眾號(hào)的衰落》,提到過(guò)。

選題是個(gè)技術(shù)問(wèn)題,而不再是經(jīng)驗(yàn)問(wèn)題。

沒(méi)有數(shù)據(jù)支撐的選題,再多的經(jīng)驗(yàn)也沒(méi)用。

內(nèi)容創(chuàng)作同樣需要升級(jí),尤其是在微信公眾號(hào)的領(lǐng)域內(nèi),需要理科生,尤其是技術(shù)人員的卷入,需要他們提供新的生產(chǎn)工具,需要他們提供新的創(chuàng)造方式。

其實(shí)在我看來(lái),和菜頭的這個(gè)觀點(diǎn),與當(dāng)前時(shí)代的基于AI的IGC思維是一樣的,在人的經(jīng)驗(yàn)逐漸被壓縮的情況下,依賴于數(shù)據(jù)、依賴于算法進(jìn)行內(nèi)容的生產(chǎn)創(chuàng)作,這事是可行的,也是有市場(chǎng)的。

由于我司是做微信自媒體商業(yè)變現(xiàn)的嘛,所以或多或少的與不少公眾號(hào)自媒體聊過(guò),其中不乏篇篇10萬(wàn)+的大號(hào),目前他們遇到了一個(gè)很大的難題就是,選題,以及圍繞選題的素材獲取,行文如何組織等等,為此,甚至很多自媒體團(tuán)隊(duì)養(yǎng)了一大推兼職,成天就在網(wǎng)上蕩,收集熱點(diǎn)素材,最后統(tǒng)一加工整理。繁瑣、低效,而且還未必好使。

而我們團(tuán)隊(duì)現(xiàn)在正在為微信自媒體們做的一個(gè)事就是,捕獲微信生態(tài)的熱點(diǎn)、預(yù)測(cè)熱點(diǎn)的走勢(shì),解構(gòu)熱點(diǎn)的組成、各種要素,還原事件,提供精準(zhǔn)的素材以及自動(dòng)化的創(chuàng)作策略。是的,我們不提供AI創(chuàng)作,但是通過(guò)數(shù)據(jù)、算法提供你創(chuàng)作所需要的一切,讓你能夠在最快最合適的點(diǎn),以最合適的姿勢(shì)切入,吸引粉絲的注意。

基于詞,我特地使用內(nèi)部的系統(tǒng)工具,來(lái)證明及時(shí)捕獲熱點(diǎn),是比較容易打造爆款文章的,為此還寫了一篇有理有據(jù)的理科生文章《數(shù)據(jù)化自媒體決策,告別拍腦袋的時(shí)代》。

對(duì)于創(chuàng)作,追逐熱點(diǎn)是所有粉絲的天性,這也就是為何現(xiàn)在很多自媒體很喜歡蹭熱點(diǎn),蹭熱點(diǎn)沒(méi)毛病,但是你需要蹭對(duì)熱點(diǎn),以及在合適的時(shí)機(jī)蹭,以及怎么蹭都是學(xué)問(wèn),數(shù)據(jù)+算法能夠解決一部分這些問(wèn)題,從而幫助自媒體提升創(chuàng)作的效率。

我有幸,能夠帶著團(tuán)隊(duì)做這件有意義并且更落地的事情,而為數(shù)據(jù)找到落地著陸點(diǎn),是我們每一個(gè)大數(shù)據(jù)從業(yè)者需要思考的問(wèn)題,我們需要做大數(shù)據(jù)的布道者、推動(dòng)者,推動(dòng)時(shí)代往數(shù)據(jù)時(shí)代轉(zhuǎn)變!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容