讀《智能革命:迎接人工智能時代的社會、經(jīng)濟與文化變革》

一直以來對百度的印象都不是很好,其在商業(yè)上的諸多行徑,與谷歌的“不作惡”的高姿態(tài)形成的極大的反差。錙銖必較未嘗是壞事,但有違商業(yè)倫理與道德就另當(dāng)別論了。

傳統(tǒng)的印象與口碑中,百度就是一個利用不平等競爭形成的有限壟斷市場中肆意妄為的反面典型。反觀阿里巴巴,由于有馬云加持,所有的新技術(shù)研發(fā)和市場延展都獲得了很好的正向關(guān)注。但讀了這本書以后,我也是對百度在技術(shù)前瞻性研發(fā)和市場應(yīng)用,又有了新的認(rèn)識。不由感嘆,有資源還是好啊。

當(dāng)然,這不是讀這本書的目的。

全書中,李彥宏通過闡述他和百度團隊對AI智能的理解和實踐,讓我對AI應(yīng)用邏輯和場景應(yīng)用有了更深入的理解。

這段時間分別拜讀了吳軍老師(Google)、王堅博士(阿里巴巴)、王延峰(上海交大)和李彥宏(百度)的書,也算是交叉學(xué)習(xí)比較完整了。


這本書的兩個序言的作者倒是很有意思,一個是著名的科幻作家劉慈欣,一個是百度AI。AI跟科幻到底有多遠,又有多近?在這場革命中,是不是認(rèn)知限制了我們的邊界?


本書中提及2012年颶風(fēng)致紐約大面積停電,而高盛空蕩的大樓卻燈火通明(引起非議)。與吳軍老師提到的“2%的人將控制世界”,也算一種呼應(yīng)吧。

作者簡介:

李彥宏,百度公司創(chuàng)始人、董事長兼首席執(zhí)行官,所持有的“超鏈分析”技術(shù)專利,是奠定整個現(xiàn)代搜索引擎發(fā)展趨勢和方向的基礎(chǔ)發(fā)明之一。


書摘:

01簡史:互聯(lián)網(wǎng)風(fēng)云背后的人工智能生長


SMT(統(tǒng)計機器翻譯),基本思想是通過對大量的平行語料進行統(tǒng)計分析,找出常見的詞匯組合規(guī)則,盡量避免奇怪的短語組合。

NMT(基于神經(jīng)網(wǎng)絡(luò)的翻譯)。

SMT以前用的都是局部信息,處理單位是句子切開以后的短語,最后解碼時將幾個短語的譯文拼接在一起,并沒有充分利用全局信息。NMT則利用了全局信息,首先將整個句子的信息進行編碼(類似人在翻譯時通讀全句),然后才根據(jù)編碼信息產(chǎn)生譯文。


在這種機器翻譯的模式中,人類要做的不是親自尋找浩繁的語言規(guī)則,而是設(shè)定數(shù)學(xué)方法,調(diào)試參數(shù),幫助計算機網(wǎng)絡(luò)自己尋找規(guī)則。人類只要輸入一種語言,就會輸出另一種語言,不用考慮中間經(jīng)過了怎樣的處理,這就叫作端到端的翻譯。這種方法聽起來挺神奇,其實概率論里的貝葉斯方法、隱馬爾科夫模型等都可以用來解決這個問題。


蒙特卡洛樹形搜索是對以往決策樹算法的優(yōu)化。


蒙特卡洛方法就體現(xiàn)了概率學(xué)的精妙。


作為百度大腦的云化,百度天算、天像、天工和天智平臺相繼向全社會全面開放百度大腦的技術(shù)和能力。


人工智能重在從混沌數(shù)據(jù)里發(fā)現(xiàn)總體“模式”,進而優(yōu)化生產(chǎn)、服務(wù)。翻譯、語音識別和圖像識別的進步就是最好


今天的人工智能思路與過去不同,變思維規(guī)則問題為數(shù)據(jù)問題和策略問題。過去人類總想為計算機設(shè)計出完美的邏輯,不斷把人類的種種邏輯規(guī)則抽象成函數(shù)之后輸入計算機里?,F(xiàn)在的人工智能主要基于大數(shù)據(jù)基礎(chǔ)和算法的進步。也就是說,今天人工智能的爆發(fā)恰恰建立在20世紀(jì)90年代末互聯(lián)網(wǎng)爆發(fā)的基礎(chǔ)上。


02人工智能的歷史使命:讓人類知道更多,做到更多,體驗更多


Knowmore,Domore,Bemore”。


通過神經(jīng)網(wǎng)絡(luò)計算的力量,下一波的人工智能技術(shù)可以在以下兩個維度提升目前的計算系統(tǒng):一是自動分層特征/表示學(xué)習(xí)。這是機器學(xué)習(xí)容量的實質(zhì)性提升,因為當(dāng)今機器學(xué)習(xí)工作的很大一部分關(guān)鍵在于特征工程。如百度大腦已經(jīng)擁有萬億級的參數(shù)、千億級的樣本和千億級的特征訓(xùn)練。二是高級認(rèn)知,特別是感知能力。這是下一代設(shè)備(如無人駕駛汽車)和下一代平臺(如自然語言會話)產(chǎn)生的巨大催化劑。


一是自動分層特征/表示學(xué)習(xí)。


二是高級認(rèn)知,特別是感知能力。


人工智能計算的另一個發(fā)展方向是組織各種服務(wù)于特定物理架構(gòu)和物理要素的系統(tǒng),如家、辦公室、工廠等的智能系統(tǒng)。其基本模式是通過使用物聯(lián)網(wǎng)傳感器的各種原始信號,人工智能的“感知系統(tǒng)”會對物理架構(gòu)進行識別和感知;而“認(rèn)知系統(tǒng)”需要組織信息和學(xué)習(xí)更多關(guān)于物理架構(gòu)的知識,并去預(yù)測、判斷和決策,以使各類物理系統(tǒng)更加智能。


在科研領(lǐng)域,人工智能計算可以提供更先進的建模能力,成為多領(lǐng)域和新一波科研浪潮的催化劑。


在商業(yè)方面,人工智能可以提供額外的機會,為企業(yè)組織創(chuàng)建集成的業(yè)務(wù)計算系統(tǒng)(BusinessComputingSystem,BCS)平臺。如記錄業(yè)務(wù)對象(如系統(tǒng)設(shè)計模型、交易記錄)和業(yè)務(wù)流程[如ERP(企業(yè)資源計劃)、CRM(客戶關(guān)系管理)];或者系統(tǒng)設(shè)計并模仿人類工作活動,如溝通、協(xié)作、閱讀、寫作、尋求信息等。


人工智能的“感知系統(tǒng)”有更廣泛、更新的商業(yè)機會:一方面,可以構(gòu)建和部署更多的“傳感系統(tǒng)”的子系統(tǒng),針對的是物理環(huán)境或物理系統(tǒng),如裝配線、工廠等。這使得未來人力密集的制造業(yè)、商業(yè)服務(wù)業(yè)等,可以采用更先進的信息


信息工具和更強的自動化。另一方面,自然語言處理技術(shù)的迅速進步使得我們可以掃描和分析文本文檔和信息,并從中提取各種高價值的業(yè)務(wù)知識,而構(gòu)建和部署專用的“文本理解子系統(tǒng)”可以得到很多高價值的知識和商業(yè)回報。


對商業(yè)機構(gòu)來說:好消息是它們將有許多提升、轉(zhuǎn)化和進入新的增長領(lǐng)域的機會;壞消息是當(dāng)大浪潮席卷時,沒有誰可以巋然不動,如果你沒有抓住前進的機會,你就會落后,甚至被時代拋棄。


有兩種類型的計算系統(tǒng)被人類叫作人工智能。第一種,本質(zhì)上相當(dāng)于“智能計算系統(tǒng)”(ICS)的子系統(tǒng)框架。它將數(shù)據(jù)作為輸入,從數(shù)據(jù)中提取信息并建立模型,將我們關(guān)心的某些現(xiàn)象轉(zhuǎn)化為知識。我們稱這種類型的人工智能系統(tǒng)為“通用智能系統(tǒng)”(GeneralAI),并定義“通用智能”的意思是一臺機器獲取知識和實現(xiàn)目標(biāo)的能力。


第二種,指具有類似人類的認(rèn)知能力,能感知(“看”“聽”“感覺”),它們可以越來越多地推理和計劃,它們可以用感覺運動控制移動。我們稱這種類型的人工智能系統(tǒng)為“認(rèn)知智能系統(tǒng)”(CognitiveAI),是具有感知、推理、規(guī)劃和感覺運動控制能力的機器。


人工智能系統(tǒng)的另一個二分法是“狹義AI”(NarrowAI)和“廣義AI”(StrongAI)?!皬V義AI”是使用相同的算法來解決一大類問題的系統(tǒng)。原則上,“廣義AI”系統(tǒng)可以學(xué)習(xí)和適應(yīng)以解決新的問題,而無須人為干預(yù)?!蔼M義AI”系統(tǒng)使用特定算法來解決特定問題,如下棋、識圖等。


通用人工智能系統(tǒng)的核心能力就是通過運用算法、計算體系,把知識從數(shù)據(jù)里提取出來。


最近幾年深度學(xué)習(xí)的突破主要是在感知層面,特別是視覺和語音識別,還有自然語言的理解。但這只是起步,接下來要做的是認(rèn)知上的,因為感知只是把外部世界通過光感、聲音的振動,或者語言的交流,變成可以被系統(tǒng)識別的符號。最重要的還是理解它的意義是什么。


實力”。搜索技術(shù)是人工智能的先驅(qū),也是最早的互聯(lián)網(wǎng)數(shù)字化世界的門戶,其開發(fā)流程和技術(shù)核心為未來的人工智能奠定了基礎(chǔ)。首先,搜索引擎必須與很大規(guī)模的數(shù)據(jù)打交道;其次,搜索引擎必須同時有大規(guī)模的機器學(xué)習(xí),人工來做是不可能的事,因為數(shù)據(jù)規(guī)模太大了;最后,也是最根本的一點,搜索引擎的開發(fā)流程和工程開發(fā)文化與人工智能系統(tǒng)的開發(fā)是非常吻合的,都以數(shù)據(jù)為主,通過抽取其中的特征、模式,然后用這個模式給用戶帶來價值。


在企業(yè)人工智能戰(zhàn)略的執(zhí)行階段,首先要堅持“結(jié)構(gòu)完整性”原則,即在產(chǎn)品體驗、技術(shù)架構(gòu)以及商業(yè)模式上要連貫一致。


其次是企業(yè)要緊跟人工智能浪潮的技術(shù)路線圖,與當(dāng)前飛速發(fā)展的深度學(xué)習(xí)技術(shù)同步是必不可少


投資力度是企業(yè)亟須考量的重要因素。


鑒于人工智能浪潮基于與以往完全不同的核心技術(shù)(以神經(jīng)計算為核心),它需要高層管理團隊的高級管理能力。同時,人工智能驅(qū)動的新興行業(yè)是如此多樣化和跨學(xué)科(從基因?qū)W到機器人,凡是你可以想到的),因此企業(yè)需要一個具備創(chuàng)新精神的人(


數(shù)據(jù)—知識—用戶體驗—新的數(shù)據(jù)的反饋循環(huán)。對這個反饋循環(huán)的容量和速度進行優(yōu)化是規(guī)劃中非常重要的一環(huán)。


03在大數(shù)據(jù)與深度學(xué)習(xí)中蝶化的人工智能


神經(jīng)網(wǎng)絡(luò)類似人類大腦,由一個個神經(jīng)元組成,每個神經(jīng)元和多個其他神經(jīng)元連接,形成網(wǎng)狀。單個神經(jīng)元只會解決最簡單的問題,但是組合成一個分層的整體,就可以解決復(fù)雜問題。


具有空間性分布數(shù)據(jù)的CNN(卷積神經(jīng)網(wǎng)絡(luò))和應(yīng)對具有時間性分布數(shù)據(jù)的RNN(遞歸神經(jīng)網(wǎng)絡(luò),又稱循環(huán)神經(jīng)網(wǎng)絡(luò))。


深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模擬了人腦的神經(jīng)節(jié)點,每個節(jié)點實際上就是一個函數(shù)調(diào)節(jié)器,無數(shù)函數(shù)彼此交叉連接起來。通過數(shù)學(xué)上的矩陣、優(yōu)化、正則式等各種方法,深度學(xué)習(xí)過程不斷調(diào)整著每個函數(shù)系數(shù)的權(quán)重,在數(shù)據(jù)充分、構(gòu)造原理合適的情況下,不斷演化的函數(shù)會越來越準(zhǔn)確地擬合大部分?jǐn)?shù)據(jù),于是我們就可以通過這套函數(shù)來預(yù)測尚未發(fā)生的情況。這個過程就是我們所說的“訓(xùn)練”。


這就是“監(jiān)督學(xué)習(xí)”——依賴大量有標(biāo)簽的數(shù)據(jù)。


王海峰認(rèn)為思考和獲得知識的能力成就了今天的人類,這種能力需要通過語言來找到思考的對象和方法,并外化為我們看、聽、說和行動的能力。相對于這些能力,語言是人類區(qū)別于其他生物的最重要的特征之一。


僅就知識圖譜來說,基于不同的應(yīng)用需求可分為三類:實體圖譜(entitygraph)、關(guān)注點圖譜(attentiongraph)和意圖圖譜(intentgraph)。


04中國大腦計劃:自下而上的超級工程


“人工智能基礎(chǔ)技術(shù)層”包括語音識別、圖像識別、自然語言處理以及所有的知識圖譜、商業(yè)邏輯和用戶畫像。


百度宣布將向社會免費開源人工智能深度學(xué)習(xí)平臺PaddlePaddle,開放百度大腦開放平臺ai.baidu.com。前者為開發(fā)者提供算法編程環(huán)境,后者為應(yīng)用開發(fā)者、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家提供現(xiàn)成的百度人工智能成果接口。


斯坦福人工智能實驗室負(fù)責(zé)人、全球著名圖像識別數(shù)據(jù)庫ImageNet創(chuàng)始人李飛飛這樣描述:“從科學(xué)到科技再到產(chǎn)品,就像一個4×100的接力賽,每一棒都有它特別的功能,學(xué)術(shù)界應(yīng)該算是這個4×100接力賽的第一棒,工業(yè)界和實驗室是第二棒,產(chǎn)業(yè)化、投資是第三棒、第四棒?!?/p>


從國情來看,中國發(fā)展人工智能較歐美國家有著更強烈的內(nèi)在驅(qū)動,這種驅(qū)動來自民間。百度搜索統(tǒng)計顯示,有關(guān)“服務(wù)”的搜索請求數(shù)量始終在迅速增長:2014年比2013年增長了133%。2016年在基數(shù)更大的情況下,仍有153%的增長。


05中國智造與文明升級


按馬斯洛的需求層級理論,越低級的需求,越容易量化,共性越大,相應(yīng)市場規(guī)模越大。


亞當(dāng)·斯密在《國富論》中指出,規(guī)模是分工協(xié)作的前提。越高級的需求,如果要增加產(chǎn)品,相應(yīng)的分工協(xié)作就越復(fù)雜,會降低效率,損失規(guī)模效應(yīng)。


德魯克的《管理的實踐》開宗明義,企業(yè)的目的是創(chuàng)造顧客。當(dāng)生產(chǎn)力擴張,消費需求將被釋放或者創(chuàng)造出來。


形成。新工業(yè)范式將把舊工業(yè)范式顛倒過來,不再是技術(shù)的突變引導(dǎo)需求的漸變,而是無限地拓展需求層級和種類,以需求的突變引導(dǎo)技術(shù)的漸變。


擴大內(nèi)需不應(yīng)該被理解成舊需求層面上的擴張,而是前所未有的多樣化需求被開發(fā)出來。在舊工業(yè)范式下,依靠的參照系只有已知技術(shù)和已知需求兩條小路,人類憑著自己的計算和洞察摸著石頭過河。而今天,人類無窮多樣性的細(xì)分需求,需要依靠人工智能深度學(xué)習(xí)系統(tǒng)才能捕捉。


控制論領(lǐng)域大獎諾伯特·維納獎的首位華人獲得者,中科院自動化研究所副所長王飛躍指出:“工業(yè)自動化將向知識自動化轉(zhuǎn)移。”新的生產(chǎn)過程將具備如下特性:對人類生活多樣性的自動跟蹤;知識的自動化習(xí)得;工具的自我復(fù)用和進化;對社會管理的自動優(yōu)化;生產(chǎn)流程根據(jù)知識進行自動調(diào)整并生產(chǎn)出新知識……以此形成新的循環(huán)往復(fù)規(guī)律,革新工業(yè)經(jīng)濟范式。這個過程將挑戰(zhàn)過去生產(chǎn)方式的一切環(huán)節(jié),從生產(chǎn)布局、設(shè)計流程、渠道建設(shè)直到科層制的企業(yè)權(quán)力結(jié)構(gòu)?!爸袊圃臁币矊⒁虼硕癁椤爸袊窃臁?。


10遇見智能時代的你


真正決定我們職業(yè)未來的,是我們是否具備智能時代需要的職業(yè)素養(yǎng)。

11美麗新世界嚴(yán)肅新問題


中國產(chǎn)業(yè)鏈完整、工作場景多樣、人才層次豐富,這是寶貴的財富。科學(xué)家和工程師應(yīng)該有意識地深入生產(chǎn)場景,把智能技術(shù)與工業(yè)實踐和生活實踐結(jié)合起來。

?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容