《人工智能》李開復(fù)/王詠剛

我讀該書最大的收獲:

  • 什么是深度學(xué)習(xí)
  • 本次人工智能熱潮跟以往的區(qū)別
  • 哪些領(lǐng)域能最先使用AI技術(shù)取得成果 ?
  • 投資人是怎么看眼前的AI創(chuàng)業(yè)機(jī)會(huì)的 ?

什么是深度學(xué)習(xí)?李開復(fù)舉得例子很通俗易懂、很形象

第一章 人工智能來了

第二章 AI復(fù)興:深度學(xué)習(xí)+大數(shù)據(jù)=人工智能

這一次人工智能復(fù)興的最大特點(diǎn)是,AI在語音識(shí)別、機(jī)器視覺、數(shù)據(jù)挖掘等多個(gè)領(lǐng)域走進(jìn)了業(yè)界的真實(shí)應(yīng)用場景,與商業(yè)模式的緊密結(jié)合,開始在產(chǎn)業(yè)界發(fā)揮出真正的價(jià)值。

第三次AI熱潮:有何不同?

1 三次人工智能浪潮:

  • 20世紀(jì)50~60年代:以艾倫.圖靈提出圖靈測試為標(biāo)志,數(shù)學(xué)證明系統(tǒng)、知識(shí)推理系統(tǒng)、專家系統(tǒng)等里程碑式的技術(shù)和應(yīng)用為代表。
  • 20世紀(jì)80~90年代:基于統(tǒng)計(jì)模型的技術(shù)悄然興起,在語音識(shí)別、機(jī)器翻譯等領(lǐng)域取得不俗的進(jìn)展,以李開復(fù)的非特定人/連續(xù)語音識(shí)別技術(shù)為代表。
  • 2010年前后,隨著深度學(xué)習(xí)技術(shù)的成熟和興起,加上計(jì)算機(jī)運(yùn)算能力的提升和海量數(shù)據(jù)的積累,人工智能開啟了第三次浪潮。

2 第三次人工浪潮的特點(diǎn):

  • AI在相關(guān)領(lǐng)域表現(xiàn)出可以被普通人認(rèn)可的性能或效率,并因此被成熟的商業(yè)模式接受,開始在產(chǎn)業(yè)界發(fā)揮出真正的價(jià)值。
  • 人工智能可以解決實(shí)際問題了:在機(jī)器視覺、語音識(shí)別、數(shù)據(jù)挖掘、自動(dòng)駕駛等應(yīng)用場景,人工智能達(dá)到了人們的預(yù)期,研究成果可以落地并發(fā)揮出價(jià)值。
  • 跟以前兩次熱潮的驅(qū)動(dòng)力不同:
    • 學(xué)術(shù)研究為主導(dǎo) vs 商業(yè)需求為主導(dǎo)
    • 市場宣傳層面 vs 商業(yè)模式層面
    • 學(xué)術(shù)界游說政府和投資人 vs 投資人主動(dòng)向研究機(jī)構(gòu)投錢

圖靈測試與第一次AI熱潮

語音識(shí)別與第二次AI熱潮

語音識(shí)別領(lǐng)域的三次跨越:

  • 基于專家系統(tǒng)
  • 基于統(tǒng)計(jì)模型
  • 基于深度學(xué)習(xí):識(shí)別正確率高達(dá)98%

深度學(xué)習(xí)攜手大數(shù)據(jù)引領(lǐng)第三次AI熱潮

  • 人工神經(jīng)網(wǎng)絡(luò):深度學(xué)習(xí)的核心計(jì)算模型

  • 深度學(xué)習(xí)(書上的例子通俗易懂,很形象)

    • 用人類的數(shù)學(xué)知識(shí)和算法構(gòu)建起整體架構(gòu)

    • 在結(jié)合盡可能多的訓(xùn)練數(shù)據(jù)和大規(guī)模計(jì)算能力去調(diào)節(jié)內(nèi)部參數(shù)

    • 達(dá)到盡可能逼近目標(biāo)的目的

    • 特點(diǎn)

      • 半理論、半經(jīng)驗(yàn)的建模方式
      • 基于實(shí)用主義思想
      • 內(nèi)部黑盒
  • 大數(shù)據(jù):人工智能的基石

    • 三大基礎(chǔ)
      • 信息交換:通信和網(wǎng)絡(luò)寬帶的大幅增張
      • 信息處理:整理、轉(zhuǎn)換、分析數(shù)據(jù)的能力大幅增長
      • 信息存儲(chǔ):計(jì)算機(jī)存儲(chǔ)量的大幅增長
  • 人工智能三巨頭

    • 杰弗里·辛頓
      • 把反向傳播(Backpropagation)用于多層神經(jīng)網(wǎng)絡(luò),發(fā)明玻爾茲曼機(jī)(Boltzman machine),這些直接導(dǎo)致了深度學(xué)習(xí)的實(shí)用化
      • 多倫多大學(xué)、谷歌大腦
    • 約書亞·本吉奧
      • 在自然語言處理方向建樹頗多,推動(dòng)語音識(shí)別、機(jī)器翻譯的發(fā)展
    • 楊·勒丘恩
      • 卷及神經(jīng)網(wǎng)絡(luò)(CNN):最有效的深度學(xué)習(xí)算法,應(yīng)用于手寫識(shí)別和OCR
      • Facebook

第三章 人機(jī)大戰(zhàn):AI真的會(huì)挑戰(zhàn)人類?

第四章 AI時(shí)代:人類將如何變革?

第五章 機(jī)遇來臨:AI先行的創(chuàng)新與創(chuàng)業(yè)

1 大時(shí)代,大格局

2 AI創(chuàng)業(yè)是時(shí)代的最強(qiáng)音

人工智能的商業(yè)化路線圖

創(chuàng)新工場管理合伙人、資深投資人汪華認(rèn)為,人工智能的商業(yè)化分為三個(gè)主要階段:

第一階段
AI會(huì)率先在那些在線化程度高的行業(yè)開始應(yīng)用,在數(shù)據(jù)端、媒體端實(shí)現(xiàn)自動(dòng)化。
這一過程會(huì)首先從線上“虛擬世界”開始,隨著在線化的發(fā)展擴(kuò)張到各個(gè)行業(yè),幫助線上業(yè)務(wù)實(shí)現(xiàn)流程自動(dòng)化、數(shù)據(jù)自動(dòng)化和業(yè)務(wù)自動(dòng)化。

擁有高質(zhì)量線上大數(shù)據(jù)的行業(yè)會(huì)最早進(jìn)入人工智能時(shí)代。
互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的發(fā)展已經(jīng)在許多領(lǐng)域?yàn)锳I做好了業(yè)務(wù)流程和數(shù)據(jù)上的準(zhǔn)備。例如:大家常說的金融行業(yè)是目前人工智能應(yīng)用的熱點(diǎn),這正是因?yàn)榻鹑谛袠I(yè)特別是互聯(lián)網(wǎng)金融已經(jīng)做好了使用AI的準(zhǔn)備。此外,美團(tuán)等公司將餐飲服務(wù)與線上業(yè)務(wù)連接了起來,滴滴、摩拜單車等公司將交通出行與線上業(yè)務(wù)連接了起來。在這些擁有線上業(yè)務(wù)流程和高質(zhì)量數(shù)據(jù)積累的地方,AI同樣開始發(fā)揮作用,大幅提高線上業(yè)務(wù)的自動(dòng)化程度。

第二階段
隨著感知技術(shù)、傳感器和機(jī)器人技術(shù)的發(fā)展,AI會(huì)延伸到實(shí)體世界,并率先在專業(yè)領(lǐng)域、行業(yè)應(yīng)用、生產(chǎn)力端實(shí)現(xiàn)線下業(yè)務(wù)的自動(dòng)化。

可以感知實(shí)體世界信息的傳感器和相關(guān)的感知技術(shù)會(huì)越來越成熟,越來越便宜。在線下業(yè)務(wù)中,計(jì)算機(jī)系統(tǒng)可以通過物理方式接收線下信息或幫助完成線下操作。這個(gè)轉(zhuǎn)變意味著人工智能從線上的“虛擬世界”走進(jìn)了線下的實(shí)體世界。這個(gè)階段,人工智能的商業(yè)化會(huì)首先從生產(chǎn)力的角度切入,整個(gè)世界的生產(chǎn)制造會(huì)逐漸被AI滲透。工業(yè)機(jī)器人、倉儲(chǔ)機(jī)器人、物流機(jī)器人等將在這個(gè)階段實(shí)現(xiàn)大范圍的普及。

第三階段
當(dāng)成本技術(shù)進(jìn)一步成熟時(shí),AI會(huì)延伸到個(gè)人場景,全面自動(dòng)化的時(shí)代終將到來。

隨著技術(shù)的日趨成熟,相關(guān)的智能產(chǎn)品價(jià)格大幅下降,AI終將從企業(yè)應(yīng)用進(jìn)入個(gè)人和家庭。那時(shí),每個(gè)人的工作和生活中,大量的應(yīng)用場景都會(huì)因?yàn)锳I的幫助而更加自動(dòng)化、更有效率,人類的生活質(zhì)量終將因AI的普及而大幅提升。這個(gè)階段里,AI商業(yè)化的核心目標(biāo)是創(chuàng)建全面自動(dòng)化的人類生活方式

根據(jù)汪華的判斷,我們目前正在進(jìn)入A商業(yè)化的第一個(gè)階段,也許只需要3年的時(shí)間,AI就可以在各種在線業(yè)務(wù)中得到普及。AI商業(yè)化的第二個(gè)階段,要花5~7年的時(shí)間才能充分發(fā)展起來。而標(biāo)志全面自動(dòng)化的第三個(gè)階段,需要十幾年的時(shí)間。

AI創(chuàng)業(yè)的五大基石
人工智能創(chuàng)業(yè)的五大基石

清晰的領(lǐng)域界限
人工智能創(chuàng)業(yè),要解決的領(lǐng)域問題一定要非常清晰,有明確的領(lǐng)域邊界,因?yàn)檫@一類問題是今天以深度學(xué)習(xí)為代表的人工智能算法最善于解決的。例如,同樣是做機(jī)器人,如果做一個(gè)借助視覺傳感器更好地規(guī)劃掃地線路、提高清潔效率的掃地機(jī)器人,將機(jī)器人的需求限定在一個(gè)有限的問題邊界內(nèi),這樣的解決方案就相對(duì)靠譜。
如果上來就要做一個(gè)長得像人一樣、可以與人交流的人形機(jī)器人,那以今天的技術(shù),做出來的多半不是人工智能,而是“人工智障”。

閉環(huán)的、自動(dòng)標(biāo)注的數(shù)據(jù)
針對(duì)要用AI解決的領(lǐng)域問題,最好有在這個(gè)領(lǐng)域內(nèi),有閉環(huán)的、自動(dòng)標(biāo)注的數(shù)據(jù)。例如,基于互聯(lián)網(wǎng)平臺(tái)的廣告系統(tǒng)可以自動(dòng)根據(jù)用戶點(diǎn)擊以及后續(xù)操作,收集到第一手轉(zhuǎn)化率數(shù)據(jù),而這個(gè)轉(zhuǎn)化率數(shù)據(jù)反過來又可以作為關(guān)鍵特征,幫助AI系統(tǒng)進(jìn)一步學(xué)習(xí)。這種從應(yīng)用本身收集數(shù)據(jù),再用數(shù)據(jù)訓(xùn)練模型,用模型提高應(yīng)用性能的閉環(huán)模式更加高效。谷歌、百度等搜索引擎之所以擁有強(qiáng)大的人工智能潛力,就是因?yàn)樗鼈兊臉I(yè)務(wù),比如搜索和廣告本身就是一個(gè)閉環(huán)的系統(tǒng),系統(tǒng)內(nèi)部就可以自動(dòng)完成數(shù)據(jù)收集、標(biāo)注、訓(xùn)練、反饋的會(huì)
過程。

千萬級(jí)的數(shù)據(jù)量
今天人工智能的代表算法是深度學(xué)習(xí)。而深度學(xué)習(xí)通常要求足夠數(shù)量的訓(xùn)練數(shù)據(jù)。一般而言,擁有千萬級(jí)的數(shù)據(jù)量是保證深度學(xué)習(xí)質(zhì)量的前提。當(dāng)然,這個(gè)“千萬級(jí)”的定義過于寬泛。事實(shí)上,在不同的應(yīng)用領(lǐng)域,深度學(xué)習(xí)對(duì)數(shù)據(jù)量的要求也不盡相同。而且,也不能僅看數(shù)據(jù)記錄的個(gè)數(shù),還要看每個(gè)數(shù)據(jù)記錄的特征維數(shù),特征在相應(yīng)空間中的分布情況,等等。

超大規(guī)模的計(jì)算能力
深度學(xué)習(xí)在進(jìn)行模型訓(xùn)練時(shí),對(duì)電腦的計(jì)算能力有著近乎“癡狂”的渴求。創(chuàng)新工場曾經(jīng)給一個(gè)專注于研發(fā)深
學(xué)習(xí)技術(shù)的團(tuán)隊(duì)投資了1000萬元人民幣。結(jié)果,團(tuán)隊(duì)建設(shè)初期才兩三個(gè)月時(shí)間,僅購買深度學(xué)習(xí)使用的計(jì)算服務(wù)器就花掉了700多萬元,一個(gè)類型的深度學(xué)習(xí)任務(wù),通常都要求在一臺(tái)或多臺(tái)安裝有四塊甚至8塊高性能GPU芯片的計(jì)算機(jī)上運(yùn)行。涉及圖像、視頻的深度學(xué)習(xí)任務(wù),則更是需要數(shù)百塊、數(shù)千塊GPU芯片組成的大型計(jì)算群。在安裝了大型計(jì)算集群的機(jī)房內(nèi),大量GPU在模型訓(xùn)練期間發(fā)出比普通服務(wù)器多數(shù)十倍的熱量。許多機(jī)房的空調(diào)系統(tǒng)都不得不重新設(shè)計(jì)、安裝。在一些空調(diào)馬力不足的機(jī)房里,創(chuàng)業(yè)圍隊(duì)甚至購買了巨大的冰塊來協(xié)助降溫。

頂尖的AI科學(xué)家
今天的人工智能研發(fā)還相當(dāng)依賴于算法工程師甚至是AI科學(xué)家的個(gè)人經(jīng)驗(yàn)積累。水平最高的科學(xué)家與普通水平的算法工程師之間,生產(chǎn)力的差異不啻千百倍。人工智能創(chuàng)業(yè)公司對(duì)頂尖AI科學(xué)家的渴求直接造成了這個(gè)領(lǐng)域科學(xué)家、研究員的身價(jià)與日俱增。谷歌雇用杰弗里·辛頓、李飛飛,F(xiàn)acebook雇用揚(yáng)·勒丘恩,據(jù)說都開出了教百萬美元的年薪。國內(nèi)AI創(chuàng)業(yè)公司如曠視科技,也用令人瞠目的高薪,將機(jī)器視覺領(lǐng)域的頂尖科學(xué)家孫劍“挖”了過來,把任公司的首州時(shí)科學(xué)家。

3 AI是中國創(chuàng)新、創(chuàng)業(yè)的最好機(jī)會(huì)

4 創(chuàng)新工場的AI布局

把握時(shí)機(jī)對(duì)創(chuàng)業(yè)和投資至關(guān)重要。創(chuàng)新工場根據(jù)技術(shù)成熟度和未來發(fā)展趨勢,將人工智能各應(yīng)用領(lǐng)域劃分為現(xiàn)階段已成熟、3到5年成熟、5到10年成熟、10年后成熟等不同類型,并分別設(shè)計(jì)相應(yīng)的投資策略。

創(chuàng)新工場在人工智能領(lǐng)域的投資布局

如圖中所示,創(chuàng)新工場將人工智能領(lǐng)域的應(yīng)用劃分為大數(shù)據(jù)、感知、理解、機(jī)器人、自動(dòng)駕駛等不同門類,每個(gè)門類中,按照人工智能技術(shù)的成熟度,將具體應(yīng)用領(lǐng)域排列在時(shí)間維度上。

總體來說,人工智能在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用,如搜索引擎、廣告推薦等方面已經(jīng)非常成熟。在商業(yè)自動(dòng)化、語音識(shí)別、機(jī)器視覺、手勢識(shí)別、基礎(chǔ)傳感器、工業(yè)機(jī)器人等方面,人工智能可以立即應(yīng)用,立即收效。

金融類人工智能的應(yīng)用雖然已經(jīng)起步,但尚需一段時(shí)間才能真正普及。智能教育、智能醫(yī)療、AR/VR中的人工智能、量產(chǎn)的傳感器、商業(yè)用機(jī)器人等,預(yù)計(jì)會(huì)在3到5年成熟可用。

可以供普通技術(shù)人員乃至非技術(shù)人員使用的人工智能平臺(tái)(包括計(jì)算架構(gòu)、算法框架、傳感平臺(tái)、云服務(wù)等),會(huì)在3到5年后趨于成熟并擁有足夠大的商業(yè)機(jī)會(huì)。

通用的自然語言對(duì)話工具、智能助手、普及型的家用機(jī)器人等,則至少需要10年甚至更長的時(shí)間,才有可能完成商業(yè)化。

另外,在自動(dòng)駕駛領(lǐng)域,3到5年內(nèi),必將是第2級(jí)到第3級(jí)的輔助駕駛最先大規(guī)模商用,而且,鑒于安全考慮,這些自動(dòng)駕駛應(yīng)用也會(huì)是限定場景、限定道路等級(jí)的。真正意義上的“無人駕駛”,即第4級(jí)或第5級(jí)的自動(dòng)駕駛,還需要5到10年才能上路運(yùn)行。

我的理解:
跟著“數(shù)據(jù)”走,哪里有質(zhì)量高的大數(shù)據(jù),哪里就有金子。

第六章 AI時(shí)代的教育和個(gè)人發(fā)展

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容