筆記《淺談人工智能:現(xiàn)狀、任務(wù)、構(gòu)架與統(tǒng)一》

原文鏈接:淺談人工智能:現(xiàn)狀、任務(wù)、構(gòu)架與統(tǒng)一

讀完四萬(wàn)字不光是對(duì)朱教授眼中當(dāng)前人工智能的各種情況會(huì)有一個(gè)全面的了解,而且也會(huì)被他作為一個(gè)科學(xué)研究者卻同時(shí)具有的深厚的文史知識(shí)所深深折服。

摘要

本文首先在引言中提到,目前的人工智能領(lǐng)域并沒(méi)有被大多數(shù)人全面的認(rèn)識(shí),所以有此文。

前三小節(jié),起題,講了人工智能的現(xiàn)在過(guò)去與未來(lái)。

第四節(jié),提出觀點(diǎn)“小數(shù)據(jù)大任務(wù)”,反駁當(dāng)前“大數(shù)據(jù)小任務(wù)”的模型。

第五節(jié)到第十節(jié),從六個(gè)領(lǐng)域圍繞任務(wù)、認(rèn)知等等來(lái)討論什么,如何才能得到上面這種“小數(shù)據(jù)大任務(wù)的”模型。

最后一節(jié),給出總結(jié)與展望,人工智能應(yīng)當(dāng)成為智能科學(xué),給予達(dá)爾文與牛頓體系的統(tǒng)一。

引言

人工智能沉寂了許久后突然火了起來(lái),政府媒體都對(duì)其進(jìn)行大力追捧,但是追捧的同時(shí)卻又是一種不理智的體現(xiàn),在沒(méi)有對(duì)人工智能有全面認(rèn)識(shí)而下的片面的判斷。

然而,難以全面認(rèn)識(shí)當(dāng)前的人工智能領(lǐng)域也是有原因的。

  1. 人工智能是個(gè)非常大的領(lǐng)域。可以歸納為計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、認(rèn)知推理、機(jī)器人學(xué)、博弈和倫理、機(jī)器學(xué)習(xí)。 然而實(shí)際上這幾個(gè)領(lǐng)域也會(huì)互相交叉。深度學(xué)習(xí)只是其中的很小一部分,各個(gè)研究人員們無(wú)異于盲人摸象。
  2. 人工智能發(fā)展的斷代現(xiàn)象。 跟人工智能發(fā)展歷史有關(guān)。

1. 現(xiàn)狀

人工智能的研究,簡(jiǎn)單來(lái)說(shuō),就是要通過(guò)智能的機(jī)器,延伸和增強(qiáng)(augment)人類(lèi)在改造自然、治理社會(huì)的各項(xiàng)任務(wù)中的能力和效率,最終實(shí)現(xiàn)一個(gè)人與機(jī)器和諧共生共存的社會(huì)。

智能機(jī)器應(yīng)當(dāng)是有自主感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會(huì)協(xié)作能力,符合人類(lèi)感情、倫理和道德理念的。

雖然目前大家看到很多機(jī)器人還有智能系統(tǒng)的展示,如日本的機(jī)器人、波士頓動(dòng)力、聊天機(jī)器人等等。但是這些系統(tǒng)往往都只能在一個(gè)設(shè)定好的環(huán)境下運(yùn)行,而且在現(xiàn)實(shí)應(yīng)用中有很多缺陷。

最主要的問(wèn)題是缺乏物理和社會(huì)的常識(shí)。 而常識(shí)就是我們?cè)谶@個(gè)世界生存的最基本的知識(shí)。

2. 未來(lái)目標(biāo):烏鴉的啟示

鸚鵡和烏鴉的比較。

鸚鵡往往只能進(jìn)行學(xué)舌,卻并不理解自己在說(shuō)什么,就像是我們現(xiàn)在進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的聊天機(jī)器人一樣,不能把說(shuō)的話對(duì)應(yīng)到物理世界和社會(huì)中的物體、場(chǎng)景、人物上去,不合邏輯。

而烏鴉呢,這里有一個(gè)來(lái)自日本的烏鴉的故事,通過(guò)觀察,學(xué)會(huì)利用汽車(chē)開(kāi)堅(jiān)果,并且會(huì)看紅綠燈。這個(gè)烏鴉帶來(lái)了三點(diǎn)啟示。

  1. 它是一個(gè)完全自主的智能??梢愿兄?、認(rèn)知、推理、學(xué)習(xí)、和執(zhí)行。
  2. 它不需要大數(shù)據(jù)訓(xùn)練,通過(guò)少量數(shù)據(jù)就能弄明白。
  3. 烏鴉的腦只有人的1%大,功耗0.1-0.2瓦,就實(shí)現(xiàn)了功能。

這一切都向我們昭示著,這里還有很大的機(jī)會(huì)在里面,我們?nèi)绾尾拍苡每茖W(xué)手段實(shí)現(xiàn)這個(gè)烏鴉的解呢。

3. 歷史:“春秋五霸”到“戰(zhàn)國(guó)六雄”

這里用中國(guó)歷史來(lái)類(lèi)比人工智能六十年的幾起幾落。

第一階段:前三十年以數(shù)理邏輯的表達(dá)與推理為主。相當(dāng)于最初的有著各種成套體系的周朝,雖然相對(duì)松散。

第二階段:后三十年以概率統(tǒng)計(jì)的建模、學(xué)習(xí)和計(jì)算為主。第一階段之后,主要分為五大領(lǐng)域:計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、認(rèn)知科學(xué)、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)。也就是春秋五霸。都有著各自的圈子。這一階段主要代表人物。

現(xiàn)在:隨著“五霸”不斷擴(kuò)張,在一個(gè)平臺(tái)進(jìn)行交互。這幾個(gè)學(xué)科之間已經(jīng)開(kāi)始出現(xiàn)融合了,與戰(zhàn)國(guó)時(shí)期情況比較像,加上從人工智能分出來(lái)的博弈倫理,剛好可以湊出“戰(zhàn)國(guó)六雄。”

以上就是AI的過(guò)去現(xiàn)在與未來(lái)。之后進(jìn)入下一個(gè)主題,既然我們進(jìn)入這樣一個(gè)大融合時(shí)代,那么用一個(gè)什么樣的構(gòu)架把這些領(lǐng)域和問(wèn)題統(tǒng)一起來(lái)呢。

4. AI研究的認(rèn)知構(gòu)架:小數(shù)據(jù),多任務(wù)

智能系統(tǒng)的兩個(gè)基本前提條件:

  1. 物理環(huán)境客觀的現(xiàn)實(shí)與因果鏈條。
  2. 智能物種與生俱來(lái)的任務(wù)與價(jià)值鏈條。

所以在有了以上兩個(gè)前提條件之后,我們?cè)诙x好智能系統(tǒng)基本行動(dòng)功能后,在定義好模型的空間(包括價(jià)值函數(shù)),只能系統(tǒng)就應(yīng)該能夠自主生存下來(lái),學(xué)會(huì)認(rèn)識(shí)世界、利用世界、改造世界。

那么又是什么驅(qū)動(dòng)了模型的學(xué)習(xí)過(guò)程呢?

第一,外來(lái)的數(shù)據(jù)

第二,內(nèi)在的任務(wù)。把智能體都看成一個(gè)模型的話,任何模型都將由數(shù)據(jù)與任務(wù)來(lái)共同塑造。

當(dāng)前的大多數(shù)深度學(xué)習(xí)方法,都屬于“大數(shù)據(jù)、小任務(wù)范式”。用大量數(shù)據(jù)來(lái)訓(xùn)練特定的模型,造成結(jié)果是模型不能泛化和解釋。

而朱教授提倡的是一個(gè)相反的思路,“小數(shù)據(jù)、大任務(wù)范式”,用大量的任務(wù)來(lái)塑造智能。(其實(shí)這些讓我想到了,最近一些Meta-learning(元學(xué)習(xí))方面的研究,嘗試讓智能體學(xué)會(huì)怎么解決很多任務(wù),以任務(wù)為驅(qū)動(dòng)。)

那么又該如何定義這個(gè)大量任務(wù)呢?人感興趣的任務(wù)又有哪些,是什么樣的空間結(jié)構(gòu)?這個(gè)問(wèn)題,現(xiàn)在還一直說(shuō)不清楚,是人工智能發(fā)展的一個(gè)巨大挑戰(zhàn)。

有了以上前提知識(shí),下面就是對(duì)六大領(lǐng)域的介紹,看能否從中找到共性、統(tǒng)一的框架和表達(dá)模型。

5. 計(jì)算機(jī)視覺(jué):從深到暗

首先列舉了幾個(gè)被主流忽視的一些問(wèn)題。

  1. 幾何嘗試推理與三維場(chǎng)景構(gòu)建。人們根據(jù)常識(shí)對(duì)一張圖片就能推理出三維空間,而現(xiàn)在CV是通過(guò)多視角特征來(lái)推斷。這里提出了一個(gè)概念,時(shí)空因果的解釋圖(Spatial,Temporal and Causal Parse Graph),即STC-PG。

    img
  2. 場(chǎng)景識(shí)別的本質(zhì)是功能推理。當(dāng)人們看到一個(gè)三維空間時(shí),會(huì)想象這里可以用來(lái)干什么,通過(guò)想象出來(lái)的動(dòng)作,來(lái)理解場(chǎng)景。

  3. 物理穩(wěn)定性與關(guān)系的推理。

  4. 意向、注意和預(yù)測(cè)。

  5. 任務(wù)驅(qū)動(dòng)的因果推理與學(xué)習(xí)。

那么什么是任務(wù),任務(wù)就是改變場(chǎng)景中某些物體的狀態(tài),稱(chēng)為流態(tài)。圖像中的場(chǎng)景和人的動(dòng)作,其實(shí)就是因果關(guān)系的推理,所謂因果就是:人的動(dòng)作導(dǎo)致了某種流態(tài)的改變。所以理解圖片,就是這些這些反應(yīng)流態(tài)改變的蛛絲馬跡,而要注意到這些是需要大量來(lái)源于圖像之外的知識(shí)的。

感知的圖像往往只占5%,提供一些蛛絲馬跡;而后面的95%,包括功能、物理、因果、動(dòng)機(jī)等等是要靠人的想象和推理過(guò)程來(lái)完成的。

而對(duì)于感知圖片的理解可以表達(dá)為一個(gè)STC-PG,幾點(diǎn)要注意的是。

  1. 這個(gè)STC-PG是想象出來(lái)的。
  2. 大量的運(yùn)算屬于“top-down”自頂向下的計(jì)算過(guò)程,這是深度學(xué)習(xí)中沒(méi)有的。
  3. 這樣學(xué)習(xí)任務(wù)只需要極少的例子。

基于以上,視覺(jué)研究的未來(lái),將在于如何發(fā)掘那些隱藏的95%的知識(shí),這也就是為什么標(biāo)題從深到暗

6.認(rèn)知推理:走進(jìn)內(nèi)心世界

上面說(shuō)到的暗物質(zhì),就要涉及到感知與認(rèn)知了,進(jìn)入內(nèi)心世界。內(nèi)心世界反映外部世界,同時(shí)受動(dòng)機(jī)任務(wù)的影響和扭曲。要讓只能提理解下面這些概念。

  • Ta看到什么了?知道什么了?什么時(shí)候知道的?這其實(shí)是對(duì)視覺(jué)的歷史時(shí)間求積分。
  • Ta現(xiàn)在在關(guān)注什么?這是當(dāng)前的正在執(zhí)行的任務(wù)。
  • Ta的意圖是什么?后面想干什么?預(yù)判未來(lái)的目的和動(dòng)機(jī)
  • Ta喜歡什么?有什么價(jià)值函數(shù)?


而要達(dá)到這些,其中一個(gè)很重要的就是如何達(dá)成共識(shí),也就是分析共通的知識(shí),價(jià)值觀。這樣才能通過(guò)這些共識(shí)推斷出上面所提到的四個(gè)問(wèn)題。

怎么達(dá)成共識(shí)?那么語(yǔ)言就是形成共識(shí)的重壓工具了。

7. 語(yǔ)言通訊:溝通的認(rèn)知基礎(chǔ)

語(yǔ)言產(chǎn)生基礎(chǔ)是人要尋求合作。但是同時(shí)如果沒(méi)有上面提到的認(rèn)知基礎(chǔ),那么語(yǔ)言就只是空洞的符號(hào),對(duì)話不可能發(fā)生。

在人與人之間交流時(shí),往往是需要假設(shè)一些前提,比如說(shuō)我知道的東西、你知道的東西、我知道你知道的東西、你知道我知道的東西、我們共同知道的東西。

語(yǔ)言也可以用STC-PG來(lái)表達(dá)。

8. 博弈倫理:獲取、共享人類(lèi)的價(jià)值觀

這里提到機(jī)器人若是要與人交流,那么就必須懂得人類(lèi)價(jià)值觀,了解人類(lèi)的價(jià)值函數(shù)。這樣才能推斷出,人接下來(lái)要干什么。

而有了價(jià)值函數(shù)后,在多人環(huán)境下,各個(gè)價(jià)值函數(shù)形成競(jìng)爭(zhēng)與合作,最后達(dá)成準(zhǔn)平衡態(tài)。

9. 機(jī)器人學(xué):構(gòu)建大任務(wù)平臺(tái)

之前提到“小數(shù)據(jù),大任務(wù)”,那么機(jī)器人就將是一個(gè)大任務(wù)的科研平臺(tái)。

人和機(jī)器人要執(zhí)行任務(wù),就要把人物分解成一連串動(dòng)作,每個(gè)動(dòng)作改變環(huán)境中的流態(tài)。機(jī)器人重構(gòu)環(huán)境,然后用任務(wù)的視角來(lái)看待場(chǎng)景,將場(chǎng)景根據(jù)單個(gè)任務(wù)分成單任務(wù)地圖。之后通過(guò)這些單任務(wù)地圖,來(lái)組合規(guī)劃成復(fù)雜的任務(wù),也可以利用STC-PG。

這里舉了一個(gè)他們實(shí)驗(yàn)室的例子。

10. 機(jī)器學(xué)習(xí): 學(xué)習(xí)的極限和“停機(jī)問(wèn)題”

這里想要探討,在什么條件下,學(xué)習(xí)過(guò)程會(huì)終止,之后系統(tǒng)也就達(dá)到極限。

首先,到底什么是學(xué)習(xí)?

比如現(xiàn)在的機(jī)器學(xué)習(xí)主要分三步:

  1. 定義一個(gè)損失函數(shù),代表一個(gè)小任務(wù),比如人臉識(shí)別;
  2. 選擇一個(gè)模型,比如一個(gè)10層神經(jīng)網(wǎng)絡(luò),需要數(shù)據(jù)來(lái)擬合;
  3. 拿到大量標(biāo)注數(shù)據(jù),然后就可以擬合參數(shù)了。

但是這種學(xué)習(xí),沒(méi)有因果,沒(méi)有行動(dòng),只是純粹的、被動(dòng)的統(tǒng)計(jì)學(xué)習(xí)。

而真正的學(xué)習(xí),是一個(gè)交互的過(guò)程。學(xué)生和老師之間有互動(dòng),這種學(xué)習(xí)過(guò)程建立在6節(jié)講的構(gòu)架中,這里講這種學(xué)習(xí)過(guò)程稱(chēng)為通訊學(xué)習(xí)。

通訊學(xué)習(xí)的構(gòu)架中包含大量的學(xué)習(xí)模式,包括以下七種學(xué)習(xí)模式:

  1. 被動(dòng)統(tǒng)計(jì)學(xué)習(xí):用大數(shù)據(jù)擬合模型
  2. 主動(dòng)學(xué)習(xí):學(xué)生主動(dòng)問(wèn)老師要數(shù)據(jù)
  3. 算法教學(xué):老師跟蹤學(xué)生進(jìn)展和能力,來(lái)設(shè)計(jì)例子來(lái)幫助學(xué)習(xí)
  4. 演示學(xué)習(xí):廣泛應(yīng)用機(jī)器人學(xué),手把手教機(jī)器人做動(dòng)作
  5. 感知因果學(xué)習(xí):通過(guò)觀察別人行為的因果,而不用做實(shí)驗(yàn)驗(yàn)證,學(xué)出的因果模型
  6. 因果學(xué)習(xí):動(dòng)手實(shí)驗(yàn),控制其他變量,得到可靠因果模型
  7. 增強(qiáng)學(xué)習(xí):學(xué)習(xí)決策函數(shù)與價(jià)值函數(shù)的一種方法

從以上可以看出,現(xiàn)在如火如荼的深度學(xué)習(xí)其實(shí)只是廣義學(xué)習(xí)框架中的很小一部分,而學(xué)習(xí)有時(shí)AI中的一部分,所以現(xiàn)在這種將深度學(xué)習(xí)等同AI,無(wú)疑坐井觀天。

其次,學(xué)習(xí)的極限是什么?

影響學(xué)習(xí)極限的因素有很多,如教學(xué)的動(dòng)機(jī),教學(xué)的方法,能力問(wèn)題,還有價(jià)值函數(shù)...

而學(xué)習(xí)的極限,也就是停機(jī)問(wèn)題,就是在考慮這些因素的情況下,學(xué)習(xí)的動(dòng)態(tài)過(guò)程達(dá)到的各種平衡態(tài)。

11. 總結(jié):智能科學(xué)--牛頓與達(dá)爾文體系的統(tǒng)一

首先物理學(xué)的發(fā)展史就是一部追求物理世界統(tǒng)一的歷史,第一次大統(tǒng)一就是牛頓的經(jīng)典力學(xué)。

然而物理學(xué)將生物的意志排除在研究以外,這正好是智能科學(xué)要研究的對(duì)象。智能科學(xué)研究的是一個(gè)物理與生物混合的復(fù)雜系統(tǒng)。

智能作為一種現(xiàn)象,就表現(xiàn)在個(gè)體與自然、社會(huì)群體的相互作用和行為過(guò)程中。朱教授相信這些行為和現(xiàn)象必然有統(tǒng)一的力、相互作用、基本元素來(lái)描述。

然而和物理學(xué)不同的是,同時(shí)智能科學(xué)也會(huì)更加復(fù)雜,在于:

  1. 物理學(xué)面對(duì)的是一個(gè)客觀的世界,而智能科學(xué)研究的是,物理世界映射到每個(gè)人的腦中而形成的主觀與客觀融合的世界,也就是每個(gè)人腦中的模型。
  2. 物理學(xué)可以將各種現(xiàn)象隔離出來(lái)研究,而智能科學(xué)可能一張圖片就包含了大量的模型,人的一個(gè)簡(jiǎn)單動(dòng)作就包含了很復(fù)雜的心理活動(dòng),很難隔離。

回到之前的烏鴉的例子,智能科學(xué)研究的物理與生物系統(tǒng)有兩個(gè)基本前提:

  1. 智能物種與生俱來(lái)的任務(wù)與價(jià)值鏈條。
  2. 物理環(huán)境客觀的現(xiàn)實(shí)與因果鏈條。

智能科學(xué)必須要考慮的就是這兩個(gè)基本前提,而人工智能要變?yōu)橹悄芸茖W(xué),本質(zhì)也必將是達(dá)爾文與牛頓這兩個(gè)理論體系的統(tǒng)一。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容