人工智能簡史

? ? 從Google AlphaGo到Chatbot聊天機器人、智能理專、精準醫(yī)療、機器翻譯…近年來時而聽到人工智能的相關(guān)消息,一夕之間這項技術(shù)攻占了各大媒體版面。

????不但Google、Facebook、微軟、百度、IBM 等巨頭紛紛進軍該領(lǐng)域,無人車、無人快遞、智能機器人的研發(fā)和誕生,也標志著人工智能浪潮的來臨。

????講到人工智能,你能想象到什么?

1. 人工智能的孕育期(1943—1955年)

????現(xiàn)在一般認定人工智能的最早工作是 Warren McCulloch和 Walter Pitts(1943)完成的他們利用了三種資源:基礎(chǔ)生理學知識和腦神經(jīng)元的功能;歸功于羅素和懷特海德的對命題邏輯的形式分析:以及圖靈的計算理論。他們提出了一種人工神經(jīng)元模型,其中每個神經(jīng)元被描述為是”開”或”關(guān)”狀態(tài),作為一個神經(jīng)元對足夠數(shù)量鄰近神經(jīng)元刺激的反應其狀態(tài)將出現(xiàn)到”開”的轉(zhuǎn)變。神經(jīng)元的狀態(tài)被設想為”事實上等價于提出其足夠刺激的一個命題”。例如,他們證明,任何可計算的函數(shù)都可以通過相連神經(jīng)元的某個網(wǎng)絡來計算并且所有邏輯連接詞(與、或、非等)都可用簡單的網(wǎng)絡結(jié)構(gòu)來實現(xiàn)。 McCulloch和Pitts還建議適當定義的網(wǎng)絡能夠?qū)W習。唐納德·赫布( Donald Hebb)(1949)展示了一條簡單用于修改神經(jīng)元之間的連接強度的更新規(guī)則。他的規(guī)則現(xiàn)在稱為赫布型學習( Hebbian learning),至今仍然是一種有影響的模型。

????兩名哈佛大學的本科生,馬文·明斯基( Marvin Minsky)和 Dean Edmonds,在1950年建造了第一臺神經(jīng)網(wǎng)絡計算機。稱為 SNARC的這臺計算機,使用了3000個真空管和B-24轟炸機上一個多余的自動指示裝置來模擬由40個神經(jīng)元構(gòu)成的一個網(wǎng)絡。后來在普林斯頓學,明斯基研究了神經(jīng)網(wǎng)絡中的一般計算。他的哲學博士委員會懷疑這種工作是否應該看作數(shù)學,不過據(jù)傳馮·諾依曼說”如果它現(xiàn)在不是,那么總有一天會是”明斯基晚年證明了若干有影響的定理,指出了神經(jīng)網(wǎng)絡研究的局限性。

????雖然還有若干早期工作的實例可以被視為人工智能,但是阿蘭·圖靈的先見之明也許是最有影響的。早在1947年,他就在倫敦數(shù)學協(xié)會發(fā)表了該主題的演講,并在其1950年的文章”計算機器與智能( Computing Machinery and Intelligence)”中清晰地表達了有說服力的應辦之事。其中他提出了圖靈測試、機器學習、遺傳算法和強化學習。他提出了兒童程序( Child Programme)的思想,并解釋為”代替試圖制作程序來模擬成年人的頭腦,為什么不愿嘗試制作模擬兒童頭腦的程序呢?”

2. 人工智能的誕生(1956年)

????普林斯頓大學曾是人工智能的另一位有影響的人物約翰·麥卡錫( John McCarthy)的陣地。1951年在那里獲得哲學博士學位以后又作為教師王作了兩年,接著麥卡錫搬到斯坦福大學,然后又到了達特茅斯大學,這里后來成為了公認的人工智能領(lǐng)域的誕生地。麥卡錫說服了明斯基、克勞德·香農(nóng)( Claude shannon)和內(nèi)森尼爾·羅切斯特( Nathaniel Rochester)幫助他把美國對自動機理論、神經(jīng)網(wǎng)絡和智能研究感興趣的研究者們召集在一起。1956年夏天他們在達特茅斯組織了一個為期兩個月的研討會。會議的提案申明:

????我們提議1956年夏天在新罕布什爾州漢諾威市的達特茅斯大學開展一次由10個人為期兩個月的人工智能研究,學習的每個方面或智能的任何其他特征原則上可被這樣精確地描迷以至于能夠建造一臺機器來模擬它,該研究將基于這個推斷來進行,并嘗試著發(fā)現(xiàn)如何使機器使用語言,形成抽象與概念,求解多種現(xiàn)在注定由人來求解的問題,進而改進機器,我們認為:如果仔細選擇一組科學家對這些問題一起工作一個夏天,那么對其中的一個或多個問題就能夠取得意義重大的進展。

????總共有10位與會者,包括來自普林斯頓大學的 Trenchard More、來自IBM公司的阿瑟·薩繆爾( Arthur Samuel),以及來自MT的Ray Solomonof和 Oliver Selfridge.兩位來自卡耐基技術(shù)學院2的研究者,艾倫·紐厄爾和赫伯特·西蒙,相當引人注目。雖然其他人也有想法且在某些情況下還有諸如西洋跳棋那樣的特定應用的程序,但是紐厄爾和西蒙卻已有一個推理程序:邏輯理論家( Logic Theorist,T)。對此西蒙聲稱:”我們發(fā)明了一個能非數(shù)值地思考的計算機程序,因此解決了古老的心身問題。”在這次研討會之后不久,他們的程序就能證明羅素和懷特海德的《數(shù)學原理》( Principia Mathematica)的第2章中的大部分定理。據(jù)說當西蒙演示程序能為定理提供比數(shù)學原理中更短的證明時羅素非常高興?!斗栠壿嬰s志》( Journal of Symbolic Logic)的編輯們卻并未留下深刻的印象;他們拒絕了由紐厄爾、西蒙和邏輯理論家合著的一篇論文。

????達特茅斯研討會并未導致任何新突破,但它確實互相介紹了所有主要的人物。對隨后的20年,人工智能領(lǐng)域就被這些人以及他們在MT、CMU、斯坦福和IBM的學生和同事們支配了。

????考察一下達特茅斯研討會的提案( McCarthy等,1955),我們可以看出為什么人工智能變成一個獨立的領(lǐng)域是必要的。為什么人工智能中完成的所有工作不能以控制論或運籌學或決策理論的名義進行,畢竟他們與人工智能具有類似的目標?或者為什么人工智能不是數(shù)學的一個分支?第一個答案是人工智能從誕生以來就采納了復制人的才能,如創(chuàng)造性自我改進和語言應用的思想。其他領(lǐng)域中沒有一個會處理這些問題。第二個答案是方法學不同。人工智能是這些領(lǐng)域中唯一的顯然屬于計算機科學的一個分支(雖然運籌學確實共享了對計算機模擬的重視),并且人工智能是唯一試圖建造能在復雜的、變化的環(huán)境中自主運行的機器的領(lǐng)域。

3. 早期的熱情,巨大的期望(1952-1969年)

????早年人工智能在有限的方面充滿成功??紤]到當時簡單的計算機與編程工具,以及就在幾年前計算機被看成只能做算術(shù)運算這個事實,只要計算機做了任何稍微聰明的事都是令人驚訝的??偟膩碚f,善于思考的當權(quán)人物寧愿認為”機器永遠不能做X”(為獲得圖靈收集的這類X的一張長表參見第26章)。人工智能研究者通過論證一個接一個的X自然地做出了反應。約翰·麥卡錫把這段時期稱作”瞧,媽,連手都沒有!”的時代。

????通用問題求解器或GPS繼承并發(fā)揚了紐厄爾和西蒙的早期成就。與邏輯理論家不同該程序一開始就被設計來模仿人類問題求解協(xié)議。結(jié)果證明在它能處理的有限難題類中該程序考慮子目標與可能行動的順序類似于人類處理相同問題的順序。因此,GPS或許是第一個體現(xiàn)”像人一樣思考”的程序。GPS與隨后的程序作為認知模型的成功致使紐厄爾和西蒙(1976)構(gòu)想出著名的物理符號系統(tǒng)( physical symbol system)假設,它指出”物理符號系統(tǒng)具有必要且充分的表示一般智能行動的手段”。他們的意思是展現(xiàn)智能的任何(人類或機器)系統(tǒng)一定通過處理由符號組成的數(shù)據(jù)結(jié)構(gòu)來起作用。后面我們將看到,該假設已受到來自多個方向的挑戰(zhàn)。

????在IBM公司,內(nèi)森尼爾·羅切斯特和他的同事們制作了一些最初的人工智能程序Herbert Gelernter(1959)建造了幾何定理證明器,它能夠證明連許多學數(shù)學的學生都感到相當棘手的定理。從1952年開始,阿瑟·薩繆爾編寫了一系列西洋跳棋程序,該程序最終學到能以業(yè)余高手的水準來玩。在這個過程中,他駁斥了計算機只能做被告知的事的思想:他的程序迅速學到比其創(chuàng)造者玩得更好。1956年2月這個程序在電視上進行了演示,給人留下很深的印象。像圖靈一樣,薩繆爾也難于找到機時。他只好在夜晚工作,使用的機器是仍在BM制造廠的測試層上的計算機。

????約翰·麥卡錫從達特茅斯搬到了MT,并且在那里于歷史性的1958年做出了三項至關(guān)重要的貢獻。根據(jù)MIT人工智能實驗室的1號備忘錄,麥卡錫定義了高級語言Lisp,該語言在后來的30年中成為占統(tǒng)治地位的人工智能編程語言。有了Lisp,麥卡錫便具有他所需的工具,但訪問稀少且昂貴的計算資源仍是一個嚴重的問題。作為回應,他和MT的其他人一起發(fā)明了分時技術(shù)。在1958年,麥卡錫還發(fā)表了題為”有常識的程序”( Programs with Common Sense)的論文,文中他描述了意見接受者( Advice Taker),這個假想程序可被看成第一個完整的人工智能系統(tǒng)。像邏輯理論家和幾何定理證明器一樣,麥卡錫的程序也被設計成使用知識來搜索問題的解。但是與其他系統(tǒng)不同,它包含世界的一般知識。例如,他指出某些簡單的公理如何使該程序能生成一個開車去機場的計劃。該程序還被設計成能在正常的操作過程中接收新公理,從而允許它在未被重新編程的情況下獲得新領(lǐng)域中的能力。因此意見接受者體現(xiàn)了知識表示與推理的核心原則:有益的是對世界及其運作具有某種形式的、明確的表示并且能夠使用演繹過程來處理那種表示。引人注目的是1958年發(fā)表的那篇論文目前仍然非常重要。

????1958年也是馬文明斯基搬到MT的年份。然而,他和麥卡錫最初的合作并未延續(xù)。麥卡錫強調(diào)形式邏輯的表示與推理,而明斯基對使程序有效工作更感興趣并且最終產(chǎn)生了種反邏輯的觀點。1963年,麥卡錫在斯坦福創(chuàng)辦了人工智能實驗室。1965年,J.A.Robinson歸結(jié)方法(一個完整的一階邏輯定理證明算法;參見第9章)的發(fā)現(xiàn)促進了麥卡錫使用邏輯來建造最終的意見接受者的計劃。斯坦福的工作強調(diào)邏輯推理的通用方法。邏輯的應用包括 Cordell Green的問題解答與規(guī)劃系統(tǒng)( Green,1969b)和斯坦福研究院(SRI)的 Shakey機器人項目。后者第一次展示了邏輯推理與物理行動的完整集成。

明斯基指導了一系列學生,他們選擇研究求解時看來好像需要智能的有限問題。這些有限域稱為微觀世界( microworlds)。 James Slagle的SANT程序(1963)能夠求解一年級大學課程中典型的閉合式微積分問題。 Tom Evans的 ANALOGY程序(1968)能夠求解出現(xiàn)在智商測試中的幾何類推問題。 Daniel Bobrow的 STUDENT程序(1967)能夠求解如下所述的代數(shù)故事問題

如果湯姆招攬到的顧客數(shù)是他做的廣告數(shù)的20%的平方的兩倍,并且他做的廣告數(shù)是45,那么湯姆招攬到的顧客數(shù)是多少呢?

最著名的微觀世界是積木世界,它由放置在桌面(或者更經(jīng)常地,一個模擬桌面)上的一組實心積木組成。這個世界中的典型任務是使用一只每次能拿起一塊積木的機器手按某種方式調(diào)整這些積木。對于戴維·哈夫曼( David Huffman)的視覺項目(1971)、 David Waltz的視覺與約束傳播工作(1975)、 Patrick Winston的學習理論(1970)Terry Winograd的自然語言理解程序(1972)和 Scott Fahlman的規(guī)劃器(1974)來說,積木世界是它們的發(fā)源地。

基于 McCulloch和pis的神經(jīng)網(wǎng)絡的早期工作也十分興旺。 Winograd和 Cowan的工作(1963)表明大量元素可以如何共同表示一個單獨的概念,同時相應增加魯棒性和并行性。 Bernie Widrow( Widrow和Hof,1960;Widrow,1962)加強了赫布的學習方法,并稱他的網(wǎng)絡為適應機( adalines)。而且 Frank Rosenblat(1962)也用他的感知機( perceptrons)加強了赫布的學習方法。感知機收斂定理( perceptron convergence theorem)( Block等,1962)表明如果存在這樣的匹配,那么該學習算法便可調(diào)整感知機的連接強度以匹配任何輸入數(shù)據(jù)。

4. 現(xiàn)實的困難(1966-1973年)

????自開始以來,人工智能研究者們并不羞于預言他們將來的成功。赫伯特·西蒙在1957年的以下說法經(jīng)常被引用:

????我的目的不是使你驚奇或者震驚——但是我能概括的最簡單的方式是說現(xiàn)在世界上就有能思考、學習和創(chuàng)造的機器。而且,它們做這些事情的能力將快速增長直到一在可見的未來一一它們能處理的問題范圍將與人腦已經(jīng)應用到的范圍共同擴張。

????雖然像”可見的未來”那樣的措詞可按不同的方式來解釋,但是西蒙還做出了更具體的預言:10年內(nèi)計算機將成為國際象棋冠軍,并且機器將證明一個重要的數(shù)學定理。這預言在40年而不是10年內(nèi)實現(xiàn)(或者近似實現(xiàn))了。西蒙的過于自信是因為早期人工智能系統(tǒng)在簡單實例上令人鼓舞的性能。然而,在幾乎所有情況下,當這些早期系統(tǒng)試用于更寬的問題選擇和更難的問題時,結(jié)果證明都非常失敗。

????第一種困難起源于大多數(shù)早期程序?qū)ζ渲黝}一無所知;它們依靠簡單的句法處理獲得成功。一個典型的故事發(fā)生在早期的機器翻譯工作中。該工作由美國國家研究委員會慷慨資助,試圖加速俄語科學論文的翻譯,隨著1957年人造地球衛(wèi)星史普尼克( Sputnik)的發(fā)射而啟動。最初認為,基于俄語和英語語法的簡單句法變換以及根據(jù)一部電子詞典的單句子的內(nèi)容。著名的從” the spirit is willing but the flesh is weak(心有余而力不足)”到”the vodka is good but the meat is rotten(伏特加酒是好的而肉是爛的)”的互相翻譯(英譯俄后再俄譯英)說明了遇到的困難。1966年,咨詢委員會的一份報告認為”尚不存在通用科學文本的機器翻譯,近期也不會有”。隨后取消了學術(shù)翻譯項目的所有美國政府資助?,F(xiàn)在,技術(shù)、商業(yè)、政府和互聯(lián)網(wǎng)文檔,機器翻譯仍是一個不完善但廣泛使用的工具。

????第二種困難是人工智能試圖求解的許多問題的難解性。大多數(shù)早期的人工智能程序通過試驗步驟的不同組合直到找到解來求解問題。這種策略最初是有效的,因為微觀世界包含很少的對象,因此是很少的可能行動和很短的解序列。在產(chǎn)生計算復雜性理論之前,廣泛認為”放大”到更大的問題只是更快的硬件和更大的存儲器的事情。例如,樂觀主義伴隨著歸結(jié)定理證明的發(fā)展,但是,當研究者們不能證明包含多于數(shù)十條事實的定理時,很快就受挫了。程序原則上能夠找到解的事實并不意味著程序就包含實際上找到解所需的任何機制。

????無限計算能力的錯覺并不局限于問題求解程序。機器進化( machine evolution)現(xiàn)在稱為遺傳算法( genetic algorithms)( Friedberg,1958; Friedberg等,1959)中的早期實驗就是基于無疑正確的信念:通過對一段機器代碼程序恰當?shù)刂圃煲幌盗行∽兓?,便可為任意特定任務生成一個性能良好的程序。當時的想法是嘗試隨機的變化并用一個選擇過程來保持似乎有用的變化。盡管花了數(shù)千小時的CPU時間,但幾乎沒有展示出任何進展?,F(xiàn)代遺傳算法使用更好的表示且已展示出更多的成就。

????未能對付”組合爆炸”是包含在萊特希爾( Eighth)報告( Lighthill,1973)中的對人工智能的主要批評之一,基于該報告英國政府決定終止對除兩所大學外所有大學中人工智能研究的支持(口頭傳說描繪了一幅稍微有點不同且更多彩的畫面,具有政治野心和個人憎惡,這樣的描述是離題的)。

????第三種困難起源于用來產(chǎn)生智能行為的基本結(jié)構(gòu)的某些根本局限。例如,明斯基和apet的著作《感知機》( Perceptrons)(1969)證明了:雖然可以證明感知機(神經(jīng)網(wǎng)絡的一種簡單形式)能學會它們能表示的任何東西,但是它們能表示的東西很少。特別地兩輸入的感知機(限制為比 Rosenblatt原來研究的形式更簡單的形式)不能被訓練來認定何時其兩個輸入是不同的。雖然他們的結(jié)果沒有應用于更復雜的多層網(wǎng)絡,但是對神經(jīng)網(wǎng)絡研究的研究資助很快減少到幾乎沒有。具諷刺性的是,用于多層網(wǎng)絡的新反傳學習算法在20世紀80年代后期曾引起神經(jīng)網(wǎng)絡研究的巨大復興,但實際上該算法是在1969年首次發(fā)現(xiàn)的( Bryson和Ho,1969)。

5. 基于知識的系統(tǒng):力量的秘訣(1969—1979年)

????AI研究的第一個十年呈現(xiàn)的問題求解的美景是一種通用的搜索機制,它試圖串聯(lián)基本的推理步驟來尋找完全解。這樣的方法被稱為弱方法( weak method),因為盡管通用,但它們不能擴展到大規(guī)模的或困難的問題實例。弱方法的替代方案是使用更強有力的、領(lǐng)域相關(guān)的知識,以允許更大量的推理步驟,且可以更容易地處理狹窄的專門領(lǐng)域里發(fā)生的典型情況。也許有人會說:要求解一個難題,你必須已經(jīng)差不多知道答案。

????DENDRAL程序( Buchanan等,1969)是這種方法的早期例子。它是在斯坦福開發(fā)的在那里 Ed Feigenbaum(費根鮑姆)(曾是 Herbert Simon的學生)、 Bruce Buchanan一個改行研究計算機科學的哲學家)以及 Joshua Lederberg(一個獲得諾貝爾獎的基因?qū)W家)合作,以解決根據(jù)質(zhì)譜儀提供的信息推斷分子結(jié)構(gòu)的問題。程序的輸入由基本的分子式(例如,C6H3NO2)和質(zhì)譜組成,質(zhì)譜給出了被電子束轟擊產(chǎn)生的各種分子碎片的質(zhì)量。例如,質(zhì)譜可能在m=15的地方有一個尖峰,這對應于一個甲基(CH3)碎片的質(zhì)量。

????一個簡單版本的程序先生成與分子式一致的全部可能結(jié)構(gòu),然后預測每個結(jié)構(gòu)能觀察到的質(zhì)譜,再與真實質(zhì)譜比較。正如人們預期的一樣,對于中等大小的分子而言,這是不切實際的。 DENDRAL研究者們咨詢了分析化學家,發(fā)現(xiàn)他們是通過尋找質(zhì)譜中已清楚了解的尖峰模式進行工作的,這些模式暗示了分子中的普通子結(jié)構(gòu)。例如,下列規(guī)則是用來識別酮(C=O)結(jié)構(gòu)(重量為28)的:

如果在x1和x2處有兩個尖峰,滿足

(a)x_{1}  + x_{2}  = M + 28(M是整個分子的質(zhì)量);

(b)x_{1}  - 28是一個高的尖峰;

(c)x_{2}  - 28是一個高的尖峰;

(d)x_{1} x_{2} 至少有一個峰值比較高。

那么存在一個酮結(jié)構(gòu)

????認識到分子包含特定子結(jié)構(gòu),這大大減少可能的候選數(shù)量。 DENDRAL功能強大是因為

所有解決這些問題的相關(guān)理論知識都被從其在[質(zhì)譜預測成分](“基本原理”)中的一般形式映射到了效率高的特殊形式(“食譜配方”)。(Feigenbaum等,1971)

????DENDRAL的意義在于它是第一個成功的知識密集系統(tǒng):它的專業(yè)知識來自大量的專用規(guī)則。后來的系統(tǒng)還吸收了麥卡錫的意見接收者( Advice Taker)方法的主旨一把知識(規(guī)則)和推理部件清楚地分離開。

????有了這個經(jīng)驗, Feigenbaum和斯坦福的其他一些人啟動了啟發(fā)式程序設計項目(HPP),以研究新的專家系統(tǒng)( expert systems)方法論可用到其他人類專家知識領(lǐng)域的程度。接下來的一個主要奮斗領(lǐng)域是醫(yī)療診斷。 Feigenbaum、 Buchanan和 Edward Shortliffe醫(yī)生開發(fā)了MYCN,用于診斷血液傳染。MYCN具有450條規(guī)則,能夠表現(xiàn)得與某些專家一樣如并且表現(xiàn)得比初級醫(yī)生好很多。MYCN與 DENDRAL有兩點主要差異。首先,不像DENDRAL規(guī)則,不存在通用的理論模型可以從中演繹出MYCN規(guī)則。他們不得不從專家會見大量病人的過程中獲取規(guī)則,而專家進而又從書本、其他專家以及案例的直接經(jīng)驗中獲取規(guī)則其次,規(guī)則必須反映與醫(yī)療知識關(guān)聯(lián)的不確定性。MYCN吸收了稱為確定性因素( certainty factors)的不確定性演算,似乎(在當時)很符合醫(yī)生如何評估診斷證據(jù)的作用的情況。

????領(lǐng)域知識的重要性在自然語言理解領(lǐng)域也很明顯。盡管 Winograd的理解自然語言的SHRDLU系統(tǒng)讓人們非常興奮,它對句法分析的依賴引起了在早期機器翻譯工作中出現(xiàn)的同樣的問題。它能夠克服歧義性并能理解代詞指代,但這主要是因為它是為一個特定領(lǐng)域積木世界—設計的。一些研究者,包括 Eugene Charniak他是 Winograd在MT帶的一名研究生,提出魯棒的語言理解將需要關(guān)于世界的一般知識和使用知識的一般方法。

????在耶魯,語言學家出身的AI研究者 Roger Schank強調(diào)了這一點,宣稱”沒有語法這樣的東西”,這打擊了很多語言學家,但又確實發(fā)動了一場有用的討論。 Schank和他的學生們建立了一系列程序( Schank和 Abelson,1977;Wilensky,1978;Schank和 Riesbeck,1981;Dyer,1983),都有自然語言理解的任務。然而,重點不在語言本身上,而是更多地集中在利用語言理解所需的知識進行表示和推理的問題上。問題包括表示固定不變的環(huán)境(Cullingford,1981),描述人類記憶組織( Rieger,1976; Kolodner,1983),以及理解規(guī)劃和目標( Wilensky,1983)。

????對現(xiàn)實世界問題的應用的普遍增長同時引起了對可行知識表示方案的需求的增長。大量不同的表示和推理語言被開發(fā)出來。有些是基于邏輯的一例如, Prolog語言開始在歐洲流行, PLANNER家族在美國流行。其他人追隨 Minsky的框架(fame)(1975),采用了更加結(jié)構(gòu)化的方法,集成了關(guān)于特定對象和事件類型的事實,并把這些類型安置在一個大的類似于生物分類學的分類層次中。

6. 人工智能成為產(chǎn)業(yè)(1980年一現(xiàn)在)

????第一個成功的商用專家系統(tǒng)R1開始在數(shù)據(jù)設備公司(DEC)( McDermott,1982)運轉(zhuǎn)。該程序幫助為新計算機系統(tǒng)配置訂單:到1986年為止,它每年為公司節(jié)省了估計400萬美元。到1988年為止,DEC公司的AI研究小組已經(jīng)部署了40個專家系統(tǒng),還有一些正在研制中。杜邦( DuPont)公司有100個專家系統(tǒng)在使用中,另有500個在開發(fā)中,每年估計為公司節(jié)省1000萬美元。幾乎每個主要的美國公司都有自己的A研究小組,并且正在使用或者研發(fā)專家系統(tǒng)。

????1981年,日本宣布了”第五代計算機”計劃。這是一項為期10年的計劃,以研制運行 Prolog語言的智能計算機。作為回應,美國組建了微電子和計算機技術(shù)公司(MCC)作為保證國家競爭力的研究集團。兩個案例中,A是研究計劃的一部分,這些研究計劃包括芯片設計和人機接口研究。在英國,艾爾維報告( Alvey report)恢復了因賴特希爾報告( Lighthill report)而停止的投資1。然而,在這三個國家中,這些項目從來都沒有實現(xiàn)過它們野心勃勃的目標。

????總的來說,AI產(chǎn)業(yè)從1980年的區(qū)區(qū)幾百萬美元暴漲到1988年的數(shù)十億美元,包括幾百家公司研發(fā)專家系統(tǒng)、視覺系統(tǒng)、機器人以及服務這些目標的專門軟件和硬件。之后個被稱為”人工智能的冬天”的時期很快來臨,期間很多公司都因無法兌現(xiàn)它們所做出的過分承諾而垮掉。

7. 神經(jīng)網(wǎng)絡的回歸(1986年一現(xiàn)在)

????在20世紀80年代中期,至少4個不同的研究組重新發(fā)明了由 Bryson和Ho于1969年首次建立的反傳( back-propagation學習算法。該算法被用于很多計算機科學和心理學中的學習問題,而文集《并行分布式處理》( Parallel Distributed Processing)( Rumelhart和McClelland,1986)中的結(jié)果的廣泛流傳引起了人們極大的興奮。

????智能系統(tǒng)的這些所謂連接主義( connectionist)模型被有些人視為是對 Newell(紐厄爾)和 Simon(西蒙)倡導的符號模型以及 McCarthy(麥卡錫)和其他人( Smolensky,1988)主張的邏輯方法的直接競爭者。也許看來很明顯,人類在某些層次上處理的是符號—事實上, Terrence Deacon的著作《符號的物種》( The Symbolic Species)(1997)指出這是人類的定義特性,但是大多數(shù)激進的連接主義者質(zhì)疑符號處理在認知的精細模型中是否有任何真正的解釋作用。這個問題還沒有答案,不過當前的觀點認為連接主義方法和符號主義方法是互補的,不是競爭的。就像AI與認知科學的分離一樣,現(xiàn)代神經(jīng)網(wǎng)絡研究分離成了兩個領(lǐng)域,一個關(guān)心的是建立有效的網(wǎng)絡結(jié)構(gòu)和算法并理解它們的數(shù)學屬性,另一個關(guān)心的是對實際神經(jīng)元的實驗特性和神經(jīng)元的集成的建模。

8. 人工智能采用科學方法(1987年一現(xiàn)在)

????近些年來我們已經(jīng)看到人工智能研究在內(nèi)容和方法論方面發(fā)生的革命?,F(xiàn)在更普遍的是在現(xiàn)有理論的基礎(chǔ)上進行研究而不是提出全新理論,把主張建立在嚴格的定理或者確鑿的實驗證據(jù)的基礎(chǔ)上而不是靠直覺,揭示對現(xiàn)實世界的應用的相關(guān)性而不是對玩具樣例的相關(guān)性。

????AI的建立,部分是出于對類似控制論和統(tǒng)計學等已有領(lǐng)域的局限性的叛逆,但是它現(xiàn)在開始接納那些領(lǐng)域。正如 David McAllester(1998)指出的:

在AI的早期,符號計算的新形式是值得稱道的,例如框架和語義網(wǎng)絡,它們使得很多經(jīng)典理論失效,這導致形成一種孤立主義,AI與計算機科學的其他領(lǐng)域之間出現(xiàn)巨大鴻溝。這種孤立主義目前正被逐漸拋棄人們現(xiàn)在認識到,機器學習不應該和信息論分離,不確定推理不應該和隨機模型分離,搜索不應該和經(jīng)典的優(yōu)化與控制分離,自動推理不應該和形式化方法與靜態(tài)分析分離。

????在方法論方面,A最終成為堅實的科學方法。為了被接受,假設必須遵從嚴格的經(jīng)驗實驗,結(jié)果的重要性必須經(jīng)過統(tǒng)計分析( Cohen,1995)。通過利用共享測試數(shù)據(jù)庫及代碼,現(xiàn)在重復實驗是可能的。

????語音識別領(lǐng)域闡明了這種模式。在20世紀70年代,人們嘗試了大量的不同體系結(jié)構(gòu)與方法。其中許多都相當特殊和脆弱,僅僅在幾個特定樣本上進行了演示。近些年,基于隱馬爾可夫模型( (hidden Markov models)(HMMs)的方法開始主導這個領(lǐng)域。HMM的兩個方面是有關(guān)的。首先,它們是基于嚴格的數(shù)學理論基礎(chǔ)的。這允許語音研究者們以其他領(lǐng)域中發(fā)展了數(shù)十年的數(shù)學成果為根據(jù)。其次,它們是通過在大量的真實語音數(shù)據(jù)上的訓練過程生成的。這保證了性能是魯棒的,而且在嚴格的盲測試中,HM不斷地提高著它們的得分。語音技術(shù)和與之有關(guān)聯(lián)的手寫字符識別已經(jīng)開始轉(zhuǎn)向廣泛用于工業(yè)和個人應用注意,沒有科學斷言說人類識別語音是用了HMM:HMM只是為理解這個問題提供了一數(shù)學框架,并支持了”它們在實際中工作得很好”的工程斷言。

????機器翻譯步語音識別的后塵。在20世紀50年代人們開始熱衷于基于單詞序列的方法具有根據(jù)信息論原理學習到的模型。20世紀60年代,這種方法開始被冷落,但到20世紀90年代末它又被重新?lián)炱?,目前主導著這個領(lǐng)域。

????神經(jīng)網(wǎng)絡也符合這個趨勢。很多神經(jīng)網(wǎng)絡方面的工作在20世紀80年代得以完成,試圖弄清神經(jīng)網(wǎng)絡到底能做什么,并了解神經(jīng)網(wǎng)絡與”傳統(tǒng)”技術(shù)之間到底有多大差別。通過改進的方法論和理論框架,這個領(lǐng)域達到一個新的理解程度—神經(jīng)網(wǎng)絡可以和統(tǒng)計學模式識別、機器學習等領(lǐng)域的對應技術(shù)相提并論,并且其最有前途的技術(shù)可以用在每個應用上。作為這些發(fā)展的結(jié)果,所謂數(shù)據(jù)挖掘( data mining)技術(shù)促生了一個有活力的新工業(yè)。

????隨著研究興趣的復蘇— Peter Cheeseman(1985)在文章《保衛(wèi)概率》(In Defense of Probability)中進行了概括, Judea Pearl(1988)的《智能系統(tǒng)中的概率推理》(Probabilistic Reasoning in Intelligent Systems)導致了AI對概率和決策理論的新輪接納。貝葉斯網(wǎng)絡( Bayesian network)的形式化方法被發(fā)明出來,以對不確定知識進行有效表示和嚴格推理這種方法極大地克服了20世紀60年代和70年代的概率推理系統(tǒng)的很多問題;它目前主導著不確定推理和專家系統(tǒng)中的AI研究。這種方法允許根據(jù)經(jīng)驗進行學習,并且結(jié)合了經(jīng)典AI和神經(jīng)網(wǎng)絡的最好部分。 Judea Pearl和 Eric Horvitz以及 David Heckerman的工作(Judea Pearl,1982a; Horvitz和 Heckerman,1986; Horvitz等,1986)促進了規(guī)范專家系統(tǒng)的思想:它們根據(jù)決策理論的法則理性地行動,并不試圖模仿人類專家的思考步驟。 Windows操作系統(tǒng)包含了幾個用于糾正錯誤的規(guī)范診斷專家系統(tǒng)。

????類似的溫和革命也發(fā)生在機器人、計算機視覺和知識表示領(lǐng)域。對問題和它們的復雜特性的更好理解,加上日益增加的數(shù)學成分,導致了一些可行的研究計劃和魯棒的方法盡管日益增長的形式化和專門化導致視覺和機器人這樣的領(lǐng)域在20世紀90年代一定程度上從”主流”AI研究工作中分離出來,這種趨勢在近些年已經(jīng)逆轉(zhuǎn),特別是機器學習工具已經(jīng)證明對于許多問題都是有效的。

9. 智能 Agent的出現(xiàn)(1995年一現(xiàn)在)

????也許受到解決人工智能中一些子問題的進展的鼓舞,研究者們開始再一次審視”完整Agent”問題。 Allen Newell(艾倫·紐厄爾)、 John Laird和 Paul Rosenbloom在SoAR系統(tǒng)上的工作( Newell,1990:.aid等,1987)是最有名的完整 Agent結(jié)構(gòu)的例子。智能Agen最重要的環(huán)境之一就是 Internet(互聯(lián)網(wǎng))A1系統(tǒng)在基于web(萬維網(wǎng))的應用中變得如此普遍,以致”bot(機器人)”后綴已經(jīng)進入日常用語。此外,AI技術(shù)成為許多Intern工具的基礎(chǔ),例如搜索引擎、推薦系統(tǒng)以及網(wǎng)站構(gòu)建系統(tǒng)。

????試圖建立完整 Agent的一個結(jié)果是,人們認識到當需要把它們的結(jié)果綜合起來時,以前被孤立的AI子領(lǐng)域需要被重新組織。特別是,人們普遍意識到傳感器系統(tǒng)(視覺、聲吶語音識別等)不能完全可靠地傳遞環(huán)境信息。因此,推理和規(guī)劃系統(tǒng)必須能夠處理不確定性Agent觀點的另一個主要結(jié)果是,AI與其他領(lǐng)域已經(jīng)被拉得更靠近了,例如控制論和經(jīng)濟學這些領(lǐng)域也處理 Agent。機器人駕駛汽車的最新進展來源于許多方法的混合,包括更好的傳感器,以及對傳感、定位和繪制地圖的控制理論的綜合,還有一定程度的高層次規(guī)劃。

????盡管有這些成功,一些有影響的A創(chuàng)建者,包括 John McCarthy(2007)、Marvin Minsky(2007)、 Nils Nilsson(1995,2005)和 Patrick Winston(Beal和 Winston,2009)都表達對AI進展的不滿。他們認為AI應該少把重點放在改進對特定任務表現(xiàn)很好的應用,例如駕駛汽車、下棋或者語言識別。轉(zhuǎn)而,他們相信AI應該回到它的根:致力于用 Simon的話就是”會思考、學習和創(chuàng)造的機器?!彼麄兎Q這為人類級 AI(human- level al,縮寫為HLAI)他們在2004年舉行了首次討論會( Minsky等,2004)。這需要非常大的知識庫;Hendler等(1995)討論了這些知識庫可能源于何方。

????一種相關(guān)的思想是人工通用智能(AGI, Artificial General Intelligence)( Goertzel和Pennachin,2007)子領(lǐng)域,在2008年舉辦了首次會議,并組建了期刊《Journal of Artificial General Intelligence》。AGI尋找通用的在任何環(huán)境中的學習和行動算法,它的根源可以追溯到 Ray solomonofft(1964)的工作,他是1956年 Dartmouth會議的參與者之一?!贝_保我們所建立的是真正友好的AI( Friendly Al)”也是我們關(guān)心的問題( Yudkowsky,2008;Omohundro,2008)。

10. 極大數(shù)據(jù)集的可用性(2001年一現(xiàn)在)

????縱觀計算機科學的60年歷史,作為學習的主要科目,AI的重點一直放在算法上。但A1最近的一些工作認為多關(guān)心數(shù)據(jù)而不必太挑剔所用的算法會更有意義。確實如此,因為我們擁有與日俱增的大規(guī)模數(shù)據(jù)源:例如,Web上有數(shù)萬億個單詞和幾十億幅圖像( Kilgarriff 和 Grefenstette,2006):基因序列有幾十億個堿基對( Collins等,2003)。

????這方面有影響力的一篇論文是 Yarowsky(1995)在詞語歧義消除方面的工作:在一個句子中給定單詞” plant”,它是指fora(植物)還是指 factory(工廠)呢?以前對這個問題的解法依賴于人類標注的樣例,并結(jié)合機器學習算法。 Yarowsky證明這個任務根本不需要標注樣例就可以完成,正確率可達到96%以上。給定大量的無注解的文本和兩種含義的字典定義“ works, industrial plant”和”flora,plant life”我們可以在這些文本里標注樣例,并由這些樣例自展( bootstrap)學習能幫助標注新樣例的新模式。 Banko和Bril(2001)證明了當文本從100萬個單詞增加到十億個單詞時,這種技術(shù)會表現(xiàn)得甚至更好,而且采用更多數(shù)據(jù)帶來的性能提升超過選用算法帶來的性能提升。一個普通算法使用一億個單詞的未標注訓練數(shù)據(jù),會好過最有名的算法使用100萬個單詞。

????作為另一個例子,Hays和Efos(2007)討論了在照片中補洞的問題。假設你通過Photoshop從一組照片中將一位曾經(jīng)的朋友用馬賽克模糊掉,但現(xiàn)在你需要用與背景匹配的某些東西來填補馬賽克區(qū)域。Hays和Efos定義了一個算法,從一組照片里搜索,以找出可以匹配的東西。他們發(fā)現(xiàn),如果他們只用一萬張照片,那么他們的算法的性能會很差但如果照片增加到兩百萬張時,算法會一躍而表現(xiàn)出極好的性能。

????這些工作表明,A中的”知識瓶頸”——如何表達系統(tǒng)所需的所有知識的問題一在許多應用中都可以得到解決,可以使用學習方法,而不是通過手工編碼的知識工程,只要學習方法有足夠的數(shù)據(jù)可用( Halevy等,2009)。新聞記者已經(jīng)注意到新應用的涌現(xiàn),他們寫到”人工智能的冬天”也許正釋放出一個新的春天( Havenstein,2005)。就像Kurzweil(2005)寫到的一樣,”今天,數(shù)千個AI應用已經(jīng)深深地嵌到了日常生產(chǎn)的基礎(chǔ)設施中。”

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 真名叫張曉東,烏鎮(zhèn)智庫的老大。 全方位解讀人工智能的起源,深度點評 AI 歷史趣事。 《人工智能簡史》全面講述人工...
    iOSDevLog閱讀 4,020評論 0 4
  • 應用場景 深度學習 2016 年,AlphaGo 的橫空出世掀起了人工智能的新一輪熱潮。在經(jīng)歷了近三十年的沉寂后,...
    iOSDevLog閱讀 1,765評論 0 2
  • 姓名:楊凱航 學號:17101223381 【嵌牛導讀】1950年,圖靈在其論文中提到一個著名測試“圖靈測試”,如...
    sand_d8f0閱讀 1,273評論 0 3
  • 與機器人共舞 [美] 馬爾科夫 著 郭雪 譯 取代人類還是增強人類,這是一個問題。 過去50多年里,人工智能(AI...
    i小筑閱讀 665評論 0 0
  • 人工智能通識文章索引 人工智能經(jīng)歷了半個多世紀的發(fā)展歷程,涌現(xiàn)出了眾多影響深遠的技術(shù)、學者、公司和產(chǎn)品。 我們參照...
    張老師Klog閱讀 2,534評論 0 5

友情鏈接更多精彩內(nèi)容