DeepMind兩戰(zhàn)兩勝圍棋大師李世乭,激起了人們對(duì)人工智能潛力的熱烈討論。然而DeepMind的產(chǎn)品遠(yuǎn)不止AlphaGo而已——連主打產(chǎn)品都算不上。正如公司聯(lián)合創(chuàng)始人戴米斯·哈薩比斯在本周早先說過的,DeepMind想要“解決智能問題”。為了實(shí)現(xiàn)這一目標(biāo),他有很多想法。
哈薩比斯一貫不走尋常路,不過現(xiàn)在回顧起來卻另類得不無道理。他是兒童國際象棋天才,曾5次獲得腦力奧林匹克運(yùn)動(dòng)會(huì)全能腦力冠軍,年紀(jì)輕輕就通過在游戲開發(fā)公司Bullfrog和Lionhead研發(fā)側(cè)重于人工智能的游戲《主題公園》和《黑與白》名噪一時(shí),后又成立了自己的工作室Elixir。2005年,哈薩比斯從游戲產(chǎn)業(yè)中抽身,轉(zhuǎn)而讀了個(gè)神經(jīng)科學(xué)博士,隨后在2010年成為了DeepMind的聯(lián)合創(chuàng)始人。
在AlphaGo首戰(zhàn)告捷后的上午,哈薩比斯接受了The Verge的采訪。當(dāng)谷歌一位負(fù)責(zé)人告訴他一夜之間韓國媒體發(fā)表了超過3300篇關(guān)于他的文章后,他難掩驚訝。“太難以置信了,不是嗎?”他說道。“看到小眾的東西變得這么流行還真是有趣。”
除了AlphaGo,我們的談話還涉及了電玩、下一代智能手機(jī)助手、DeepMind在谷歌旗下扮演的角色、機(jī)器人、人工智能如何輔助科學(xué)研究等等。料很多,慢慢看。
(以下內(nèi)容酌情略有刪減)
“?圍棋一向是人工智能研究的終極目標(biāo)
對(duì)既不了解AI也不了解圍棋的人,你要如何描述昨天發(fā)生的事所引起的文化共鳴?
我想就此說幾點(diǎn)。圍棋一直以來都是完美信息博弈的巔峰。在可能性上,它遠(yuǎn)比國際象棋復(fù)雜。因此在AI研究領(lǐng)域,尤其是繼“深藍(lán)”之后,圍棋一直是大家的終極目標(biāo)。正如你所知,盡管付出的努力不少,卻收效甚微。
“蒙特卡羅樹搜索”是十年前的重大創(chuàng)新,但我們將直覺層面引入了AlphaGo的神經(jīng)網(wǎng)絡(luò),而頂級(jí)棋手之所以杰出正是因?yàn)樗麄兊闹庇X力。連比賽現(xiàn)場解說員邁克爾·雷德蒙都無法算出勝負(fù),這真令我震驚,他可是職業(yè)九段!這正顯示出了圍棋的估值函數(shù)寫起來有多難。
比賽過程中,AlphaGo有沒有哪幾手棋是出乎你意料的?
有的。當(dāng)AlphaGo向左下角李世乭的地盤猛攻時(shí),我們相當(dāng)震驚——從李世乭的表情來看,我想他也這么覺得。這是很出人意料的一招。
因?yàn)檫M(jìn)攻太猛?
應(yīng)該說一方面攻得太猛,一方面又太魯莽了!并且它對(duì)李世乭將計(jì)就計(jì)。李世乭以富有創(chuàng)造力的進(jìn)攻著稱,他在比賽中也是這么做的,我們猜到他會(huì)這樣。比賽開局,一切還沒落定,他就全盤各處進(jìn)攻。傳統(tǒng)的圍棋程序非常不善于應(yīng)對(duì)這樣的比賽,它們在局部計(jì)算上并不差,但需要大局觀的時(shí)候就顯出劣勢了。
“?為什么說谷歌圍棋的勝利如此重要?
舉辦比賽的初衷之一就是為了考察AlphaGo的實(shí)力。你從昨晚的比賽看出了什么?
事情比我們希望的還要好。我們之前認(rèn)為比賽的勝率是50:50。我現(xiàn)在還是這么認(rèn)為;一切皆有可能,李世乭也會(huì)以不同的戰(zhàn)術(shù)應(yīng)戰(zhàn)。因此能一探究竟是很有趣的。
繼續(xù)你的第一個(gè)問題,人工智能的意義,你也聽我說起了AlphaGo和“深藍(lán)”的不同?!吧钏{(lán)”是定制的程序,程序員從國際象棋大師那里將信息提煉為具體規(guī)則和啟發(fā)式算法,而我們則賦予了AlphaGo學(xué)習(xí)的能力,讓它自己從練習(xí)和培訓(xùn)中學(xué)習(xí),這點(diǎn)更與人類更接近。
如果AlphaGo照這樣贏下去,接下來是什么?未來會(huì)有其他的人工智能比賽嗎?
對(duì)于完美信息博弈,圍棋已經(jīng)是頂點(diǎn)了。當(dāng)然,還有其他的圍棋大師可以與之對(duì)決。也還有其他的競技項(xiàng)目——無限注撲克很難,多玩家的形式很有挑戰(zhàn)性因?yàn)檫@是一種不完美信息博弈。當(dāng)然,還有各種人類比計(jì)算機(jī)玩得好的電競游戲,比如在韓國大受歡迎的《星際爭霸》。策略游戲?qū)Ψ峭昝佬畔⑹澜缰械牟呗阅芰τ泻芨叩囊螅侵^“部分觀察”。但圍棋中你可以看到整個(gè)棋盤,對(duì)計(jì)算機(jī)來說難度會(huì)小些。
你對(duì)稱霸《星際爭霸》有興趣嗎?
也許吧。我們的目標(biāo)不是要橫掃競技項(xiàng)目。我愛游戲,也曾經(jīng)編寫過電腦游戲。但前提是游戲能作為測試我們編寫的算法的平臺(tái),這樣來測試算法效率較高而已。最終我們是想要將它應(yīng)用于解決現(xiàn)實(shí)世界中的重大問題。
能談一下你現(xiàn)在從事的和之前從事的游戲業(yè)的區(qū)別嗎?
像DeepMind這樣的東西是我一直以來的終極理想。從某種意義上說,我已經(jīng)為之計(jì)劃了20多年。我之前所做的都是為了從事有朝一日投身到人工智能的領(lǐng)域。如果你熟悉我在Bullfrog等公司所做的事情,你就會(huì)知道,我所圍繞和涉及的工作重心全是AI。
從16、7歲制作《主題公園》起,我就意識(shí)到了人工智能的巨大潛力。我們的游戲有數(shù)百萬的銷量,無數(shù)人沉浸其中,都是因?yàn)锳I的功勞。在此基礎(chǔ)上,我曾嘗試在游戲制作生涯中更進(jìn)一步,然后就轉(zhuǎn)向了神經(jīng)科學(xué)的學(xué)習(xí),因?yàn)樵?005年左右我覺得已經(jīng)很難再打著制作游戲的旗號(hào)進(jìn)行AI研究了。畢竟發(fā)行商想要的只是游戲,對(duì)吧?
所以截止到那時(shí),AI最大的用武之地就是游戲咯?
我認(rèn)為是這樣的,而且當(dāng)時(shí)我們做的還是前沿得不得了的AI。90年代,學(xué)術(shù)研究進(jìn)度放緩,所有諸如神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這些新科技都還沒得到普及。所以事實(shí)上最好的AI都是在游戲中出現(xiàn)的。那還不是我們今天搞的這種學(xué)習(xí)型AI,而是有限狀態(tài)的機(jī)器,但是它們已經(jīng)相當(dāng)復(fù)雜并且可以自適應(yīng)了。像《黑與白》這樣的游戲就用到了強(qiáng)化學(xué)習(xí)——我至今仍然認(rèn)為這是強(qiáng)化學(xué)習(xí)在游戲中最復(fù)雜的典范。但是到了04、05年,游戲產(chǎn)業(yè)已經(jīng)發(fā)生了變化,不再像90年代那樣既有趣又有創(chuàng)意,可以容你隨意實(shí)現(xiàn)自己的想法了,而是充斥著與游戲畫面、銷售和FIFA游戲這些相關(guān)的東西,變得不再那么有趣。我在游戲領(lǐng)域中已經(jīng)發(fā)揮到極致,是時(shí)候搜集不同的信息來準(zhǔn)備創(chuàng)立DeepMind了。這就關(guān)系到了神經(jīng)科學(xué)。我想從人腦解決問題的過程中得到啟發(fā),那么還有什么比讀個(gè)神經(jīng)科學(xué)PhD更好的方法呢?
IBM已經(jīng)將“沃森”應(yīng)用于癌癥診斷中。DeepMind又能給我們帶來什么呢?
現(xiàn)在談這個(gè)還有點(diǎn)早。幾周前我們宣布了和NHS的合作,而那只是為機(jī)器學(xué)習(xí)提供平臺(tái)的開始。以我的理解,“沃森”跟我們所做的還是很不一樣的。“沃森”更像個(gè)專家系統(tǒng),是一種不同類型的AI。這類AI做的是對(duì)圖像進(jìn)行醫(yī)學(xué)分析,縱向跟蹤重要信號(hào)或隨著時(shí)間自我積累,來幫助人們建立更健康的生活方式。這對(duì)強(qiáng)化學(xué)習(xí)來說是很適合的。
談?wù)勚悄苁謾C(jī)助手吧。你在開賽日的講話中用到了電影《她》中的畫面。所以未來就是那樣的嗎?
不,我的意思是《她》代表了對(duì)這類事物的主流觀點(diǎn)。我認(rèn)為人們想要的是智能、連貫且深刻理解你真正想表達(dá)的意思的智能手機(jī)助手。
現(xiàn)階段這類系統(tǒng)還不堪一擊——一旦涉及到程序沒有的模板,它們就全無用處。因此關(guān)鍵是要讓它們變得真正具有自適應(yīng)力,更靈活穩(wěn)健。
優(yōu)化這些系統(tǒng)需要什么樣的突破?為什么不能明天就開始著手進(jìn)行?
能是能,我只是覺得要換個(gè)角度。這還是預(yù)編程序與學(xué)習(xí)程序的區(qū)別。目前基本所有智能手機(jī)助手都是特定預(yù)編的,這就意味著它們只能做預(yù)設(shè)好的事。然而現(xiàn)實(shí)世界混亂而復(fù)雜,手機(jī)用戶會(huì)做出各種不可預(yù)判的行為。DeepMind的根本理念是,AI的唯一途徑就是從根本上進(jìn)行學(xué)習(xí)并且有通用性。
AlphaGo是從學(xué)習(xí)大量棋譜起步的。然而對(duì)于智能手機(jī)來說輸入數(shù)據(jù)要多樣得多。
是的,學(xué)習(xí)正是通過海量的資料來完成的。事實(shí)上,我們打算在接下來的數(shù)月里嘗試AlphaGo算法——我們想去掉一開始的督導(dǎo)學(xué)習(xí)部分,完全讓他自學(xué),徹底從零開始。這樣需要花費(fèi)的時(shí)間要更長,因?yàn)殡S機(jī)下棋需要花更多的時(shí)間來訓(xùn)練試錯(cuò),或許得好幾個(gè)月。但是我們認(rèn)為讓它純自學(xué)成才是可能的。
你說的可能是因?yàn)楝F(xiàn)在的算法比過去先進(jìn)?
不,之前的算法也可以。這樣并不會(huì)讓程序變強(qiáng),只是讓它自學(xué),沒有監(jiān)督輔導(dǎo)的部分。我們認(rèn)為這個(gè)算法不需要督導(dǎo)也可以。我們?nèi)ツ暧醚胚_(dá)利游戲測試時(shí)就沒有任何人類知識(shí)的引導(dǎo),只是從在屏幕上隨機(jī)行動(dòng)開始的。
雅達(dá)利游戲比較容易吧,因?yàn)槭「@而易見?
比較容易是因?yàn)楸确指幸?guī)律。在圍棋中,無論結(jié)束時(shí)你是贏是輸都只得1分。這就是信用賦值問題,關(guān)鍵之處在于圍棋中你下了一百手棋,但是不確定哪幾步導(dǎo)致了輸贏,所以信號(hào)是很弱的。而在絕大部分雅達(dá)利游戲中,你做的絕大多數(shù)事都會(huì)讓你得分,所以你得到的線索會(huì)更多。
對(duì)于人工智能改變手機(jī),你能不能給出個(gè)時(shí)間范圍?
我想,在接下來的2-3年內(nèi)你就會(huì)看到苗頭了。開始可能變化不大,只是有些方面進(jìn)步了。或許在4-5年后功能上會(huì)有一大步飛躍。
谷歌有沒有左右你們配合他們的產(chǎn)品方針或商業(yè)模型來行事?
沒,我們可以自由掌控對(duì)研究進(jìn)度的優(yōu)化。我們的使命就是如此,我們就是為此才加入谷歌的,因?yàn)檫@樣可以提升我們的研究進(jìn)度。過去兩年就是這么過來的。
當(dāng)然,我們也在做許多谷歌內(nèi)部產(chǎn)品,但那些還只初具雛形,不便公開。當(dāng)然,智能手機(jī)助手是重中之重,桑達(dá)爾·皮查伊也多次談到它是谷歌未來發(fā)展的核心。
“?谷歌的支持對(duì)AlphaGo來說“非常重要”?你們和谷歌大腦有互動(dòng)和交叉嗎?
當(dāng)然,我們其實(shí)非常有互補(bǔ)性。我們每周都要交流。谷歌大腦主要注重于深度學(xué)習(xí),有杰夫·迪恩這樣了不起的工程師,所以他們已經(jīng)深入到了公司的每個(gè)角落,才有了像谷歌照片搜索這么棒的東西。他們做得出色極了。他們也位于Mountain View總部,所以離產(chǎn)品部更近,研究周期只有12-18個(gè)月。而我們做的是算法開發(fā),周期要2-3年,一開始也并沒有明確的產(chǎn)品指向。
谷歌對(duì)AlphaGo的支持有多重要?沒有谷歌你們能成功嗎?
非常重要。AlphaGo在比賽中并不需要用到很多硬件,但是訓(xùn)練中我們需要很多硬件支持,嘗試不同版本,讓它們在云端展開對(duì)戰(zhàn)。要想高效實(shí)現(xiàn)這些就需要大量的硬件,如果沒有這些資源我們是無法在這么短時(shí)間里完成的。
我在日本工作,現(xiàn)在機(jī)器人在日本有兩種用途。一種是發(fā)那科這樣的公司的工業(yè)機(jī)器人,還有一種是軟銀的Pepper這樣的管家式機(jī)器人等等。從某些角度說都很厲害,但使用范圍有限。你怎么看?
是的,正如你所說,發(fā)那科機(jī)器人的物理功能很強(qiáng),但他們?nèi)狈χ橇?。管家機(jī)器人則有些類似智能手機(jī)助手——也是以模板響應(yīng)來預(yù)編的。
如果你的行為超出這個(gè)范圍,他們就傻眼了。
那么機(jī)器學(xué)習(xí)會(huì)如何提升機(jī)器人的能力呢?
這是完全不同的另一方面了。你要從頭創(chuàng)造學(xué)習(xí)新事物的能力,還要具備應(yīng)對(duì)意外的能力。對(duì)于任何機(jī)器人和軟件來說,在現(xiàn)實(shí)世界中與現(xiàn)實(shí)用戶互動(dòng),這些能力都是必須的,這樣才能讓它們派上用場。我相信學(xué)習(xí)的道路終歸是對(duì)的。
眼下,學(xué)習(xí)型機(jī)器人最實(shí)際的用途是什么?
說實(shí)話我們沒怎么考慮過這點(diǎn)。顯然,無人駕駛車可算是機(jī)器人,但目前為止還是狹義人工智能——盡管在計(jì)算機(jī)視覺方面用到了學(xué)習(xí)型AI。特斯拉用的是幾乎現(xiàn)成的基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)。我確信日本在考慮研發(fā)老年護(hù)理機(jī)器人,我覺得家務(wù)機(jī)器人對(duì)社會(huì)也是極有用的,尤其是考慮到人口老齡化這個(gè)嚴(yán)峻問題。
學(xué)習(xí)型機(jī)器人為什么會(huì)在這些領(lǐng)域尤為出眾呢?
你應(yīng)該先想想“為什么我們還沒有這些東西呢?”為什么沒有能包攬家務(wù)的機(jī)器人?原因就在于每人的家在布局和家具等方面都完全不同。即使在室內(nèi),情況每一天也不盡相同——有時(shí)會(huì)變得凌亂,有時(shí)會(huì)變得整潔。所以你沒法給機(jī)器人預(yù)編程序來打掃房間,對(duì)吧?更不用說人們在如何疊衣服上都有不同的偏好。這正是問題的復(fù)雜之處。這些對(duì)人類來說很簡單,但事實(shí)上在做這些事的時(shí)候,我們是在處理異常復(fù)雜的情況。
我問一句:你用掃地機(jī)器人嗎?
呃……我們的確有一臺(tái),但不太好用……(笑)
從長遠(yuǎn)看,你對(duì)人類、機(jī)器人及人工智能在未來的互動(dòng)有何期待?
我個(gè)人并沒太多考慮過機(jī)器人。真正令我對(duì)運(yùn)用這種AI感到激動(dòng)的領(lǐng)域是科學(xué)。我期待能由AI研究助手來完成一些枯燥的工作,挖掘有趣的文章,在數(shù)量龐大的數(shù)據(jù)中摸索出結(jié)構(gòu)并呈現(xiàn)給人類專家和科學(xué)家,使他們能夠更快地取得突破。幾個(gè)月前我在CERN進(jìn)行了一次演講。
顯然,他們產(chǎn)生的數(shù)據(jù)比地球上任何其他人都多,也許在他們龐大硬盤的某處就藏著新粒子,只是因?yàn)閿?shù)據(jù)太多而沒人來分析發(fā)現(xiàn)。所以,要是有一天AI能參與發(fā)現(xiàn)新粒子,就太酷了。
真是精彩的結(jié)語。
?來源:The Verge作者:Sam Byford編譯:未來論壇 商白
文章轉(zhuǎn)載請注明出處為 “未來論壇”微信賬號(hào)(ID:futureforum)
未來論壇官網(wǎng):www.futureforum.org.cn