一年燒兩億做人工智能?奧賽金牌閆安的AI征程

閆安比約定的時間早到了幾分鐘。見到我時,他笑著站起來跟我握手。他的冰咖啡已經(jīng)喝了一大半。

2017年3月一個工作日上午10點,香港IFC里這家咖啡店已然滿座。我們旁邊坐著膚色各異,講不帶口音英語的型男型女。他們穿著貼身西裝小背心,頭發(fā)用塑形膠整得棱角分明。

坐在我面前的閆安穿著休閑襯衫,放松自然,頭發(fā)也無立體造型。他氣質(zhì)樸實,卻跟周圍人群有種“和而不同”之感。

閆安在北京出生、長大。他是1996年國際數(shù)學(xué)奧林匹克競賽(IMO)金牌得主。閆安1997年保送北京大學(xué)數(shù)學(xué)系,2000年本科畢業(yè),進入美國斯坦福大學(xué),先后學(xué)習(xí)數(shù)學(xué)和金融。在斯坦福大學(xué)攻讀金融博士學(xué)位期間,閆安離校,前往高盛東京的Sales and Trading Desk工作。

“我對自己學(xué)的東西,特別是金融理論沒信心,想去行業(yè)內(nèi)看看到底在發(fā)生什么。”他這樣解釋當(dāng)初的動機。

閆安在高盛東京工作了一年。他很快發(fā)現(xiàn)自己對金融業(yè)興趣不大,但高盛倡導(dǎo)的“Long Term Greedy(長期貪婪)”理念引發(fā)他深思。

“我覺得(這說法)很有道理,但Greedy(貪婪)最終的目的是什么?我在高盛沒有找到。我覺得他們的目的是把自己變成一堆錢。但是把人變成一堆錢之后呢,要做什么?”

輾轉(zhuǎn)幾家國際金融機構(gòu),從美國到東京到香港,閆安找到了答案——人工智能。

閆安認為,人工智能是未來社會的基礎(chǔ)設(shè)施,對于世界的重要性,將不亞于水、電、氣。就像每一個城市都有自己的醫(yī)院一樣,未來每一個城市都應(yīng)該有自己的DeepMind(英國的一家人工智能公司,2014年被谷歌收購)。

閆安想,如果自己能在人工智能的任何一個方向取得突破,比如數(shù)學(xué)定理證明、深度強化學(xué)習(xí),都會創(chuàng)造無法估量的價值:“這是讓我非常興奮的目標(biāo),就是我們可以集體走進一個更高級的社會?!?br>

就像一個彷徨許久的人終于在茫茫人海中發(fā)現(xiàn)真愛,閆安就這么找到了人工智能。

至于怎么推進人工智能的研究,閆安一開始并沒有清晰的線路。他一門心思要去做研究、讀論文。這個行業(yè)論文閱讀量巨大。行業(yè)三大會議之一,ICLR(International Conference of Learning Representation)一次發(fā)500篇論文。閆安一個人可能要花兩個月時間讀完。剛讀完,下一波論文又出來了。

2016年12月的一天,閆安靈光一動,萌發(fā)了開公司的念頭?!拔乙幌?,這件事這么好,我要去促進這件事啊?!?br>

當(dāng)月,公司在香港正式注冊,閆安成為唯一的股東和董事。他一邊做研究,一邊開公司賬戶,一邊琢磨公司融資、運作模式。

2017年2月,閆安在北大香港校友會的春節(jié)聚餐上分享了自己對于人工智能的思考。3月,閆安又前往香港英皇佐治五世學(xué)校跟中學(xué)生們做了一次講座。

普及AI領(lǐng)域的進展,在閆安看來,是自己“力所能及的主要公共服務(wù)”。

閆安3月在香港英皇佐治五世學(xué)校為中學(xué)生們做人工智能的講座。這是講座的PPT截圖。


在另一條戰(zhàn)線上,閆安積極地跟香港高校聯(lián)系科研合作。如果順利,今年夏天,韓國首爾國立大學(xué)和香港科技大學(xué)的兩組學(xué)生將加入閆安的AI研究小組。這將部分緩解他的科研壓力。

“閆安雖然看上去很理想主義,其實落地能力很強?!遍Z安的朋友王遠航告訴我。

這幾個月,閆安像他研究的學(xué)習(xí)系統(tǒng)一樣,一邊跟環(huán)境交互,一邊學(xué)習(xí)、提高。

他關(guān)于公司的想法在演變。今年3月初,我第一次跟閆安聊到商業(yè)模式時,他說自己并不是從原則上反對商業(yè)化。一個多星期后,我們再見面,他決定不再考慮商業(yè)模式,以非營利的方式來運作公司——“類似美國的 OpenAI”。

目前閆安主要精力集中在三條主線:一是人工智能安全性的研究;二是連續(xù)更新的Literature Review(由于文獻綜述工作量大,他覺得最好是有個科學(xué)家團隊組織起來,一人看一塊);三是自動數(shù)學(xué)定理的證明。

“說不定六七年之后,計算機就會解決數(shù)學(xué)中未解決的問題——例如哥德巴赫猜想(哥德巴赫猜想用現(xiàn)代數(shù)學(xué)語言可以陳述為:任一大于2的偶數(shù),都可表示成兩個素數(shù)之和) 。可能出來的證明是幾百頁誰也看不懂的邏輯符號?!彼f。

閆安在微信上拉了一個“AI資訊群”。幾十個人中,就有多位數(shù)理化信息學(xué)國際奧賽金牌得主。群里的小伙伴們紛紛稱閆安為“教主”。

一次,微信群討論招人的問題,有朋友問閆安:“在中國能發(fā)頂會(頂級會議)的人行情價就要六十萬起,你真的準備招嗎?”

“招,一百萬起。”閆安說,“100個這樣的人就能組半個DeepMind了,年費一個億,這是多好的deal?加上各種overhead(運營費用),年費兩億。”

這時,群里一位奧賽金牌朋友立即潑冷水:“建議教主多接觸一下現(xiàn)實生活?!?br>

也許在外人看來,閆安對人工智能的執(zhí)著似乎有點“堂吉訶德”的味道。然而他對怎樣前進,其實心中已經(jīng)有了清晰的路線圖。

閆安告訴我,人工智能一旦成為社會的基礎(chǔ)設(shè)施,我們會生活在一個非常不一樣的世界。那個時候再來看現(xiàn)在的我們,會像我們現(xiàn)在去看工業(yè)革命之前的世界。

他說:“跟這件事比起來,其它事就不那么重要了。”

對話

Q:你最早關(guān)注人工智能是什么時候?

A:2013年,我發(fā)現(xiàn)出現(xiàn)了很多人工智能的新聞,圖像識別領(lǐng)域出現(xiàn)了突破。2013年底,倫敦的一家公司DeepMind用計算機玩視頻游戲取得了一些進展,2014年初它被谷歌收購??吹竭@些新聞后,我覺得這個領(lǐng)域很有意思,就去學(xué)一些相關(guān)的知識,像計算機,神經(jīng)科學(xué)。一邊學(xué),一邊看新的論文。

Q:作為一名研究者,你發(fā)現(xiàn)這個領(lǐng)域和其它學(xué)科最大的不同是什么?

A:首先,這個領(lǐng)域的論文都比較公開。不像商學(xué)院、數(shù)學(xué)系,那些論文要發(fā)表之后很久,Review (被評審)之后過了一年才出來。這個領(lǐng)域的進展速度是我以前從沒有見過的。以前不管數(shù)學(xué),還是金融,都是你要學(xué)很久才能到這個領(lǐng)域的前沿。然后你發(fā)現(xiàn),到了前沿,大多數(shù)commonsensically(常識上)可以做的東西都被做的差不多了。只有一些很小的地方往前走一點,而要花很多時間才能真正理解別人在做什么。

而這個領(lǐng)域很不一樣,就好像哥倫布發(fā)現(xiàn)新大陸一樣,你發(fā)現(xiàn)有好多可以做的東西。原因是這個領(lǐng)域之前經(jīng)歷了一個長時間的寒冬。人們起先認為用神經(jīng)網(wǎng)絡(luò)的方式去做人工智能是行不通的。因為之前一直缺少證據(jù)。全世界只有一小撮人在做。因為人不夠,所以這個領(lǐng)域發(fā)展受到了很大的阻礙,比別的領(lǐng)域緩慢很多。但這一次重新來過之后,你就發(fā)現(xiàn)你要用幾年的時間,把過去20年時間落下的進程補回來。只要你有一定基礎(chǔ),你就可以馬上去接觸到前沿的東西。

今年4月24號即將召開一個行業(yè)頂級會議,ICLR(International Conference of Learning Representation), 去年11月份截止收論文。官網(wǎng)顯示來自全世界的作者交了490篇論文,其中選出可以口頭去講的是15篇,占到約3%。這15篇里面,大部分都是谷歌、Facebook這種很大的實驗室出的。但還有一篇Single Author (單一作者)的文章,是個大三的學(xué)生寫的。

這是個很開放的領(lǐng)域。你不需要是一個積累了十幾年二十幾年的專家,在一個方向上突破一兩年,有一定積累,你就可以走到世界前沿。我可以作為一個不是內(nèi)行的人,很快了解到前沿,很快看到前景是什么。

Q:你怎樣理解人工智能的前景?

A:首先,前景并不是我去做一個應(yīng)用程序讓大家去download(下載),或者我去做一個網(wǎng)站,提供一個服務(wù)。

我們沿這個方向走下去,可以把人類智能做到機器里面去,就可以很快規(guī)?;?、放量。本質(zhì)上講我們面對的是一個潛在的、未來智能化的系統(tǒng)。像一個新的基礎(chǔ)設(shè)施一樣,把整個社會推到新的高度上。就好像我們現(xiàn)在這個社會很繁榮,很大程度上依賴于水電氣很方便供應(yīng)給大家,有一個城市,大家可以在里面很開心地生活。

你想,未來的基礎(chǔ)設(shè)施是什么?就是可以把人的智能實現(xiàn)出來。比如你想看電影,可能這個計算機跑幾個小時,一個新的電影出來了。不需要導(dǎo)演,演員去拍。你說你需要軟件,軟件也可以計算機自己來生成,你告訴它你需要什么,然后它生成這些程序。這是個運算的過程。再比如說像Google這個網(wǎng)站,它有20億行代碼,2萬5000名工程師(根據(jù)2015年9月的Wired數(shù)據(jù)),每天有很多個更新,代碼不斷擴張。這個事情對人的價值很大的,本質(zhì)上也是個計算的過程。在生活中把知識、常識轉(zhuǎn)換成代碼放進去。這件事本質(zhì)上也可以數(shù)字化。

當(dāng)我們有一個很好的基礎(chǔ)設(shè)施,可以自動地去生成這些東西的時候,那么我們生活的社會是一個非常不一樣的社會。那個時候看我們,就好像我們看工業(yè)革命之前一樣。

所以看到這個前景之后,其它事情,跟這個比較起來,都不是那么重要了。

Q:你的切入點在哪里?

A:我最早的想法是,我就好好學(xué),爭取自己寫一些論文,走在前面。慢慢我發(fā)現(xiàn),這件事是不切實際的。比如ICLR一次發(fā)500篇論文,一個人想去把它讀下來?你都沒有時間把它讀完。等你花兩個月時間把它讀完,下一波論文又出來了。

這個領(lǐng)域像ICLR這樣的會議有三個。另外兩個,一個叫ICML(International Conference of Machine Learning),一個叫NIPS (Neural Information Processing System)。其中NIPS是最重要的,其次是ICML,其次才是ICLR。然后呢,每一個會議都會有一個deadline(截止日期),分別是11月,2月和5月。每到這個deadline,就會有大批論文出來。

所以這個領(lǐng)域,是每年前進三步。像剛剛結(jié)束的這個ICML的deadline,我有很多論文要看。光是DeepMind,這個月就發(fā)了至少7篇論文。進展非??斓脑?,你要往前線做研究。雖然前線很近,你如果知道哪個方向,可能一兩年就可以到那個方向——但你怎么知道哪個方向,因為你有這么多的方向在同時前進。

Q:所以你感覺需要一個團隊?

A:所以比較好的方法,是有個科學(xué)家團隊組織起來,每個人看一塊,通過互相的交流,對整個發(fā)展有一個全貌,再去實現(xiàn)這些論文上的具體的做法。因為很多論文不包括源代碼。寫好之后,有一個Expertise(專業(yè)權(quán)威),既知道之前發(fā)生什么,又有自己的工程能力,這時候可以再往前突破,可以很有效率,走的方向也是對這個領(lǐng)域的前進產(chǎn)生效果。

像DeepMind,Google Brain這樣有一個團隊,是有很大的優(yōu)勢的。所以如果我們要為這個領(lǐng)域做一些貢獻的話,至少也要有一個相當(dāng)規(guī)模的團隊。

Q:你具體的線路圖是怎么樣的?

A:我現(xiàn)在具體做的事有這么幾條線:

因為一個人沒有很多時間寫代碼,我先做一些人工智能安全性的研究。社會上很多人很重視:把人的智能做到計算機里面,會不會出現(xiàn)終結(jié)者、天網(wǎng)這樣的事?我想說,東西出來之后,相當(dāng)于是一個很有智慧的基礎(chǔ)設(shè)施。比如說我們生活的環(huán)境,地球,作為一個系統(tǒng),它是很有智慧的。我們在這個地球上誕生。但我們不會覺得它是個危險的環(huán)境。一個好的人工智能,它是一個推著我們前進的相當(dāng)自然的東西。不能把它想成一個有了超級能力的人,他會跟我們?nèi)屬Y源,或者奴役我們。不是這樣。

如果自己能寫一些東西出來,能把人工智能的公關(guān)問題解決,讓大家覺得這是一個很好的東西。

還有一條線:我想寫一個連續(xù)更新的literature review(文獻綜述)?,F(xiàn)在文獻更新速度太快。你一個人做不到能夠走到前線。我也在盡量找有興趣的人一起做。大家一起做review。有人去看memory,有人去看continual learning,有人看應(yīng)用、圖像、影音,大家能拼成一個完整的圖。

具體的項目,我也在考慮去做自動數(shù)學(xué)定理的證明。這塊一個好處呢,就是,你看AlphaGo。如果你看圍棋的領(lǐng)域進展,你看計算機圍棋的水平,從一段,二段,三段,突然就10段。是一個爆發(fā)的過程。它是怎么爆發(fā)的。本來下圍棋的系統(tǒng)是很成形的。就是你看到一個棋盤,猜下一步怎么走,把所有線路模擬出來,看哪一個最好,怎么下。這個事情不practical(實際),因為圍棋變化太多,你真的用計算機窮舉的話,計算能力不夠。所以AlphaGo做了件什么事呢,它把這個窮舉這個過程,用神經(jīng)網(wǎng)絡(luò)來代替。

我不是去窮舉所有的做法,我是用神經(jīng)網(wǎng)絡(luò)去猜。200種做法,我只看20種做法,就知道怎么走。他們是把人工智能新的做法,放到一個已經(jīng)成形的系統(tǒng)中去。我覺得類似的事情很可能在未來幾年內(nèi)也發(fā)生在自動定理證明這個領(lǐng)域。

因為數(shù)學(xué)證明也是我們知道要證明什么,也知道有哪些假設(shè),然后像下棋那些用樹形搜索的方式。窮舉下一步要證的,本身也是沒有效率的。如果把人工智能的方法做進去,感覺會有新的提高。說不定六七年之后,計算機就會解決數(shù)學(xué)中未解決的問題(例如哥德巴赫猜想)。可能出來的證明是幾百頁誰也看不懂的邏輯符號。這樣的話既是一個很好的實用項目,又是一個很好的理論項目。

實用上就是你在一個很好的方向上為社會做出了貢獻。你也可以推動更多數(shù)學(xué)家轉(zhuǎn)型做別的。他們都很聰明,可以去推動別的方向發(fā)展。理論上,你也可以進一步提升人工智能本身的能力。因為數(shù)學(xué)證明還是比圍棋難得多的一個領(lǐng)域。

Q:AI的哪個方向最讓你興奮?

A:AI這個領(lǐng)域很大。對外行來講,細分一下,就是Deep Learning(深度學(xué)習(xí))。再細分一點,叫Deep Reinforcement Learning(深度強化學(xué)習(xí))。它跟Unsupervised Learning有很大的交叉。再往下面細分,就是構(gòu)造一個好的學(xué)習(xí)的架構(gòu)。這個架構(gòu)的設(shè)計,會用到很多來自神經(jīng)科學(xué)、或者認知科學(xué)等其他領(lǐng)域的啟發(fā)。把人的智能構(gòu)造,放到學(xué)習(xí)架構(gòu)里去,把這個學(xué)習(xí)架構(gòu)放到相對復(fù)雜的系統(tǒng),去提高學(xué)習(xí)架構(gòu)的智能。

這個系統(tǒng)可以像圍棋,也可以像游戲,也可以是很多游戲串起來。原則上講就是在不同系統(tǒng)中提高學(xué)習(xí)架構(gòu)的智能。這個是比較有前途的方向,也是我希望最終能發(fā)布研究成果的方向之一。

Q:現(xiàn)在有不少做量化交易的團隊稱用了人工智能技術(shù)進行交易,不知道你是否了解AI在這方面的應(yīng)用?
A:很多人說用人工智能,但是人工智能是個很廣闊的領(lǐng)域,我很難判斷他們是否實質(zhì)上在使用近兩三年的新成果。
Q: 你怎樣思考公司的商業(yè)模式?

A:所謂“商業(yè)模式”的主要目的,就是作為企業(yè),有錢進來。先融資,請工程師,做個系統(tǒng),賣給別人。這些人獲取了商品服務(wù)把錢給我。但如果我可以直接賣一些股權(quán),把錢收回來,我可以節(jié)省這個流程。

你作為一個研發(fā)的機構(gòu),做了很好的項目,比如你解決了哥德巴赫猜想,其實你只需要賣一點點股權(quán),就可以進來很多錢。不用再去走這個流程,賣東西再進來錢。這個對你的精力也是一種分散。

這件事情的價值是在最后,我們可以去建成一個好的、智能的基礎(chǔ)設(shè)施的時候。價值是巨大的。你可以自動生成Google、Facebook的東西。如果20年能建成,你給它一個估值吧。Bill Gates曾經(jīng)說誰要能突破Machine Learing,這個價值至少是10個Microsoft。你的精力應(yīng)該放在增加實現(xiàn)這件事情的概率上,時間不應(yīng)該去做商業(yè)上的應(yīng)用,除非這個應(yīng)用很好做。但沒必要找個團隊,去跟客戶溝通。我并不是從原則上反對商業(yè)化,如果商業(yè)化能促進這件事發(fā)展,我們也會做。

(我第二次跟閆安聊天時,閆安告訴我:如果你現(xiàn)在問我同樣的問題,我會回答公司不再考慮商業(yè)模式,而是以非營利的方式來運作,類似美國的 OpenAI )。

Q:你現(xiàn)在在尋找合伙人嗎?

A:合伙人、員工、投資者,都可以找。還是要看大家的興趣。

我沒有特別花精力找投資者。投資者一進來就是給錢,拿股權(quán)。一年見不到幾次。我不希望這樣的交互。我希望持股的人跟我有很多的時間一起做事情。理想情況是找到一起做事情的合伙人。有時間學(xué)習(xí)又沒財務(wù)壓力的人,不太好找。退而求其次,就是一邊發(fā)工資,一邊融資。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容