最近幾個星期,有一部美劇可謂是火到不行,那就是HBO最新制作的《西部世界》,這部美劇的基礎(chǔ)是上世紀80年代的同名美國科幻片(又譯作《血洗樂園》)。

在這部美劇中,人類創(chuàng)造了一個“樂園”,樂園被設(shè)計成西部電影中的場景:沙漠、酒吧、木制教堂、牛仔和治安官。但特別的是,這個樂園中的人們實際上都是游戲中的“NPC”一樣的存在,他們實際上是人類制造的具有人工智能的機器人(因為并未看到傳統(tǒng)的機械結(jié)構(gòu),他們的內(nèi)部也有類似肌肉、骨骼一類的組織,所以或許稱為“仿生人”更加恰當(dāng))而已?!翱腿恕眰兛梢杂袃?shù)貋淼綐穲@中,對機器人為所欲為。
野風(fēng)君今天的文章不是來劇透的,也不是單純地向大家來推薦這部美劇,而是想和大家聊聊和這部美劇緊密相連的“人工智能”這個話題。
“人工智能”這個概念在近幾年可謂是如雨后春筍,在和我們?nèi)粘I罹o密聯(lián)系的各個領(lǐng)域被一提再提乃至大肆炒作:“人工智能的語音助手”、“人工智能的地圖導(dǎo)航”、“人工智能的安保系統(tǒng)”,等等的宣傳語不勝枚舉。看了《西部世界》之后,關(guān)于人工智能的討論又火熱了起來。很多人都很想知道影視作品中的那種難辨真假的人工智能產(chǎn)物究竟離我們還有多遠。
首先,野風(fēng)君認為,和影視劇中一樣“難辨真假”的“人造人”或許給我們帶來的并不一定是更加美好的生活。著名的“恐怖谷理論”也認為:和我們?nèi)祟愄^相似的機器人很可能會給我們帶來天然的恐懼感,令我們對其感到反感。前不久,野風(fēng)君聽取的著名計算機科學(xué)家李開復(fù)的演講中,他也堅定地認為:“可以成功的機器人產(chǎn)品一定是和真人不過分相似的?!北M管,李開復(fù)博士論述的角度有所不同,但是野風(fēng)君也認為:和真人過分相似的“非人物體”不但是挑戰(zhàn)科學(xué)倫理的,而且是可能帶來很大災(zāi)難的。

在我們的現(xiàn)實生活中,“人工智能”是正在高速發(fā)展的,他如今不僅成為了學(xué)界關(guān)注的熱點,而且也得到了資本的青睞。但除了它所要達到的“智能”或許和很多朋友臆想的“極致擬人”不同之外,實現(xiàn)它的方式或許也并不和我們認為的一致。
“人工智能”需要教會機器“如何思考”,但實際上機器的“思考方式”卻和人的有很大不同,當(dāng)一個語音助手可以準(zhǔn)確錄入我們說的話,并且恰當(dāng)斷句時,很多人認為,這個“人工智能”已經(jīng)明白了這句話的意思,所以才可以達到這樣的效果。但實際上,如今盛行的“人工智能”是并沒有這樣的能力的。所以,讓我們聊聊現(xiàn)今實現(xiàn)人工智能的核心技術(shù)——“機器學(xué)習(xí)”(Machine Learing)。
“機器學(xué)習(xí)”是什么
“機器學(xué)習(xí)”一詞由計算機科學(xué)家阿瑟·薩繆爾(Arthur Samuel)提出,他將其定義為“不顯式編程地給予計算機一定的功能”。這個定義或許有點晦澀,但有點編程經(jīng)歷的朋友都知道,計算機實際上是很笨的,你在程序中寫入了“1+1”,計算機才知道計算出“2”這個結(jié)果,也就是說,我們想讓計算機去做一件事,都得在程序代碼中明明白白地(即“顯式地”)寫出來讓他做的事情以及步驟和方法,然后才能讓計算機去進行基礎(chǔ)的、大量的和枯燥的計算,計算機才算是具有了一定的“功能”。
但通過機器學(xué)習(xí),計算機解決問題的過程卻越來越像是一個“黑箱”,也就是說它逐漸地不再需要我們?nèi)ヒ徊揭徊降叵轮噶?,它便可以去做一些事情了,而我們的代碼對計算機的行為的規(guī)劃也不再那么的“明確”,所以說,某種程度上,計算機仿佛是有了自己思想的能力(因為一個人可以給你他思考的結(jié)果,但你同樣無法得知他思考的過程)。
計算機成為“棋王”之路
阿瑟·薩繆爾利用“機器學(xué)習(xí)”寫出了一個西洋跳棋程序,這個程序可以通過對大量棋局的分析逐漸辨認出當(dāng)前是一步“好棋”,還是“壞棋”。在后來,薩繆爾還用這個程序挑戰(zhàn)了康涅狄格州的跳棋冠軍,并且取得了勝利。也是從這之后,從IBM的“深藍”戰(zhàn)勝世界西洋棋棋王卡斯帕羅夫,一直到前不久google的AlphaGo戰(zhàn)勝圍棋高手李世石,人工智能的發(fā)展常常是踩著無數(shù)“棋王”的尸體走來的。從小愛下圍棋的野風(fēng)君每每想到這里,都覺得好氣呀。

“人工智能”在不同領(lǐng)域的具體實現(xiàn)方式都有所不同,但機器學(xué)習(xí)的大致模式都是:通過對大量的數(shù)據(jù)的訓(xùn)練,增強自己的“思考能力”。說的通俗一點,就是計算機在看了很多的資料之后,可以依據(jù)概率和統(tǒng)計的原理來做出一個“是或否”的判斷,從而為之后的局面做出一個“更好”的選擇。比如,AlphaGo在看了無數(shù)盤大師們的棋局之后,知道了在遇到某個場面時,怎樣落子可以增大自己贏的概率,同時,它還可以自己“左右互搏”,自己和自己下棋,從而積累更多的棋局數(shù)據(jù)。
大家都知道,一盤圍棋從落第一枚棋子開始,一直到棋局結(jié)束,期間可能出現(xiàn)的每一步棋的不同組合的數(shù)量是有限的,所以理論上,如果計算機已經(jīng)對所有的情況進行過“訓(xùn)練”,就可以對任意的棋局做出最優(yōu)化的反應(yīng),人類棋手自然是不能取勝的。但實際上,受計算機性能和資源的制約,這種“窮舉”的方法在圍棋上還難以實現(xiàn),但是我們可以認為,計算機看過越多的棋局,進行過越多的“訓(xùn)練”之后,它下棋的能力也會不斷地提升,而這過程中,人類是不可能去顯式編程對他進行一步一步的指導(dǎo)的(大家設(shè)想一下,如果AlphaGo的程序中有類似“如果第1步下在A點,第2步下在B點......第88步下在¥點,那么你的第89步應(yīng)該下在@點”的指令,這會產(chǎn)生多么恐怖的代碼量,這個程序的字符數(shù)可能比宇宙中的原子數(shù)目還多)
所以,一臺計算機變成“棋王”的過程中,就是經(jīng)歷了這樣一種“不斷訓(xùn)練、吸取經(jīng)驗、自我優(yōu)化”的過程的。雖然實際的棋類機器人,特別是AlphaGo的“邁向棋王之路”上還有著很多其他的內(nèi)容,但主體的道路都只是“Practice makes perfect”(這句話應(yīng)該直譯為“練得越多,越厲害”)而已。而且,即使人工智能做出了很好的判斷和選擇,但它的邏輯和人類的“思考”依舊是大不相同的,它做出的只是基于數(shù)據(jù)和統(tǒng)計學(xué)的判斷而已。
“自然語言處理”中的“機器學(xué)習(xí)”
關(guān)于“機器學(xué)習(xí)”,野風(fēng)君再舉一個例子。
在昨天,野風(fēng)君看了一年一度的“科技節(jié)春晚”——錘子科技的新品發(fā)布會。整個發(fā)布會中,最引人注目的部分大概就是:羅永浩對著手機說出一串話,然后手機準(zhǔn)確迅速地將這段語音信息處理成文字信息顯示在手機上。顯然,這是基于“人工智能”的,而這背后就牽扯到了“機器學(xué)習(xí)”應(yīng)用的一大領(lǐng)域——“自然語言處理”(NLP)。

“自然語言”就是指我們?nèi)祟惾粘Uf的語言,是相對于計算機的“機器語言”而存在的。關(guān)于這部分,野風(fēng)君自知能力有限,只能聊聊最淺顯的知識。
我們可以想想,如果我們有了大量的“語料”(此處指自然語言的材料,比如大量的語音記錄等),那么通過上文提到的機器學(xué)習(xí)的訓(xùn)練方式,我們可以對這些語料進行訓(xùn)練,計算機便可以學(xué)習(xí)到不同斷句方式正確的概率,比如在訓(xùn)練的語料中有十次出現(xiàn)“我回家吃飯”,而且計算機得知其中有九次都應(yīng)該斷句為“我/回家/吃飯”,僅有一次是“我回/家/吃飯”,那么在應(yīng)用過程中,再遇到這句話,訓(xùn)練出來的這個人工智能就會選擇前者的斷句方式。而這背后,實際上是對“出現(xiàn)概率”和“正確幾率”做出一種鏈接。
當(dāng)然了,這只是給出了一種最簡單,最理想的情況,真正的NLP中,會涉及到更多,更復(fù)雜的問題,比如對詞語的劃分,對不恰當(dāng)語料的識別,對不同來源語料的區(qū)別對待(比如來自報紙的語料就來自口語的更加可信)等等。但是毫無疑問,只要是基于“機器學(xué)習(xí)”和統(tǒng)計學(xué)的自然語言處理,在擁有更多語料、經(jīng)過更久訓(xùn)練之后,計算機就更可能擁有更高的準(zhǔn)確率。比如,如今科大訊飛的語音識別引擎就已經(jīng)比四年前野風(fēng)君去訊飛總部時體驗的“先進語音識別引擎”要強的太多了。
“人工智能”≠“人智”

說了這么多,礙于能力限制,野風(fēng)君也覺得自己講的不夠易懂,但希望能給大家?guī)硪粋€印象,那就是:“人工智能”實際上并不是嚴格仿生學(xué)上的“模仿人的智力”(盡管如今人工智能領(lǐng)域的“人工神經(jīng)網(wǎng)絡(luò)”等詞語仿佛和仿生學(xué)有很大關(guān)系,但實際上并沒有太大關(guān)聯(lián)),而且很大程度上,“人工智能”并不具有嚴格意義上的“思維”,它的功能的基礎(chǔ)只是對已有數(shù)據(jù)的統(tǒng)計學(xué)處理和“經(jīng)驗歸納”而已。《西部世界》中,那種工程師修改一下程序,人造人的個性就發(fā)生很大改變,但又和真人難以分辨并且可以自主思考的“人工智能”離我們還是很遠的。
最后,還是希望大家有空可以去看看《西部世界》這部美劇,盡管作為HBO制作的作品,它一如既往的有很多“少兒不宜”的畫面,而且野風(fēng)君也不認為這部美劇和很多人吹捧的一樣“神”,但的確是值得一看的,特別是在如今這個“人工智能”快速走進我們生活的時代。
最后,大家也都別覺得“人工智能”是個多么高大上和復(fù)雜的東西,每個人都是可以不太困難地了解它的基本原理的。就像野風(fēng)君的學(xué)長、人工智能科學(xué)家戴文淵說的:“AI(人工智能)這個如今看來高大上的東西,就和20年前制作網(wǎng)站一樣,在20年后,也就是一件很平常的東西而已”