
一、什么是人工智能
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
簡單來說就是讓機(jī)器能夠模擬人類的思維能力,讓它能夠像人一樣去感知、思考,甚至決策,要知道,我們看見的世界和機(jī)器所見的世界很不一樣,我們看見一個人,知道那是一個人,看見一輛車,知道那是一輛車,但機(jī)器看到的,卻只是一串毫無意義的數(shù)字。


機(jī)器代入人類的視角,去學(xué)習(xí)人類的語言,進(jìn)而總結(jié)經(jīng)驗,做出判斷。
通常都是我們?nèi)W(xué)習(xí)機(jī)器語言,如C語言、Java語言,寫進(jìn)機(jī)器里,變成各種電信號,指揮機(jī)器去做事,但現(xiàn)在我們希望它們能夠不依賴這種指揮,就能根據(jù)人的目的,自動察覺應(yīng)該干什么。

二、機(jī)器學(xué)習(xí)
人通過經(jīng)驗,歸納出規(guī)律。機(jī)器學(xué)習(xí)通過數(shù)據(jù),訓(xùn)練出模型。
機(jī)器學(xué)習(xí)不是基于編程形成的結(jié)果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出的相關(guān)性結(jié)論。

數(shù)據(jù)通過算法構(gòu)建出模型并對模型進(jìn)行評估,評估的性能如果達(dá)到要求就拿這個模型來測試其他的數(shù)據(jù),如果達(dá)不到要求就要調(diào)整算法來重新建立模型,再次進(jìn)行評估,如此循環(huán)往復(fù),最終獲得滿意的模型來處理其他的數(shù)據(jù)。
(1) 監(jiān)督學(xué)習(xí)
輸入數(shù)據(jù)中有導(dǎo)師信號,以概率函數(shù)、代數(shù)函數(shù)或人工神經(jīng)網(wǎng)絡(luò)為基函數(shù)模型,采用迭代計算方法,學(xué)習(xí)結(jié)果為函數(shù)。
就像人類小時學(xué)習(xí)一樣,老師一個字母一個字母教漢語拼音。反復(fù)指著一個字母,教你認(rèn),教你讀,糾正你的發(fā)音,糾正你的書寫直到過關(guān)。這個過程被稱為監(jiān)督學(xué)習(xí)。
對于機(jī)器大腦來說,就是引導(dǎo)它從數(shù)據(jù)中尋找規(guī)律,也就是給它看題目,并告訴它答案,當(dāng)它看的足夠多就會自己做題了,這種方法經(jīng)常被用于各種識別任務(wù),如人臉識別、車牌識別等。

(2)無監(jiān)督學(xué)習(xí)
輸入數(shù)據(jù)中無導(dǎo)師信號,采用聚類方法,學(xué)習(xí)結(jié)果為類別。典型的無導(dǎo)師學(xué)習(xí)有發(fā)現(xiàn)學(xué)習(xí)、聚類、競爭學(xué)習(xí)等。
無監(jiān)督學(xué)習(xí)在訓(xùn)練的時候并不知道正確結(jié)果。
相當(dāng)于只有題目沒有答案,AI只能根據(jù)自己觀察到的特征,把認(rèn)為相似的東西分為一組,雖然它不知道誰是貓誰是狗,但是也能區(qū)分出來。這種方法很適合從一堆東西中找到隱藏規(guī)律,用途也比監(jiān)督學(xué)習(xí)廣。


(3) 強(qiáng)化學(xué)習(xí)
以環(huán)境反慣(獎/懲信號)作為輸人,以統(tǒng)計和動態(tài)規(guī)劃技術(shù)為指導(dǎo)的一種學(xué)習(xí)方法。
這時AI不用做題,而是直接與環(huán)境互動, 通過環(huán)境給出的獎懲來學(xué)習(xí),目的是通過一系列動作獲得最大的獎勵,在互動的過程中AI會不斷調(diào)整自己的行為,對環(huán)境變化做出最佳的應(yīng)對,這種方法常被用來訓(xùn)練行為,比如玩游戲、無人駕駛、推送廣告等等。

三、深度學(xué)習(xí)
人腦在識別人臉時,并不是像拼圖一樣,眼睛一塊鼻子一塊地分開提取,再拼成一張臉,而是分層次的學(xué)習(xí)提取。
當(dāng)人臉在視網(wǎng)膜上成像后,會先傳到我們大腦的第一層感覺神經(jīng),從中解析出簡單線條,再傳到第二層感覺神經(jīng),提取出更多輪廓信息,這樣一層層傳遞,最后到達(dá)我們的大腦皮層,形成人臉的整體形象,在和我們記憶中的形象做對比,就把人給認(rèn)出來了,而機(jī)器識別人臉也使用了類似的辦法。

現(xiàn)代人臉識別系統(tǒng)主要通過一種被稱為深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),來對人臉特征進(jìn)行分層提取,再和記錄的人臉做對比。
深度神經(jīng)網(wǎng)絡(luò)處理信息的方式,和人腦非常相似,外部圖像輸入后,信號會像人類神經(jīng)傳導(dǎo)一樣,在網(wǎng)絡(luò)中逐層傳遞,一些特征被放大,另一些特征被縮小,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò),可以就此一步步排除干擾,找到那些穩(wěn)定的人臉特征。

以一個簡單的深度卷積神經(jīng)網(wǎng)絡(luò)為例
第一層:先提取到一些簡單的線條,表達(dá)圖像中某些位置和某些方向上的輪廓。
第二層:會根據(jù)前一層檢測出的線條,提取一些局部特征,如眼睛、鼻子、嘴巴等。
第三層:提取大體的人臉輪廓。

通過這樣的多層處理就可以從原始圖片中提取出表達(dá)人臉信息的有效特征,而光線、位置、姿態(tài)等和身份無關(guān)的因素,則在特征提取的過程被一步步地濾除。

四、機(jī)器博弈
弈就是棋,機(jī)器博弈就是機(jī)器下棋,下棋是人類想到能夠體現(xiàn)機(jī)器智能最早的方式之一,它代表的是一類決策技能。AI要做的是在多種可能性中,選擇最好的那一個。

2019年,AlphaGo先后戰(zhàn)勝世界圍棋冠軍李世石和柯潔,圍棋曾被稱為人類智力的圣杯,以至于當(dāng)時棋壇上一片絕望之聲。

AlphaGo是怎么做到的?
首先可能想到的是暴力搜索,也就是窮舉所有可能,找到最好的那一步,但圍棋的棋盤,是19*19的方格,每一格可以下白子、黑子以及無子,加起來復(fù)雜度達(dá)到了3361次方,約等于10172次方,遠(yuǎn)遠(yuǎn)大于宇宙中所有原子的總數(shù)10^80次方,所以這個方法顯然是行不通的。
那么首要的問題就是解決搜索范圍,我們?nèi)祟愊缕澹膊⒉粫紤]所有情況,而只會根據(jù)棋感,在腦海想最好的那幾種走法,然后在想這之后對手最有可能的走法,在想接下來自己最可能的走法,如此幾步大致做出判斷,AlphaGo的思考方式也和這差不多。

使用兩個深度神經(jīng)網(wǎng)絡(luò)來充當(dāng)自己的大腦,每個神經(jīng)網(wǎng)絡(luò)都可以通過學(xué)習(xí)人類棋譜,或者自我對弈來積累經(jīng)驗。

其中一個被稱為策略網(wǎng)絡(luò)的大腦,主要思考下一步走什么,它會憑借學(xué)到的經(jīng)驗,給出當(dāng)前棋局下,在每個點落子的概率,那些概率低的點會被它忽略,概率高的點則被納入考慮范圍。

而另一個被稱為評價網(wǎng)絡(luò)的大腦,則會根據(jù)經(jīng)驗,評估在每一步落子之后,黑棋或者白棋贏棋的機(jī)會,它不關(guān)心過程,只關(guān)心結(jié)果,那些評價低的棋子,同樣也會被丟棄。

這樣的兩大腦相互配合,就將圍棋無比巨大的搜索空間,壓縮到了可控的程度,AlphaGo也就此成為一位圍棋大師。

有意思的是一開始科學(xué)家們使用人類大師的棋譜,來給AlphaGo積累經(jīng)驗,但后來證明,加入了隨機(jī)走子,自我博弈之后,AlphaGo變得更聰明了,這說明人類的認(rèn)知是有限的,但AI卻可以憑借超快的自我搜索能力突破這種局限。
AlphaGo的升級版AlphaGo Zero,完全摒棄人類經(jīng)驗,僅通過三天的自我博弈訓(xùn)練,就以100:0的戰(zhàn)績完敗了AlphaGo。
