
圖片發(fā)自簡書App
10月19日,谷歌DEEPMIND團隊對外宣布了他們最新的研究成果:在不學(xué)習(xí)人類棋譜的情況下,直接用深度學(xué)習(xí)的機器跟原來的AlphaGo對弈訓(xùn)練了36天之后,終于打敗了AlphaGo(阿爾法狗),他們把這臺新的機器命名為Alpha Zero(阿爾法元).這一次的結(jié)果再次刷新了機器人下棋的一次里程碑,到目前為止成為最強大的棋譜。顯然36天的成績超出了科學(xué)家的想象,Alpha Zero(阿爾法元)更為讓人震驚的是僅用了4個TPU,它哥哥AlphaGo(阿爾法狗)用了48個TPU,依然不是他的對手。除了硬件上的差別,阿爾法狗是在學(xué)習(xí)了人類棋譜之后,戰(zhàn)勝了李世石,柯潔等人類高手,而阿爾法元是一張白紙,只是給它圍棋規(guī)則和輸贏的標(biāo)準(zhǔn),左右手對弈,機器自主學(xué)習(xí),沒有給它任何指導(dǎo)的情況下,完成了它的整個學(xué)習(xí)和訓(xùn)練。這給了我們什么樣的啟示呢?
1. 人類的棋譜一直以來自認(rèn)為是完美的棋譜,但是通過這次的較量我們知道了人類棋譜也有不少的“雜音”,只是我們一直沒有發(fā)現(xiàn)而已。
2. 其實還有一些解決問題的思路比現(xiàn)有存在的好的很多,但是人類并沒有發(fā)現(xiàn),然后自定義為“沒有了”。機器的思路也許是一種人類還有待發(fā)展的思路,機器解決問題的“黑匣子”,就是人類思維的一個盲區(qū),也是為人類解決問題打開另外一個世界。人類可以隨著認(rèn)知變化而成長變化。
3. 機器解決問題必須事先設(shè)定好的規(guī)則下面進行,如果沒有規(guī)則定義,機器也無法進行工作。而現(xiàn)實解決問題的環(huán)境是非常復(fù)雜和變化的,存在著“理想環(huán)境”的條件不多。因此,目前人工智能只能替代“重復(fù)性勞動”的工作機會比較多。
4. 說到徹底,這次的突破還是算法的問題,阿爾法元在不借助人類任何經(jīng)驗數(shù)據(jù)的情況下實現(xiàn)了算法超越了人類的歷史性的一步,本質(zhì)還是計算的問題,圍棋復(fù)雜程度大約是10 的172次方。

圖片發(fā)自簡書App
“Stay Hungry, Stay Foolish”喬幫主這句話給我們的啟示:人類只要保持一顆學(xué)習(xí)的心,保持一顆謙卑的心,就能跟世界一起前進,活在未來。