? ? ? ?作為一個圍棋的門外漢,出于對中國古典文化的崇敬,希望了解圍棋。從alpha go和李世石的大戰(zhàn)到后來的柯潔,一直到前不久聽到江鑄久老師的分享,才堪堪明白,alpha go能戰(zhàn)無不勝,其實質(zhì)是兩個字——迭代。
? ? ? ? 圍棋的起源并無明確記載,由于其每一手的變化可以生成很多種可能,加入打劫之后,其復(fù)雜性更是超越了所有其他棋類。這也是當(dāng)年的象棋機器人深藍不敵人類棋手后,人們高興的說即使贏了,我們還有圍棋。在早年,圍棋的頂端站著的是日本人,一個不成文的規(guī)矩是挑戰(zhàn)高手,高手可以隨時休息,想好了再接著下。而當(dāng)年逼的日本第一人想了一周之久的就是中國的圍棋泰斗吳清源老先生,他采用的三三下法顛覆了當(dāng)時圍棋界的認(rèn)知。
? ? ? ?時間推進到了2000年,這段時間人類一直沒有放棄研究人工智能戰(zhàn)勝人類圍棋棋手的辦法,但苦于變化太多,無法窮盡。直到谷歌的深度學(xué)習(xí)團隊帶頭人哈薩比斯做出了alpha go,創(chuàng)立初期的alpha go拋棄了過去人們的傳統(tǒng)思維,運用“剪枝”的思路進行設(shè)計,所謂剪枝即不去窮盡每一步的算法,而是只算出最有可能的幾步,并迅速做出抉擇。一個頂尖的人類棋手,在不同的局面下需要深思熟慮才能想出哪一步才是最優(yōu)選擇,而電腦可以通過深度學(xué)習(xí)加快運算速度,最復(fù)雜的變化和最簡單的變化都可以在八秒左右算出,所以人類棋手與電腦對弈,心理壓力往往更大。
? ? ? 李世石和alpha go對弈的前三局,李世石完敗。在無關(guān)勝負的第四局,李世石在盤中的一手打劫讓人類棋手看到了贏的希望,也間接促成了alpha go和柯潔的二番戰(zhàn)。但是一個可以7*24小時不斷深度學(xué)習(xí)的人工智能并沒有給世界第一什么面子,干凈的3:0終結(jié)了比賽,棋中有一手很妙的就是三三,和吳老的如出一轍。這無疑比輸贏更值得驚喜,圍棋的傳承讓吳老1000年的設(shè)想成為了現(xiàn)實,也讓我這門外漢有所感悟。
? ? ? ?如果想要很快的超越對手,需要迭代和刻意練習(xí)。而超越的方法不一定需要全面超越,要學(xué)會剪枝。