從二戰(zhàn)盟軍破解德軍密碼的故事,談一談云
“我們已經(jīng)見到的遠(yuǎn)遠(yuǎn)不是全部!”在2019數(shù)博會(huì)開幕式上,圖靈獎(jiǎng)獲得者、美國(guó)計(jì)算機(jī)科學(xué)家惠特菲爾德·迪菲發(fā)表了極為精彩的主旨演講,用二戰(zhàn)盟軍破解德軍密碼的故事向世人剖析了人類歷史上從沒來沒有面臨過的云時(shí)代偉大變遷,“我們整個(gè)社會(huì)正在走向云端,云將是未來社會(huì)的重心、它的核心、它的光芒,而大數(shù)據(jù)、AI人工智能、網(wǎng)絡(luò)安全這三要素,將是未來網(wǎng)絡(luò)治理中的關(guān)鍵。
整個(gè)社會(huì)正在走向云端
“今天我們所討論的一切,是5千年或者7千年以來我們一直都沒有做過的?!被萏胤茽柕隆さ戏普f,此前人們是生活在自然世界中的,人們走在大地上,生活在最原始的建筑結(jié)構(gòu)里,靠農(nóng)耕來為生,但是幾千年前,人們搬進(jìn)了城市,從這個(gè)時(shí)候開始,人們首次住在人造的環(huán)境當(dāng)中,“現(xiàn)在我們又在這樣做,而且力度更大。我們整個(gè)社會(huì)正在走向云端?!?/p>
在過去,城市可以控制一個(gè)大帝國(guó),比如羅馬人想做的一切不能僅僅在羅馬城里完成,而是要依靠其所控制的省邦?!巴瑯游覀円部梢栽O(shè)想一下云社會(huì)、互聯(lián)網(wǎng)社會(huì),它也是汲取廣泛存在的物理社會(huì)的資源,但是云是它的重心、它的核心、它的光芒,而大數(shù)據(jù)、AI人工智能、網(wǎng)絡(luò)安全是最重要的三大要素?!被萏胤茽柕隆さ戏普f。
計(jì)算為大數(shù)據(jù)而生
到底大數(shù)據(jù)是什么?惠特菲爾德·迪菲解釋,這是人類所能夠處理的最大極的數(shù)據(jù),所以它會(huì)隨著技術(shù)的變化而變化,但有一點(diǎn)是永恒的,就是大數(shù)據(jù)從現(xiàn)在開始會(huì)永遠(yuǎn)與我們同在,而且不斷的變化。
所以,大數(shù)據(jù)是人們所能夠處理的最大的數(shù)據(jù)集,目的是幫助人類實(shí)現(xiàn)新的目標(biāo)。
“在某種意義上,計(jì)算是為了大數(shù)據(jù)應(yīng)運(yùn)而生的。”惠特菲爾德·迪菲介紹,二戰(zhàn)要破解密碼就需要處理當(dāng)時(shí)人類無(wú)法自行處理的數(shù)據(jù)集,那個(gè)時(shí)候就有了百萬(wàn)字符級(jí)別的數(shù)據(jù)量。
“大數(shù)據(jù)當(dāng)時(shí)的三個(gè)屬性今天也絲毫沒有改變,分別是數(shù)量、多樣性、速度。當(dāng)時(shí)有幾千個(gè)竊聽人員,而且很多都是女性,她們都被訓(xùn)練得非常熟練,她們?cè)诼犽娫?、語(yǔ)音包括竊聽電報(bào),歸根結(jié)底,這是各種通信信號(hào),而且是包括多種語(yǔ)言,德語(yǔ)、英語(yǔ)、法語(yǔ),而且是用不同的密碼,他能夠處理各種的語(yǔ)言信息格式,而且每天甚至每小時(shí)都在變。”
“所以今天我們所傾注的數(shù)據(jù)屬性在二戰(zhàn)的時(shí)候,在計(jì)算機(jī)誕生的時(shí)候就已經(jīng)有了,其數(shù)據(jù)量是10的15次方,或者是10的18次方這么大?!被萏胤茽柕隆さ戏普J(rèn)為,相比過往,今天數(shù)據(jù)的多元、多樣性應(yīng)該說是無(wú)限的,傳感器可以捕捉到任何信號(hào)并運(yùn)行在網(wǎng)絡(luò)上,以前一個(gè)小時(shí)之內(nèi)數(shù)據(jù)可能不會(huì)有太大的變化,現(xiàn)在1秒鐘的幾分之一時(shí)間數(shù)據(jù)就會(huì)有巨大的變化。
AI的能力迭代:從取代行動(dòng)到取代思考
惠特菲爾德·迪菲認(rèn)為,大數(shù)據(jù)幾乎與互聯(lián)網(wǎng)同步開始產(chǎn)生商業(yè)價(jià)值。
大數(shù)據(jù)這個(gè)詞語(yǔ)從上世紀(jì)90年代開始流行,當(dāng)時(shí)有了互聯(lián)網(wǎng),萬(wàn)維網(wǎng)可以誕生出大量的數(shù)據(jù),大數(shù)據(jù)可以被所有人或者是為一小批人進(jìn)行加工、抓取價(jià)值、盈利。
“大數(shù)據(jù)必須由傳感器來獲取,在二戰(zhàn)當(dāng)中就是幾千名竊聽人員;大數(shù)據(jù)還必須有足夠的存儲(chǔ)空間,當(dāng)時(shí)又有紙質(zhì)、磁帶、手寫記錄,今天我們所依賴的電子存儲(chǔ)設(shè)備當(dāng)時(shí)還沒有被發(fā)明;在二戰(zhàn)結(jié)束之時(shí),英國(guó)破解密碼組織開發(fā)出了現(xiàn)在被認(rèn)為是當(dāng)代計(jì)算機(jī)的前身,它的速度是每秒5千字?!?/p>
盡管當(dāng)時(shí)的電腦處理能力與現(xiàn)在天差地別,但惠特菲爾德·迪菲特別指出,AI技術(shù)在當(dāng)時(shí)已經(jīng)開始萌芽,并得到應(yīng)用。
當(dāng)時(shí)盟軍的密碼破解系統(tǒng)之所以能夠夠破解德國(guó)最高級(jí)的密碼系統(tǒng),另外一個(gè)重要的要素是人工智能?!拔腋酉矚g英國(guó)人的說法,它叫機(jī)器智能。所謂機(jī)器智能就是任何一種技術(shù)用機(jī)器來做之前,需要人才可以做得到的事情?!?/p>
那么,哪些事情是人類曾經(jīng)擅長(zhǎng)的呢?最早的時(shí)候比如國(guó)際象棋,從上世紀(jì)60年代末就已經(jīng)有了這樣的機(jī)器智能,可以把終端擺到象棋比賽當(dāng)中,在實(shí)時(shí)比賽當(dāng)中跟人對(duì)弈。幾十年后,很快機(jī)器就超過了人,現(xiàn)在象棋已經(jīng)是機(jī)器決勝的領(lǐng)域。后來,機(jī)器智能又進(jìn)軍到圍棋了。
“還記得60年代的時(shí)候,我們當(dāng)時(shí)非常振奮,因?yàn)?0年代喬姆斯基發(fā)明了深層語(yǔ)法,60年代我們非常希望結(jié)合他這個(gè)理論打造一種機(jī)器翻譯的軟件,能夠很好地把人類不同的語(yǔ)言做一個(gè)最好的轉(zhuǎn)換。后來很遺憾沒有能夠開發(fā)出好的分析系統(tǒng),今天最好的系統(tǒng)也只是湊合能用,還不是特別好?!被萏胤茽柕隆さ戏苹貞浀?。
“未來我想AI最重要的方面應(yīng)該是機(jī)器可以就人們所無(wú)法思考的事情去思考?!被萏胤茽柕隆さ戏婆e例,“比如說有個(gè)數(shù)據(jù)庫(kù),里面有幾萬(wàn)億或者是萬(wàn)萬(wàn)億個(gè)維度,這是人類想不通的,人沒有辦法去想。我們只能想非常局部的一些維度,但是機(jī)器可以直接理解這樣的大數(shù)據(jù)集。這個(gè)時(shí)候機(jī)器可能會(huì)有些行為,讓我們覺得非常意外,因?yàn)槿祟惛揪筒焕斫?。再比如說有一個(gè)高維度數(shù)學(xué)可以證明一些命題,現(xiàn)在人類數(shù)學(xué)家是無(wú)法去求證的,未來我覺得會(huì)有些高維度的數(shù)學(xué)命題機(jī)器是可以求證的?!?/p>
“大浪淘金”的數(shù)據(jù)安全能力
最后,惠特菲爾德·迪菲強(qiáng)調(diào)了網(wǎng)絡(luò)和信息安全?!拔覍⑵涑蔀椤衫眯浴??!彼f,“可利用性通常是各種系統(tǒng)的最高、最嚴(yán)肅的要求。你要旅行或者你辦理銀行業(yè)務(wù)的時(shí)候,如果突然系統(tǒng)中斷不可用,你可能會(huì)非常不高興;尤其是自動(dòng)駕駛汽車,比如變成不可用了,把你甩到路邊溝里去了,你肯定不高興。這是有危險(xiǎn)的?!?/p>
“信息的完整性、真實(shí)性同樣重要?!彼f,“真實(shí)性說明你知道這個(gè)司機(jī)的信息來自哪里,不見得來自一個(gè)人,可能來自政府,這個(gè)信息也可能來自一家公司,這個(gè)信息可能來自任何地方。然后,你可以確信這個(gè)信息是沒有被篡改過,沒有發(fā)生任何破壞和變樣的。同時(shí),信息也不總是需要保密,也就是說要保證只有一部分人能夠理解這些信息,你傳輸?shù)男畔⒒蛘吣闶盏降男畔?,溝通的信息只有一部分人可以理解他?!?/p>
惠特菲爾德·迪菲進(jìn)一步解釋,“值得說明的是真實(shí)性和保密性之間有一定關(guān)聯(lián)的。而違反保密,一個(gè)常見的攻擊方式是釣魚方式,看似真實(shí)的請(qǐng)求,電子郵件或者打電話要你的一些信息,以這種方式來打破你的保密性,給到應(yīng)該給到的人。”
“我個(gè)人希望人工智能可以帶來新的思考方式,可以對(duì)計(jì)算機(jī)運(yùn)算,對(duì)編程方面有新的思維,從而改變安全性?!被萏胤茽柕隆さ戏普f,有一句話人們經(jīng)常愛講,比錯(cuò)誤還錯(cuò),就是垃圾進(jìn)、垃圾出,所謂垃圾進(jìn)、垃圾出,在大數(shù)據(jù)的場(chǎng)景下是大錯(cuò)特錯(cuò),“大數(shù)據(jù)應(yīng)該是垃圾進(jìn)、黃金出。從垃圾當(dāng)中能夠找到黃金?!?/p>
什么是大數(shù)據(jù)的安全呢?惠特菲爾德·迪菲舉例,有三個(gè)最有價(jià)值的搜索流量,一個(gè)是百度的,一個(gè)是Google的,另一個(gè)是亞馬遜的,這些流不是公開的,專門流向這三家公司,這三家公司嚴(yán)格保密,一方面是保護(hù)自身的利益,也是在保護(hù)用戶的保密性。通過搜索流量,比如可以讓我們知道很多關(guān)于疾病發(fā)生的情況,哪些疾病在哪些地方更加常見,這三個(gè)公司的搜索流量非常有價(jià)值。
“還有控制數(shù)據(jù)采集,未來很多數(shù)據(jù)采集的過程會(huì)變得比較公開。比如人臉識(shí)別技術(shù),亞馬遜的人臉識(shí)別技術(shù)現(xiàn)在很值錢,但是他只會(huì)把結(jié)果給到某些人,但是經(jīng)過一段時(shí)間以后,我想這種人臉識(shí)別技術(shù)可以用在自己的手機(jī)上,然后人們可以用它來識(shí)別人群中其他人的臉呢。這一天有可能很快就到來。”