無限可能的未來---讀《大數(shù)據(jù)時(shí)代》

圖片發(fā)自簡書App

? ? ?5月24日,在來貴陽參加數(shù)博會(huì)的飛機(jī)上,我用三個(gè)小時(shí)的時(shí)間讀完了維克托·邁爾-舍恩伯格的《大數(shù)據(jù)時(shí)代》,這本書是兩年前一個(gè)做大數(shù)據(jù)的朋友送我的,放在書柜里一直未讀,這次在參加大數(shù)據(jù)論壇之前閱讀,也是恰逢其時(shí)。

? ? ?作者維克托·邁爾·舍恩伯格是數(shù)據(jù)科學(xué)的技術(shù)權(quán)威,也是最早洞見大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一,他曾先后任教于世界最著名的幾大互聯(lián)網(wǎng)研究學(xué)府,現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專業(yè)教授,并擔(dān)任耶魯大學(xué)等名校的客座教授。從謀篇結(jié)構(gòu)能感受到作者嚴(yán)密的邏輯,除引言外,分為三個(gè)部分,第一部分談大數(shù)據(jù)時(shí)代的思維變革,從三個(gè)方面進(jìn)行深入細(xì)致的闡述,第二部分談大數(shù)據(jù)時(shí)代的商業(yè)變革,從數(shù)據(jù)價(jià)值、角色定位等不同角度闡述大數(shù)據(jù)引發(fā)的變革浪潮。第三部分談大數(shù)據(jù)時(shí)代的管理變革,談大數(shù)據(jù)潛藏的風(fēng)險(xiǎn)以及政府、技術(shù)企業(yè)、科研機(jī)構(gòu)等在應(yīng)對(duì)風(fēng)險(xiǎn)時(shí)的角色定位和對(duì)策思路。全書有理論、有實(shí)踐,有現(xiàn)實(shí)的案例,也有對(duì)未來的預(yù)期。朋友談及本書時(shí),認(rèn)為這本書是大數(shù)據(jù)方面最好的書,我閱讀后,亦深以為然。在此,淺談三點(diǎn)感受。

? ? ? 一、“順勢(shì)而為”變思維

? ? ? 時(shí)代的發(fā)展,需要我們與時(shí)俱進(jìn),去適應(yīng)新環(huán)境、新事物。適應(yīng)體現(xiàn)在兩個(gè)方面,一是道的層面,一是術(shù)的層面。改變工作方式,學(xué)會(huì)使用新的工作方式我認(rèn)為都屬于“術(shù)”,最本源的還是要在思維方式上跟上時(shí)代的步伐,洞悉時(shí)代變革之“道”。作者一開始就拋出三個(gè)大數(shù)據(jù)時(shí)代帶給我們的思維變革。

? ? ? ?第一個(gè)思維改革:不是隨機(jī)樣本,而是全部數(shù)據(jù)。大數(shù)據(jù)時(shí)代對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)構(gòu)成了沖擊。在這樣一個(gè)我們有足夠強(qiáng)大的數(shù)據(jù)搜集和數(shù)據(jù)處理能力的時(shí)代,樣本不再是萬分之一,而是全數(shù)據(jù)、全流量。統(tǒng)計(jì)學(xué)在隨機(jī)抽樣方法中有一條原理:“采樣分析的精確性隨著采樣隨機(jī)性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大?!笨梢哉f,“樣本分析”奠定了絕大多數(shù)科學(xué)研究的基礎(chǔ)。而大數(shù)據(jù)時(shí)代,全數(shù)據(jù)分析的模式將全面替代“樣本分析方式”。正如《魔鬼經(jīng)濟(jì)學(xué)》中關(guān)于相撲運(yùn)動(dòng)員的研究,其創(chuàng)造性的觀點(diǎn)正是通過使用了11年中超過64000場(chǎng)摔跤比賽的全數(shù)據(jù)記錄來尋找到了異常性。這樣的洞見,恰恰是樣本分析所無法提供的。

? ? ?第二個(gè)思維變革:不是精確性,而是混雜性。數(shù)據(jù)量的顯著增大也必然會(huì)讓我們付出一些代價(jià),如一些不準(zhǔn)確的數(shù)據(jù)會(huì)混入數(shù)據(jù)庫,結(jié)果也可能不準(zhǔn)確。這就是大數(shù)據(jù)時(shí)代的另一種思維——“不是精確性,而是混雜性”。 對(duì)“小數(shù)據(jù)”而言,最重要的要求就是減少錯(cuò)誤。而在大數(shù)據(jù)的采集里,在技術(shù)尚未達(dá)到完美無缺之前,混亂是無可避免的。雖然我們得到的信息不再那么準(zhǔn)確,但收集到的數(shù)量龐大的信息讓我們放棄嚴(yán)格精確的選擇變的更為劃算。從谷歌翻譯系統(tǒng)中可以看到,它收集了上萬億的語料庫,來自未經(jīng)過濾的網(wǎng)頁內(nèi)容,可能會(huì)含有不準(zhǔn)確的用法、語病,未必每一條語料庫都非常“精確”,然而這個(gè)語料庫是布朗語料庫的幾百萬倍大,這樣的龐大規(guī)模優(yōu)勢(shì)完全掩蓋了它的缺點(diǎn)。也就是“大數(shù)據(jù)的簡單算法,比小數(shù)據(jù)的復(fù)雜算法,更加有效”。

? ? ?第三個(gè)思維變革:不是因果關(guān)系,而是相關(guān)性。大數(shù)據(jù)思維只關(guān)注“相關(guān)性”,而不再關(guān)注因果關(guān)系。學(xué)過“數(shù)據(jù)挖掘”課程的朋友都知道沃爾瑪?shù)摹捌【婆c尿布”的案例:“沃爾瑪通過對(duì)超市里人們購買行為的大量數(shù)據(jù)分析,發(fā)現(xiàn)男人們來買啤酒的時(shí)候,通常也會(huì)買尿布。這樣的發(fā)現(xiàn)就讓超市將尿布和啤酒擺放在一起出售,從而提高利潤?!蔽以凇都?xì)節(jié)》這本書也看到過類似的案例,通過數(shù)據(jù)分析來確定各類商品的擺放位置,從而提高銷售量。這是個(gè)搞不清楚因果關(guān)系的問題:尿布和啤酒的銷售量為什么會(huì)有關(guān)聯(lián)呢?我們?cè)诠ぷ魃钪行纬傻摹肮赜幸颉钡乃季S范式已經(jīng)很難完美的解釋這個(gè)問題,就如為什么沃爾瑪里手電筒與蛋撻的銷量具有正相關(guān)性一樣讓人無法理解一樣。所以,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)會(huì)告訴我們答案,我們的思維要改變的很重要的一點(diǎn)就是,只要搞清楚“是什么”就OK,而不要過多糾結(jié)于“為什么”。

? ? ? 總而言之,大數(shù)據(jù)時(shí)代帶給我們的是更多、更雜與更好。正如作者所言“大數(shù)據(jù)要求我們有所改變,我們必須能夠接受混亂和不確定性”。認(rèn)為每個(gè)問題只有一個(gè)答案的想法已經(jīng)不適應(yīng)這個(gè)時(shí)代了,不管我們承不承認(rèn)。一旦我們承認(rèn)了這個(gè)事實(shí),甚至擁護(hù)這個(gè)事實(shí)的話,我們離真相就又近了一步。

? ? ?二、“乘勢(shì)而上”抓創(chuàng)新

? ? 目前,我們已經(jīng)完全從“數(shù)字化”步入“數(shù)據(jù)化”時(shí)代。比如,在Foursquare和高德地圖、百度地圖中,“方位”已經(jīng)被“數(shù)據(jù)化”,我們可以在任意喜愛的地點(diǎn)選擇飯館、酒店和其他各種服務(wù)。在Facebook、twitter或微信、微博里,"溝通"也已經(jīng)被“數(shù)據(jù)化”,許多金融公司通過分析每天社交網(wǎng)絡(luò)的大量數(shù)據(jù),作為股市的投資信號(hào)。

? ? ?“數(shù)據(jù)"作為一種非競(jìng)爭(zhēng)性的資源,它的價(jià)值并不會(huì)因?yàn)楸皇褂枚鴾p少,相反,它可能被通過不斷地挖掘使用而產(chǎn)生出更高的價(jià)值。數(shù)據(jù)本身的價(jià)值,是它所有能夠產(chǎn)生的可能選擇的價(jià)值的總和。正如今年數(shù)博會(huì)信息安全論壇上專家所言“當(dāng)今時(shí)代,得數(shù)據(jù)者得天下”。作者在《大數(shù)據(jù)時(shí)代》中提到了6種數(shù)據(jù)創(chuàng)新模式,結(jié)合參觀數(shù)博會(huì)的體會(huì),我認(rèn)為其中3種正是我們需要結(jié)合實(shí)際工作去深入探究的。

? ? ?一是重組分析“大數(shù)據(jù)”:將多個(gè)數(shù)據(jù)集的總和重組在一起時(shí),其價(jià)值遠(yuǎn)比單個(gè)數(shù)據(jù)集大得多。比如,丹麥的癌癥研究就是將所有的癌癥患者和手機(jī)用戶的數(shù)據(jù)結(jié)合起來,從而揭示癌癥和手機(jī)使用是否有關(guān)聯(lián)性。將所有快遞信息、酒店信息、通信信息和購物信息等集合進(jìn)行分析,就可以把每個(gè)人的隱私及愛好特點(diǎn)很生動(dòng)的描繪出來。

? ? ?二是擴(kuò)展“大數(shù)據(jù)”功能。譬如,零售在店內(nèi)安裝的監(jiān)控?cái)z像頭,不僅能認(rèn)出小偷,也能跟蹤經(jīng)過商店的客戶流和他們停留的位置,從而對(duì)貨架的布局進(jìn)行優(yōu)化,以提升銷售額。同樣在公共服務(wù)的設(shè)計(jì)方面,在阿里云及高德地圖的輔助下,很多城市已經(jīng)通過監(jiān)控?cái)?shù)據(jù)來分析,優(yōu)化各個(gè)道路信號(hào)燈的設(shè)計(jì),降低擁堵率,提升公共服務(wù)品質(zhì)。

? ? ?三是利用“數(shù)據(jù)廢氣”:從反向入手,讓異常數(shù)據(jù)為我所用。比如,在教育云模式下的拼寫檢查中,用戶會(huì)有大量的錯(cuò)誤拼寫。這些數(shù)據(jù)看起來是廢品,但收集在一起卻能夠鍛造成一塊閃亮的寶石。例如,當(dāng)couresa這樣的網(wǎng)絡(luò)平臺(tái)中一個(gè)班級(jí)數(shù)量超過萬人時(shí),教授發(fā)現(xiàn)2000個(gè)學(xué)生在作業(yè)中犯了同樣的一個(gè)錯(cuò)誤。修正后,系統(tǒng)將會(huì)提醒以后犯同樣錯(cuò)誤的學(xué)生。通過這些錯(cuò)誤,我們提升了教學(xué)的針對(duì)性。目前,“數(shù)據(jù)廢氣”在實(shí)際應(yīng)用中發(fā)揮巨大的作用,從國網(wǎng)和中石油、中石化的大數(shù)據(jù)案例分享中都能感受到“數(shù)據(jù)廢氣”在及時(shí)發(fā)現(xiàn)系統(tǒng)或設(shè)備故障預(yù)警中的作用。

? ? ? ?基于大數(shù)據(jù)的潛在價(jià)值,當(dāng)前及今后會(huì)有三種不同的大數(shù)據(jù)機(jī)構(gòu),第一種是基于數(shù)據(jù),第二種是基于技術(shù),第三種則是基于思維。我認(rèn)為第一種就像擁有金礦的礦山;第二種就是像擁有開采、提煉金礦的技術(shù);第三種則是深加工金礦的,把金礦做成精美首飾,通過創(chuàng)新思維讓大數(shù)據(jù)具有更大的價(jià)值。在這個(gè)瞬息萬變的時(shí)代,若不去主動(dòng)創(chuàng)新,等待我們的,必然會(huì)是被動(dòng)的應(yīng)對(duì)。

? ? ?三、“應(yīng)勢(shì)而動(dòng)”控安全

? ? ?任何科學(xué)技術(shù)的進(jìn)步都是一把雙刃劍,它為人們帶來巨大的思維和商業(yè)變革的同時(shí),也存在著隱私問題、數(shù)據(jù)泄露危機(jī)等諸多新的難題。

? ? ?這是《大數(shù)據(jù)時(shí)代》這本書關(guān)注的重點(diǎn),也是本屆貴陽數(shù)博會(huì)的一項(xiàng)重要議題。多數(shù)信息安全企業(yè)都提到“徐玉玉事件”,大數(shù)據(jù)背后帶來的也是重重隱憂,從我們的隱私不斷暴露,個(gè)人在網(wǎng)絡(luò)上留下的千絲萬縷的蹤跡似乎讓人們又回到了《一九八四》里“老大哥在看著你”的那種擔(dān)憂?!皵?shù)據(jù)統(tǒng)治”的登峰造極從哲學(xué)上會(huì)抹殺人的自由意志和選擇的可能性。

? ? ?目前,阿里云可以整合我們?cè)诟鞣N消費(fèi)平臺(tái)上的數(shù)據(jù),來評(píng)判我們的信用,給我們一定的“芝麻分”,確定我們的信用等級(jí);淘寶可以根據(jù)各類數(shù)據(jù)評(píng)判我們的喜好傾向,從而主動(dòng)給我們推送相應(yīng)的物品鏈接。未來,社會(huì)陪審團(tuán)很有可能基于我們?cè)诟黝惷浇槠脚_(tái)上的各種數(shù)據(jù)分析,斷定我們中某些人今后存在犯罪的可能。那將是人性面對(duì)技術(shù)的一次潰敗。

? ? ?這個(gè)局怎么破?這是擺在當(dāng)前的一個(gè)很嚴(yán)肅的命題。在這次大數(shù)據(jù)安全論壇上,各路學(xué)者專家、機(jī)構(gòu)大佬談了很多,從不同角度進(jìn)行了闡述。歸結(jié)起來,無非三個(gè)方面。首先,基礎(chǔ)要夯實(shí),建立起大數(shù)據(jù)安全標(biāo)準(zhǔn)體系和規(guī)范。其次,要做好頂層設(shè)計(jì)。全面謀劃大數(shù)據(jù)安全的戰(zhàn)略布局,推進(jìn)信息技術(shù)與安全技術(shù)的深度融合。第三,要協(xié)同作戰(zhàn),無論在安全評(píng)估、情報(bào)共享還是應(yīng)急處置等方面,各方形成合力,共固大數(shù)據(jù)安全鐵籠。

? ? ?閱讀《大數(shù)據(jù)時(shí)代》的過程,讓我想起托馬斯·庫恩《科學(xué)革命的結(jié)構(gòu)》,我很贊同庫恩的“科學(xué)革命是世界觀的轉(zhuǎn)變”的觀點(diǎn),大數(shù)據(jù)給我們帶來的也是思維范式的根本性變革——我們將不再沉湎于歷史和過去,試圖解釋某種聯(lián)系,而是更好地覺知當(dāng)下,與正在發(fā)聲的未來。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容