大數(shù)據(jù)時代的變革

央視“科技盛典2015年科技創(chuàng)新人物”中最引人注目的就是27歲當上教授的電子科技大學的周濤。他現(xiàn)在潛心研究大數(shù)據(jù),為的是讓中國在此新技術上不落后于外國。他甚至還翻譯了大數(shù)時代預言家作著的書,名為《大數(shù)據(jù)時代》。書中引用了大量的例子,一點也不枯燥乏味。除了在一些概念上略顯生澀,翻譯沒有見到英語語言的啰嗦,是本可以精讀的書籍。全書以三方面講述大數(shù)據(jù)時代給我們帶來的變革,分別為思維變革(更多、更雜和更好)、商業(yè)變革(數(shù)據(jù)化、價值和角色定位)和管理變革(風險和掌控)。下面我就來說說這本書帶給我思想上的變革。

大數(shù)據(jù)的興起是因為2009年甲型H1N1流感的爆發(fā)。疾病預防與控制中心統(tǒng)計流感發(fā)生的信息的速度,竟然不如谷歌這一家互聯(lián)網(wǎng)公司。谷歌正是利用人們在網(wǎng)上搜索“流感”相關詞條頻率和地域,預測出流感的源頭。這種方法比起傳統(tǒng)的方法,更準確和高效。這就是大數(shù)據(jù)——以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。

大數(shù)據(jù)與三個重大的思維轉變有關。平時我們分析數(shù)據(jù)都是提取少量樣本,算出數(shù)據(jù)越精確越好,并且找尋樣本與結論之前的因果聯(lián)系。但大數(shù)據(jù)改變了這些。首先,它要分析與事物相關的所有數(shù)據(jù);其次,我們要樂于接受數(shù)據(jù)的紛繁復雜;最后,我們要關注事物的相關關系。隨機采樣需要嚴密的安排和執(zhí)行。人們只能從采樣數(shù)據(jù)中得出事先設計好的問題的結果,但不能奢求采樣數(shù)據(jù)能回答其他問題。這種調查結果缺乏延展性。所以大數(shù)據(jù)采用所有數(shù)據(jù)的方法。大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實現(xiàn)精確性。當數(shù)據(jù)規(guī)模變大的時候,確切的數(shù)據(jù)已經不那么重要了。錯誤并不是大數(shù)據(jù)固有的特性,而是一個亟待解決的現(xiàn)實問題,并且有可能長期存在。因果關系思維是一種比較費力的慢性思維,而相關關系思維卻是一種快速思維,更適用于這個快速發(fā)展的社會。但是,我個人覺得,因果關系思維必不可少,很多發(fā)現(xiàn)都是運用了因果思維方法。

大數(shù)據(jù)發(fā)展的核心動力來源于人類測量、記錄和分析世界的渴望。信息技術變革隨處可見,但是如今的信息技術變革的重點在“T”(技術)上,而不是在“I”(信息)上。其實遠在19世紀就有美國海軍軍官收集日期、位置、風向以及當時洋流情況繪制航海圖。可見遠在信息數(shù)字化之前,對數(shù)據(jù)的運用就已經開始了。計量和記錄一起促成了數(shù)據(jù)的誕生,它們是數(shù)據(jù)化最早的根基。文字、方位、溝通甚至世間萬物都可以數(shù)據(jù)化。有了大數(shù)據(jù)的幫助,我們不會再將世界看作是一連串我們認為或是自然或是社會現(xiàn)象的事件,我們會意識到本質上世界是由信息構成的。

數(shù)據(jù)的價值在于數(shù)據(jù)可以被再利用,數(shù)據(jù)還可以被擴展,重組數(shù)據(jù)、舊的數(shù)據(jù)、免費的開放數(shù)據(jù)也有其價值,還有那些記錄瀏覽了哪些頁面、停留了多久、鼠標光標停留的位置、輸入了什么信息等叫做數(shù)據(jù)廢氣的數(shù)據(jù)也不乏價值。Facebook上市前一晚,每股定價38美元,總估值1040億美元,而其資產為66億美元。這其中巨大的差異,恰恰就是數(shù)據(jù)的價值。

大數(shù)據(jù)的價值鏈由三方組成,擁有數(shù)據(jù)方、分析數(shù)據(jù)方和提供算法方。布拉德福德的FlightCaster致力于預測航班是否會晚點。它主要基于分析過去十年里每個航班的情況,然后將其與過去和現(xiàn)實的天氣情況進行匹配。數(shù)據(jù)擁有者沒有使用數(shù)據(jù)的動機和強制要求。如果美國運輸統(tǒng)計局、美國聯(lián)邦航空局和美國天氣服務數(shù)據(jù)的擁有者要將航班晚點預測用作商業(yè)用途,國會可能就會舉辦聽證會并否決這個提議。航空公司也不會這么做,因為這些數(shù)據(jù)所表達的信息越隱蔽對他們越有利。這恰恰就是大數(shù)據(jù)思維公司和個人提供的算法。

大數(shù)據(jù)時代我們面臨很多風險,首當其沖是隱私問題。因為數(shù)據(jù)可能被二次利用,我們無法提前告訴個人。收集到的數(shù)據(jù)越來越多,來源越來越廣,我們也無法匿名。因為無論怎么匿名,數(shù)據(jù)的精確性都能定位到個人。大數(shù)據(jù)幫我們規(guī)避了“畫像”的缺點,不會直接將群體特征強加于個人。但在預測犯罪時,人們只是將做卻不是所做,并沒有犯罪。另外要避免的是數(shù)據(jù)獨裁。只要是得到了合理的利用,而不單純是為了“數(shù)據(jù)”而“數(shù)據(jù)”,大數(shù)據(jù)就會變成強大的武器。

為了避免這些風險,我們應采用以下管理變革:一是個人隱私保護,從個人許可到讓數(shù)據(jù)使用者承擔責任;二是個人可以并應該為他們的行為而并非傾向負責;三是大數(shù)據(jù)算法師崛起,分為外部算法師和內部算法師(個人理解一個是外部咨詢數(shù)據(jù)相關,一個是內部保護數(shù)據(jù));四是反數(shù)據(jù)壟斷。

結合了一下實際,覺得不妨把這種大數(shù)據(jù)思維帶入實際的工作中。我們恰恰可以成為數(shù)據(jù)的擁有者,我們可以把相關數(shù)據(jù)有償提供給數(shù)據(jù)分析者以賺取利潤?;蛘哂挚梢苑治鲞@些數(shù)據(jù)提高業(yè)務水平。就如飼料業(yè)務,我們可以根據(jù)不同飼料購買方收集數(shù)據(jù)。對于養(yǎng)殖戶,根據(jù)他購買飼料的時間和數(shù)量分析其養(yǎng)殖的情況,預測需要的飼料,主動送上門。對于分銷商,也可以根據(jù)他往年的銷售情況,提供其需要的飼料品種和數(shù)量。這只是大數(shù)據(jù)一個很簡單的應用。如果把數(shù)據(jù)二次開發(fā),說不定我們還會發(fā)現(xiàn)什么。

?圖片來源網(wǎng)絡,向原作者致敬

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容