????《大數(shù)據(jù)時(shí)代》這本書(shū)是著名的學(xué)者舍恩伯格和庫(kù)克耶所著的一本關(guān)于大數(shù)據(jù)的專(zhuān)著。舍恩伯格多年來(lái)一直致力于網(wǎng)絡(luò)經(jīng)濟(jì)、信息與創(chuàng)新、信息監(jiān)管、網(wǎng)絡(luò)規(guī)范與戰(zhàn)略管理的研究,他是最早洞見(jiàn)大數(shù)據(jù)研究的學(xué)者之一,擔(dān)任多個(gè)國(guó)家的顧問(wèn),曾經(jīng)參與了多個(gè)國(guó)家互聯(lián)網(wǎng)政策的制定。
????《大數(shù)據(jù)時(shí)代》這本書(shū)通過(guò)介紹大量的大數(shù)據(jù)應(yīng)用案例,主要論述了大數(shù)據(jù)時(shí)代生活、工作和思維的變革,重復(fù)的論述了大數(shù)據(jù)時(shí)代的三個(gè)特征:一是隨機(jī)抽取的少量數(shù)據(jù)將會(huì)被全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù)所取代;二是效率將會(huì)取代絕對(duì)的精確性;三是相關(guān)關(guān)系將會(huì)取代因果關(guān)系。書(shū)本同時(shí)對(duì)大數(shù)據(jù)時(shí)代所帶來(lái)的隱憂做了相關(guān)分析和未來(lái)的發(fā)展趨勢(shì)作了相關(guān)分析。
????“世界的本質(zhì)就是數(shù)據(jù),大數(shù)據(jù)將開(kāi)啟一次重大的時(shí)代轉(zhuǎn)型?!?/p>
????作者之所以寫(xiě)世界的本質(zhì)是數(shù)據(jù),是因?yàn)樯岫鞑癜岩磺惺挛锒籍?dāng)做是數(shù)據(jù)或者說(shuō)可以用數(shù)據(jù)來(lái)表達(dá)。而之所以說(shuō)大數(shù)據(jù)將開(kāi)啟一次時(shí)代轉(zhuǎn)型,是因?yàn)榛ヂ?lián)網(wǎng)在逐漸成熟發(fā)展的今天,大數(shù)據(jù)將成為現(xiàn)代社會(huì)基礎(chǔ)設(shè)施的一部分。
????“隨機(jī)采樣取得了巨大的成功,成為現(xiàn)代社會(huì)、現(xiàn)代測(cè)量領(lǐng)域的主心骨。但這只是一條捷徑,是在不可收集和分析全部數(shù)據(jù)情況下的選擇,它本身存在許多固有的缺陷。”
????作者在書(shū)中分散的解釋了隨機(jī)采樣的缺陷:樣本的隨機(jī)性相對(duì)樣本數(shù)量更加重要,但隨機(jī)性卻又難以保證;隨機(jī)采樣不適合考察子類(lèi)別的材料;隨機(jī)采樣的調(diào)查結(jié)果缺乏延展性,不可以重新分析以實(shí)現(xiàn)計(jì)劃之外的目的;隨機(jī)采樣忽視了細(xì)節(jié)考察。
????采樣分析是信息缺乏時(shí)代和信息溝通受限制時(shí)的模擬數(shù)據(jù)時(shí)代的產(chǎn)物,其產(chǎn)生的原因是由于人們更加傾向于利用少數(shù)數(shù)據(jù)獲得關(guān)于整體的情況,是我們制度、處理過(guò)程優(yōu)化和激勵(lì)機(jī)制下的產(chǎn)物。
????“大數(shù)據(jù)時(shí)代開(kāi)啟了一場(chǎng)尋寶游戲,而人們對(duì)于數(shù)據(jù)的看法以及對(duì)于由因果關(guān)系向相關(guān)關(guān)系轉(zhuǎn)化時(shí)所釋放的潛在價(jià)值的態(tài)度,正是主宰這場(chǎng)游戲的關(guān)鍵?!?/p>
????大數(shù)據(jù)時(shí)代,數(shù)據(jù)的無(wú)處不在,數(shù)據(jù)的存儲(chǔ)、分享和挖掘工具也已經(jīng)相對(duì)成熟,同時(shí)大數(shù)據(jù)將改變新一輪的創(chuàng)業(yè)方向、商業(yè)模式和投資機(jī)會(huì),這種更加以結(jié)果為導(dǎo)向而忽視原因的東西更加適應(yīng)相關(guān)關(guān)系,而非因果關(guān)系。有時(shí)候知道是什么就夠了,沒(méi)必要知道為什么。
????“當(dāng)我們說(shuō)人類(lèi)是通過(guò)因果關(guān)系了解世界時(shí),我們指的是我們?cè)诶斫夂徒忉屖澜绺鞣N現(xiàn)象所使用的兩種基本方法:一種是通過(guò)快速、虛幻的因果關(guān)系,還有一種就是通過(guò)緩慢、有條不紊的因果關(guān)系。大數(shù)據(jù)之間的關(guān)系將會(huì)改變他們扮演的角色?!?/p>
????絕對(duì)的因果關(guān)系是不存在的,只不過(guò)是人們一廂情愿的結(jié)果。不管是快速還是緩慢的因果關(guān)系,大數(shù)據(jù)時(shí)代都不在實(shí)用,而從因果關(guān)系到相關(guān)關(guān)系的思維變革才是大數(shù)據(jù)的關(guān)鍵,建立在相關(guān)關(guān)系分析法的預(yù)測(cè)才是大數(shù)據(jù)的核心。
????“大數(shù)據(jù)時(shí)代,告知與許可這個(gè)經(jīng)過(guò)了考驗(yàn)并且可信賴(lài)的基石,要么太狹隘,限制了大數(shù)據(jù)潛在價(jià)值的挖掘,要么太空泛而無(wú)法真正地保護(hù)個(gè)人隱私。”
????在真正理解這計(jì)劃之前,需要了解大數(shù)據(jù)對(duì)現(xiàn)代社會(huì)所帶來(lái)的負(fù)面影響,盡管書(shū)中作者援引了大量大數(shù)據(jù)的實(shí)際應(yīng)用,但卻無(wú)法逃避事物的雙面性。大數(shù)據(jù)使得監(jiān)控變得簡(jiǎn)單、成本低廉;運(yùn)用大數(shù)據(jù)預(yù)測(cè)來(lái)判斷和懲罰人類(lèi)的潛在行為,這是一種鍍公平公正以及自由意志的一種褻瀆,同時(shí)也輕蔑了決策過(guò)程中深思熟慮的重要性;大數(shù)據(jù)的分析錯(cuò)誤所帶來(lái)的風(fēng)險(xiǎn)比其他風(fēng)險(xiǎn)可能更大;大數(shù)據(jù)的價(jià)值更多在于二次利用,由此帶來(lái)的規(guī)避隱私權(quán)等問(wèn)題令人頗為擔(dān)憂。
????作為通常所用的告知與許可,其實(shí)是一種近似欺騙的行為。其實(shí)是無(wú)法真正保護(hù)個(gè)人隱私的,如果真的能夠保護(hù),那么為什么那沒(méi)多應(yīng)用軟件為什么還有搜集與其并無(wú)多大關(guān)系的數(shù)據(jù)呢?其實(shí)除了告知與許可,還有匿名化和技術(shù)中的模糊化處理這些對(duì)于數(shù)據(jù)都是天方夜譚。那么是否存在真正解決方法呢?作者提出讓數(shù)據(jù)使用者承擔(dān)責(zé)任,建立全新的制度規(guī)范,技術(shù)的“差別隱私”等建議。
????“大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類(lèi)的作用依然無(wú)法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的辦法和答案還在不就的未來(lái)?!?/p>
????盡管大數(shù)據(jù)幫助我們預(yù)測(cè)未來(lái),但是人類(lèi)自身的作用不可替代,不論是構(gòu)建存儲(chǔ)、分析和分享的數(shù)據(jù)系統(tǒng),還是建立制度規(guī)范或其它都有人的參與。盡管機(jī)器的自我學(xué)習(xí)正在日新月異的跟進(jìn)之中。
????“因果關(guān)系是關(guān)于人在宇宙中的位置以及在喧囂混亂、不可理喻的世界尋找意義這一永恒爭(zhēng)論的一部分。”
????既使大數(shù)據(jù)時(shí)代強(qiáng)調(diào)相關(guān)關(guān)系,但正如作者分析大數(shù)據(jù)未成熟時(shí)代的因果關(guān)系所強(qiáng)調(diào)的,人們的理性思維和自由選擇是無(wú)法被取代的,窮盡真理與時(shí)常思考是人之所以為人的存在理由之一。
????“人類(lèi)獨(dú)有的弱點(diǎn)、錯(cuò)覺(jué)、錯(cuò)誤都是十分必要的,因?yàn)檫@些特性的另一頭牽著的是人類(lèi)的創(chuàng)造力、直覺(jué)和天賦。偶爾也會(huì)帶來(lái)屈辱或固執(zhí)的同樣混亂的大腦運(yùn)作,也能帶來(lái)成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂(lè)于接受類(lèi)似的不準(zhǔn)確,因?yàn)椴粶?zhǔn)確正是我們之所以為人的特征之一?!?/p>
????敢于接受世界的不確定性,敢于接受不準(zhǔn)確是一種智慧,既然弱點(diǎn)錯(cuò)誤錯(cuò)覺(jué)都是一種經(jīng)歷,則我們只要努力也會(huì)碰到創(chuàng)造力和直覺(jué)。