某些觀念有時(shí)會以驚人的力量給知識狀況帶來巨大的沖擊。由于這些觀念能一下子解決許多問題,所以,它們似乎將有希望解決所有基本問題,澄清所有不明了的疑點(diǎn)。每個(gè)人都想迅速地抓住它們,作為進(jìn)入某種新實(shí)證科學(xué)的法寶,作為可以用來建構(gòu)一個(gè)綜合體的分析體系的概念軸心。---蘇珊·朗格 《哲學(xué)新視野》

最近看了一本書,講述、理清了大數(shù)據(jù)的基本概念和特點(diǎn)。
書名:《大數(shù)據(jù)時(shí)代》
作者:維克托·邁爾-舍恩伯格,肯尼思·庫克耶?
翻譯:周濤,盛楊燕

這本書提到的3點(diǎn)讓我印象深刻,下面是我的一些思考。
一、因果關(guān)系與相關(guān)關(guān)系
以前我們所關(guān)注的大都以因果關(guān)系為主。用谷歌的‘?dāng)?shù)字圖書館’一搜可以發(fā)現(xiàn)causality(因果關(guān)系)這個(gè)詞在1900年之前的使用頻率比correlation(相關(guān)關(guān)系)高;而1900年之后,情況就與之相反。因果關(guān)系并沒有相關(guān)關(guān)系容易解釋得清楚,在思考上要找到因果關(guān)系有時(shí)也不是一件容易的事。就好比,一個(gè)人學(xué)習(xí)時(shí)間長,但是他的成績并不一定就會比學(xué)習(xí)時(shí)間短的人高,因?yàn)檫@期間還有學(xué)習(xí)效率的問題。因此我們不能肯定學(xué)習(xí)時(shí)間長會導(dǎo)致成績的提升,但是可以確定學(xué)習(xí)時(shí)長與成績是呈正相關(guān)關(guān)系。
二、要效率而不要絕對精確
這一點(diǎn)我覺得不光是在數(shù)據(jù)分析上,生活、工作、學(xué)習(xí)上我覺得都是提倡的。因?yàn)橛袝r(shí)候?yàn)榱司_或者是完美多花的時(shí)間往往是比做得還不錯(cuò)高出很多倍,但是實(shí)際產(chǎn)生的意義并不一定很大。與其如此,倒不如把這多用的時(shí)間、精力花在其他事情上。
三、對于個(gè)人隱私保護(hù)的問題
數(shù)據(jù)化側(cè)面導(dǎo)致了我們的隱私透明化。
雖然有很多政策來保護(hù)我們的隱私,但是目前的互聯(lián)網(wǎng)公司做到的僅是告知與許可并非讓我們真正掌控保護(hù)好自己的隱私。(因?yàn)槿绻覀儾辉试S它們獲取我們的信息,很多時(shí)候我們就訪問不了這個(gè)軟件或者是網(wǎng)站)
也許還有些人會覺得很多機(jī)構(gòu)公司可以在后臺把一些重要的隱私匿名化或者做一些脫敏處理。但由于數(shù)據(jù)的交叉重復(fù),把處理過后的信息復(fù)原并不是一件很困難的事情。


