12.26讀書筆記《大數(shù)據(jù)時代》

?更好:不是因果關(guān)系,而是相關(guān)關(guān)系

林登與亞馬遜推薦系統(tǒng)

知道“是什么”可以創(chuàng)造點擊率,這種洞察力足以塑造很多行業(yè),不僅僅只是電子商務(wù)。亞馬遜的推薦系統(tǒng)梳理出了有趣的相關(guān)關(guān)系,但不知道背后的原因。知道是什么就夠了,沒必要知道為什么。

關(guān)聯(lián)物,預測的關(guān)鍵

在大數(shù)據(jù)背景下,通過應(yīng)用相關(guān)關(guān)系,我們可以比以前更容易、更快捷、更清楚地分析事物。相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系。相關(guān)關(guān)系強是指當一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值很有可能也會隨之增加。相反,相關(guān)關(guān)系弱就意味著當一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值幾乎不會發(fā)生變化。

相關(guān)關(guān)系通過識別有用的關(guān)聯(lián)物來幫助我們分析一個現(xiàn)象,而不是通過揭示其內(nèi)部的運作機制。相關(guān)關(guān)系沒有絕對,只有可能性。通過給我們找到一個現(xiàn)象的良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預測未來。相關(guān)關(guān)系時無法預知未來的,它們只能預測可能發(fā)生的事情。

當數(shù)據(jù)點以數(shù)量級方式增長的時候,我們會觀察到許多似是而非的相關(guān)關(guān)系。專家們還會使用一些建立在理論基礎(chǔ)上的假想來指導自己選擇適當?shù)年P(guān)聯(lián)物。

在大數(shù)據(jù)時代,我們現(xiàn)在擁有如此多的數(shù)據(jù),這么好的機器計算能力,因而不再需要人工選擇一個關(guān)聯(lián)物或者一小部分相似的數(shù)據(jù)來逐一分析了。大數(shù)據(jù)的相關(guān)關(guān)系分析法更準確、更快,而且不易受偏見的影響。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預測是大數(shù)據(jù)的核心。

在社會環(huán)境下尋找關(guān)聯(lián)物只是大數(shù)據(jù)分析法采取的一種方式,同樣有用的一種方法是,通過找出新種類數(shù)據(jù)之間的相互聯(lián)系來解決日常需要。通過找出一個關(guān)聯(lián)物并監(jiān)控它,我們就能預測未來。

“是什么”,而不是“為什么”

在小數(shù)據(jù)時代,由于計算機能力的不足,大部分相關(guān)關(guān)系分析僅限于尋求線性關(guān)系。在大數(shù)據(jù)時代,經(jīng)過復雜的分析,我們能夠發(fā)現(xiàn)數(shù)據(jù)的“非線性關(guān)系”。

在大數(shù)據(jù)時代,通過去探求“是什么”而不是“為什么”,相關(guān)關(guān)系幫助我們更好地了解了這個世界。

當我們說人類是通過因果關(guān)系了解世界時,我們指的是我們在理解和解釋世界各種現(xiàn)象時使用的兩種基本方法:一種是通過快速、虛幻的因果關(guān)系,還有一種就是通過緩慢、有條不紊的因果關(guān)系。大數(shù)據(jù)會改變這兩種基本方法在我們認識世界時所扮演的角色。

首先,我們的直接愿望就是了解因果關(guān)系。即使無因果關(guān)系存在,我們也還會假定其存在。普林斯頓大學心理學專家,同時也是2002年諾貝爾經(jīng)濟學獎得主丹尼爾·卡尼曼用例子證明了人有兩種思維模式:第一種是不費力的快速思維,通過這種思維方式幾秒鐘就能得出結(jié)果;另一種是比較費力的慢性思維,對于特定的問題,就是需要思考到位。

快速思維模式使人們偏向用因果關(guān)系來看待周圍的一切,即使這種關(guān)系并不存在。大數(shù)據(jù)之間的相關(guān)關(guān)系,將經(jīng)常會用來證明直覺的因果聯(lián)系使錯誤的。慢性思維,也將因為大數(shù)據(jù)之間的相關(guān)關(guān)系迎來大的改變。

相關(guān)關(guān)系分析本身意義重大,同時它也為研究因果關(guān)系奠定了基礎(chǔ)。相關(guān)關(guān)系很有用,不僅僅使因為它能為我們提供新的視角,而且提供的視角都很清晰。而且我們一旦把因果關(guān)系考慮進來,這些視角就有可能被蒙蔽掉。

在越來越多的情況下,快速清晰的相關(guān)關(guān)系分析甚至比慢速的因果分析更有用和更有效。在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道“是什么”時,我們就會繼續(xù)向更深層次研究因果關(guān)系,找出背后的“為什么”。

改變,從操作方式開始

數(shù)據(jù)正在以新的方式幫助我們解決現(xiàn)實生活中的難題。我們需要改變我們的操作方式,使用我們能收集到的所有數(shù)據(jù),而不僅僅是使用樣本。我們不能再把精確性當成重心,我們需要接受混亂和錯誤的存在。另外,我們應(yīng)該側(cè)重于分析相關(guān)關(guān)系,而不再尋求每個預測背后的原因。

大數(shù)據(jù),改變?nèi)祟愄剿魇澜绲姆椒?/b>

“理論的終結(jié)”似乎暗示著,盡管理論扔存在于像物理、化學這樣的學科里,但大數(shù)據(jù)分析不需要成形的概念。這實在荒謬。大數(shù)據(jù)是在理論的基礎(chǔ)上形成的。

(68-94)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容