文 | 又在路上Y0Y0 于 2019.6.11
讀書 | 《大數(shù)據(jù)時代》第一部分 大數(shù)據(jù)時代的思維變革
日記
毒月天氣真是毒,家中開始明顯感覺悶熱難耐。
心心念念的大連櫻桃也及時寄到了家里。
默念一句,心靜自然涼。
我在幾年前讀過《大數(shù)據(jù)時代》這本書,那時這本書還剛出不久,很是引領(lǐng)潮流,當(dāng)然,現(xiàn)在這本書依然是講大數(shù)據(jù)思潮的經(jīng)典之作。
今年以來,我對數(shù)據(jù)處理工具有了一段時間的研究,于是驅(qū)使我再次打開這本書,反思這一切變化的源頭。
本書最重要的思想,就是提出了大數(shù)據(jù)時代的三大思維變革,即:
-
更多,不是隨機樣本,而是全體數(shù)據(jù)
數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的變化,在大數(shù)據(jù)時代進行抽樣分析就像在汽車時代騎馬一樣?,F(xiàn)如今,我們需要的是所有的數(shù)據(jù),“樣本=總體”。 -
更雜,不是精確性,而是混雜性
執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物。大數(shù)據(jù)時代研究的數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度。只有接受不精確性, 我們才能挖掘一直未被利用的非結(jié)構(gòu)化數(shù)據(jù)。 -
更好,不是因果關(guān)系,而是相關(guān)關(guān)系
知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“說話”。
針對以上三大思維變革,我想提出我自己的思考:
- 大數(shù)據(jù)時代是否是第一次到來?
是的。站在歷史的長河上,人類第一次具備了以數(shù)據(jù)立體化描述事物的能力。這種從0到1的改變,必然會對人類認知世界的方式帶來影響。
- 大數(shù)據(jù)之大,其力量的極限在哪里?
作者在定義大數(shù)據(jù)之大時,有兩個維度:第一,因信息技術(shù)的發(fā)展,數(shù)據(jù)體量以指數(shù)型增長,即絕對數(shù)量。第二,強調(diào)不采用隨機分機法干擾數(shù)據(jù),而直接使用所有數(shù)據(jù),即多維度、全量。
那么,在此定義之下,如果技術(shù)條件允許,數(shù)據(jù)規(guī)模和維度都可以無限增長,大數(shù)據(jù)力量是否有極限呢?它的極限在哪里呢?
我認為,大數(shù)據(jù)力量的極限在于人對數(shù)據(jù)的應(yīng)用。本質(zhì)上,大數(shù)據(jù)是應(yīng)用于機器分析的原材料,其變革意義是變革了機器的分析方法和工作產(chǎn)出。大數(shù)據(jù)本身并不能直接應(yīng)用于人腦,很簡單,人腦的處理性能并未如摩爾定律一般提高。人類無法直接應(yīng)用大數(shù)據(jù),而是應(yīng)用了大數(shù)據(jù)機器分析后的結(jié)果。
因此,大數(shù)據(jù)的無限增大并不能直接轉(zhuǎn)化為應(yīng)用效果的提升,這中間還差一環(huán),就是人類在人腦這個不變系統(tǒng)上應(yīng)用大數(shù)據(jù)分析結(jié)果的能力。
舉個例子,書中提到亞馬遜的推薦算法的優(yōu)化,帶來銷售的提升。然而,如今的問題是,由于信息量過載,人們對于各種推薦越來越視而不見。這是算法的問題嗎?不是。這是因為信息量過大,越來越多的人直接屏蔽了此類信息,其最后的應(yīng)用效果也就無從體現(xiàn)了。
- 相關(guān)關(guān)系可以替代因果關(guān)系嗎?
作者并沒有否認因果關(guān)系的重要性。這里只是延申討論是否有這種可能。人們會不會滿足于相關(guān)關(guān)系,而不再追求因果關(guān)系了呢?我認為是不可能的。
與第二點的觀點的根據(jù)相同,即人腦處理信息的系統(tǒng)并未改變。用相關(guān)關(guān)系來描述周圍的世界,即使是一個很小的范圍,也將是一個非常繁雜、龐大的描述,不是人腦可以直接處理的關(guān)系。這就是為什么人類天生傾向以因果歸因的方式來理解世界,無它,簡單快捷,最適用于人腦系統(tǒng)。
相關(guān)關(guān)系可以應(yīng)用于機器,機器分析的結(jié)果可以為人類所用。但人腦無法直接應(yīng)用大規(guī)模的相關(guān)關(guān)系進行思考。
綜合以上觀點,我認為,面對大數(shù)據(jù)時代,
1)應(yīng)當(dāng)先明確,大數(shù)據(jù)是應(yīng)用于機器分析的,而無法直接變革人類思維。
2)擁抱大數(shù)據(jù),是指我們要學(xué)會將機器分析的結(jié)果應(yīng)用于人腦思維系統(tǒng)中。
3)人腦思維本身,并不會因大數(shù)據(jù)時代的變革而有什么變化。堅持邏輯推理、因果論仍是最適合人腦思維的系統(tǒng)理論。

歡迎圍觀、留言、分享。
人生還長,何不結(jié)伴同行?
