《大數(shù)據(jù)時代》讀書筆記(上)

維克托·邁爾-舍恩伯格[英] 肯尼思·庫克耶[英]著,盛楊燕 周濤譯

第一部分,大數(shù)據(jù)時代的思維變革

2009年的H1N1病毒,爆發(fā)時谷歌比官方更早預測到了,這是基于海量用戶搜索信息分析的結果,利用已有信息,其他公司還可以預測機票價格的變動。

人們所有行為都會留下痕跡,現(xiàn)在存儲和分析信息的成本越來越低,大量存儲和利用信息成為可能,我們進入了大數(shù)據(jù)時代。

大數(shù)據(jù)的核心就是預測,在數(shù)據(jù)使用上有三個轉變:一是可以處理相關的所有數(shù)據(jù)而不是以往的取樣分析。以前用隨機采樣的小數(shù)據(jù)方法,用最少的數(shù)據(jù)獲得最多的信息,因為獲取和存儲分析數(shù)據(jù)難度很大,隨機采樣法是不可收集全部數(shù)據(jù)的情況下的選擇,本身還是有許多固有缺陷。它的成功依賴于采樣的絕對隨機性,但在實際運用中實現(xiàn)隨機性非常困難。大數(shù)據(jù)指不用隨機分析法,而采用所有數(shù)據(jù)的方法。樣本=總體。

二是不必追求數(shù)據(jù)的精確度,人們分析的是趨勢而不追求精確度。大數(shù)據(jù)通常用概率說話。大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效。大數(shù)據(jù)要求我們必須接受混亂和不確定性,認為每個問題只有一個答案的想法是站不住腳的。

三是不再熱衷于尋找因果關系,我們不必知道“為什么”只需要知道“是什么”。在大數(shù)據(jù)背景下,相關關系更能夠幫助我們認識和分析事物。相關關系是指當一個數(shù)值增加時,另一個數(shù)據(jù)值很有可能也隨之增加。通過找到一個現(xiàn)象的良好的關聯(lián)物,相關關系可以幫助我們捕捉現(xiàn)在和預測未來。建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。

在社會環(huán)境下尋找關聯(lián)物是一種方法,另一種方法是通過找出新種類數(shù)據(jù)之間的相互聯(lián)系來解決日常需要,通過找出一個關聯(lián)物并監(jiān)控它,我們就能預測未來。

這個系統(tǒng)依賴的是相關關系,而不是因果關系,他告訴你的是會發(fā)生什么,而不是為什么發(fā)生,這正是這個系統(tǒng)的價值。通過去探求“是什么”,而不是“為什么”,相關關系幫助我們更好的了解了這個世界。

第二部分,大數(shù)據(jù)時代的商業(yè)變革

一、數(shù)據(jù)化——一切皆可量化。

莫里的導航圖是大數(shù)據(jù)的最早實踐之一。大數(shù)據(jù)發(fā)展的核心動力來源于人類測量、記錄和分析世界的渴望!

“數(shù)據(jù)化”是指一種把現(xiàn)象轉變?yōu)榭芍票矸治龅牧炕问降倪^程。與之不同的是,數(shù)字化指的是把模擬數(shù)據(jù)轉換成用0和1表示的二進制碼。量化一切是數(shù)據(jù)化的核心。

當文字變成數(shù)據(jù),人可以閱讀,機器也可以用之分析。位置信息能夠變成數(shù)據(jù),人的溝通也能變成數(shù)據(jù),世間萬物都可以數(shù)據(jù)化。將世界看作信息,看作可以理解的數(shù)據(jù)的海洋,為我們提供了一個從未有過的審視現(xiàn)實的視角,它是一種可以滲透到所有生活領域的世界觀。

二、數(shù)據(jù)的首要價值被發(fā)掘后仍能不斷給予,它的真實價值就像冰山一樣,絕大部分都隱藏在表面之下。

在數(shù)字化時代,數(shù)據(jù)支持交易的作用被掩蓋,數(shù)據(jù)只是被交易的對象。而在大數(shù)據(jù)時代,事情再次發(fā)生變化。數(shù)據(jù)的價值從它最基本的用途轉變?yōu)槲磥淼臐撛谟猛?。這一轉變意義重大,它影響了企業(yè)評估其擁有的數(shù)據(jù)及訪問者的方式,促使甚至是迫使公司改變他們的商業(yè)模式,同時也改變了組織看待和使用數(shù)據(jù)的方式。

不同于物質性的東西,數(shù)據(jù)的價值不會隨著它的使用而減少,而是可以不斷地被處理。

數(shù)據(jù)的價值并不僅限于特定的用途,它可以為了同一目的而被多次使用,也可以用于其他目的。要了解大數(shù)據(jù)時代究竟有多少信息對我們有價值,后面這一點尤其重要。

最終,數(shù)據(jù)的價值是其所有可能用途的總和。這些似乎無限的潛在用途就像是選擇,這里不是指金融工具意義上的選擇,而是實際意義上的選擇。這些選擇的總和就是數(shù)據(jù)的價值,即數(shù)據(jù)的“潛在價值”。

數(shù)據(jù)創(chuàng)新1:數(shù)據(jù)再利用,2:重組數(shù)據(jù),3:可擴展數(shù)據(jù),4:數(shù)據(jù)的折舊值,5:數(shù)據(jù)廢氣,6:開放數(shù)據(jù)。

數(shù)據(jù)價值的關鍵是看似無限的再利用,即它的潛在價值。收集信息固然至關重要,但還遠遠不夠,因為大部分的數(shù)據(jù)價值在于它的使用,而不是占有本身。

三、數(shù)據(jù)、技術與思維的三足鼎立。如今,我們正處在大數(shù)據(jù)時代的早期,思維和技術是最有價值的,但是最終大部分的價值還是必須從數(shù)據(jù)本身中挖掘。

大數(shù)據(jù)價值鏈的3大構成:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能的公司,第三種是基于思維的公司,所謂大數(shù)據(jù)思維,是指一種意識,認為公開的數(shù)據(jù)一旦處理得當就能為千百萬人急需解決的問題提供答案。

到目前為止,前兩種因素一直備受關注,因為在現(xiàn)今世界,技能依然欠缺,而數(shù)據(jù)則非常之多。近年來,一種新的職業(yè)出現(xiàn)了,那就是“數(shù)據(jù)科學家”。數(shù)據(jù)科學家是統(tǒng)計學家、軟件程序員、圖形設計師與作家的結合體。與通過顯微鏡發(fā)現(xiàn)事物不同,數(shù)據(jù)科學家通過探尋數(shù)據(jù)庫來得到新的發(fā)現(xiàn)。全球知名咨詢管理公司麥肯錫,就曾極端地預測數(shù)據(jù)科學家是當今和未來稀缺的資源。如今的數(shù)據(jù)科學家們也喜歡用這個預測來提升自己的地位和工資水平。

會出現(xiàn)一種全新的數(shù)據(jù)中間商。現(xiàn)今,我們正處在大數(shù)據(jù)時代的早期,思維和技能是最有價值的,但是最終,大部分的價值還是必須從數(shù)據(jù)本身中挖掘。因為在未來,我們可以利用數(shù)據(jù)做更多的事情,而數(shù)據(jù)擁有者們也會真正意識到他們所擁有的財富。因此,他們可能會把他們手中所擁有的數(shù)據(jù)抓得更緊,也會以更高的價格將其出售。繼續(xù)用金礦來打比方:只有金子才是真正值錢的。隨著數(shù)據(jù)價值轉移到數(shù)據(jù)擁有者手上,傳統(tǒng)的商業(yè)模式也被顛覆了。

同樣地,人類從依靠自身判斷做決定到依靠數(shù)據(jù)做決定的轉變,也是大數(shù)據(jù)做出的最大貢獻之一。行業(yè)專家和技術專家的光芒都會因為統(tǒng)計學家和數(shù)據(jù)分析家的出現(xiàn)而變暗,因為后者不受舊觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出的聲音。他們的判斷建立在相關關系的基礎上,沒有受到偏見和成見的影響。

大數(shù)據(jù)讓處于行業(yè)兩端的公司受益良多,而中等規(guī)模的公司要么向兩端轉換,要么破產。傳統(tǒng)行業(yè)最終都會轉變?yōu)榇髷?shù)據(jù)行業(yè),無論是金融服務業(yè)、醫(yī)藥行業(yè)還是制造業(yè)。當然,大數(shù)據(jù)不會讓所有行業(yè)的中等規(guī)模的公司消亡,但是肯定會給可以被大數(shù)據(jù)分析所取代的中等規(guī)模公司帶來巨大的威脅。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容