第一部分 大數(shù)據(jù)時代的思維變革
01|更多:不是隨機樣本,而是全體數(shù)據(jù)
02|更雜:不是精確性,而是混雜性
03|更好:不是因果關(guān)系,而是相關(guān)關(guān)系
第二部分 大數(shù)據(jù)時代的商業(yè)變革
04|數(shù)據(jù)化:一切解渴“量化”
Case1【亞馬遜】
- GregLinden 最初內(nèi)容是由人工親自完成
- JessBezos 根據(jù)客戶個人以前的購物喜好,為其推薦具體的書籍
(??)信息量大,因此用傳統(tǒng)方法處理,通過樣本分析找到客戶間的相似性。
(??)應(yīng)尋找產(chǎn)品之間的關(guān)聯(lián)性
- 1998Linden和同事申請了“item-to-item”協(xié)同過濾技術(shù)的專利
- 估算可以提前進(jìn)行
- 數(shù)據(jù)推薦產(chǎn)品銷量>書評家
- 數(shù)據(jù)沒有說話,人工評論的成本非常高
Case2【奈飛】
- “是什么”可以創(chuàng)造點擊率
- 是什么讓客戶做出選擇
- 把握客戶做決定背后的真正原因
關(guān)聯(lián)物,預(yù)測的關(guān)鍵
- 應(yīng)用相關(guān)關(guān)系,比以前更容易、更快捷、更清楚地分析事物。
- 相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系。
- 相關(guān)關(guān)系通過識別有用的關(guān)聯(lián)物來分析一個現(xiàn)象,而不是通過揭示其內(nèi)部的運作機制。
- 相關(guān)關(guān)系沒有絕對,只有可能性。
- 相關(guān)關(guān)系可以幫助捕捉現(xiàn)在和預(yù)測未來,無法預(yù)知未來,只能預(yù)測可能發(fā)生的事情。
Case3【沃爾瑪】
1990' 沃爾瑪讓供應(yīng)商自行管理物流、不接受產(chǎn)品的“所有權(quán)”(避免存貨的風(fēng)險也降低成本)。
2004 颶風(fēng)來臨,手電筒、蛋撻銷量增加——應(yīng)放在一起,增加銷量
- 當(dāng)數(shù)據(jù)點以數(shù)量級方式增長的時候,會觀察到許多似是而非的相關(guān)關(guān)系。
- 1888年FrancisGalton提出:在大數(shù)據(jù)時代來臨前很久,相關(guān)關(guān)系就已經(jīng)被證明大有用途。
- how to find the connection?——有些人會使用建立在理論基礎(chǔ)上的假象來指導(dǎo)自己選擇適當(dāng)?shù)年P(guān)聯(lián)物。(只是用小數(shù)據(jù)時代)
- 用數(shù)據(jù)驅(qū)動的關(guān)于大數(shù)據(jù)的相關(guān)關(guān)系分析法,取代了基于假象的易出錯的方法
- 大數(shù)據(jù)的核心:建立在相關(guān)關(guān)系分析發(fā)基礎(chǔ)上的預(yù)測是