03|更好:不是因果關(guān)系,而是相關(guān)關(guān)系

第一部分 大數(shù)據(jù)時代的思維變革
01|更多:不是隨機樣本,而是全體數(shù)據(jù)
02|更雜:不是精確性,而是混雜性
03|更好:不是因果關(guān)系,而是相關(guān)關(guān)系

第二部分 大數(shù)據(jù)時代的商業(yè)變革
04|數(shù)據(jù)化:一切解渴“量化”

Case1【亞馬遜】

  1. GregLinden 最初內(nèi)容是由人工親自完成
  2. JessBezos 根據(jù)客戶個人以前的購物喜好,為其推薦具體的書籍

(??)信息量大,因此用傳統(tǒng)方法處理,通過樣本分析找到客戶間的相似性。
(??)應(yīng)尋找產(chǎn)品之間的關(guān)聯(lián)性

  • 1998Linden和同事申請了“item-to-item”協(xié)同過濾技術(shù)的專利
  • 估算可以提前進(jìn)行
  • 數(shù)據(jù)推薦產(chǎn)品銷量>書評家
  • 數(shù)據(jù)沒有說話,人工評論的成本非常高

Case2【奈飛】

  • “是什么”可以創(chuàng)造點擊率
  • 是什么讓客戶做出選擇
  • 把握客戶做決定背后的真正原因

關(guān)聯(lián)物,預(yù)測的關(guān)鍵

  • 應(yīng)用相關(guān)關(guān)系,比以前更容易、更快捷、更清楚地分析事物。
  • 相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系。
  • 相關(guān)關(guān)系通過識別有用的關(guān)聯(lián)物來分析一個現(xiàn)象,而不是通過揭示其內(nèi)部的運作機制。
  • 相關(guān)關(guān)系沒有絕對,只有可能性。
  • 相關(guān)關(guān)系可以幫助捕捉現(xiàn)在和預(yù)測未來,無法預(yù)知未來,只能預(yù)測可能發(fā)生的事情。

Case3【沃爾瑪】
1990' 沃爾瑪讓供應(yīng)商自行管理物流、不接受產(chǎn)品的“所有權(quán)”(避免存貨的風(fēng)險也降低成本)。
2004 颶風(fēng)來臨,手電筒、蛋撻銷量增加——應(yīng)放在一起,增加銷量

  • 當(dāng)數(shù)據(jù)點以數(shù)量級方式增長的時候,會觀察到許多似是而非的相關(guān)關(guān)系。
  • 1888年FrancisGalton提出:在大數(shù)據(jù)時代來臨前很久,相關(guān)關(guān)系就已經(jīng)被證明大有用途。
  • how to find the connection?——有些人會使用建立在理論基礎(chǔ)上的假象來指導(dǎo)自己選擇適當(dāng)?shù)年P(guān)聯(lián)物。(只是用小數(shù)據(jù)時代)
  • 用數(shù)據(jù)驅(qū)動的關(guān)于大數(shù)據(jù)的相關(guān)關(guān)系分析法,取代了基于假象的易出錯的方法
  • 大數(shù)據(jù)的核心:建立在相關(guān)關(guān)系分析發(fā)基礎(chǔ)上的預(yù)測是
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容