The Ubiquity of Data Opportunities
介紹數(shù)據(jù)將越來越多地產(chǎn)生和獲取,介紹本書的目的 - 幫大家從數(shù)據(jù)分析的角度分析商業(yè)問題并了解數(shù)據(jù)分析的知識(shí)和原則。
Example:Hurricane Frances
通過Frances颶風(fēng)案例,講解數(shù)據(jù)分析知識(shí)落地作用。即通過颶風(fēng)預(yù)測消費(fèi)者會(huì)多購買多少瓶裝水,以便備貨。
Example:Predicting Customer Churn
通過顧客在運(yùn)營商之間轉(zhuǎn)移(Churn - 即國內(nèi)攜號(hào)轉(zhuǎn)網(wǎng))的數(shù)據(jù)統(tǒng)計(jì)與預(yù)測,以給不同的顧客制定不同政策以挽留,面對(duì)增量缺失存量競爭下的電信運(yùn)營市場,案例將貫穿全書各章節(jié)進(jìn)行介紹。
Data Science, eEngineering, and Data-Driven Decision Making
data science包含原則、過程和技術(shù)。
DDD(data-driven decision-making)。
案例:沃爾瑪通過用戶行為,預(yù)測用戶即將懷孕并推送相關(guān)的嬰兒用品,相比以往通過醫(yī)院出生數(shù)據(jù)判斷用戶狀態(tài),得到提前決策機(jī)會(huì),并通過提前推送獲取用戶購買行為。
Data Processing and "Big Data"
“big data”技術(shù)(如Hadoop,HBase,MongoDB)指用于處理以往數(shù)據(jù)分析未面對(duì)過的大量數(shù)據(jù)的技術(shù)手段。
From Big Data 1.0 to Big Data 2.0
1.0和2.0的對(duì)比就是:過去企業(yè)收集大量數(shù)據(jù)是1.0,以后要做一些更深入的數(shù)據(jù)科學(xué)分析,起名就叫2.0吧。
Data and Data Science Capability as a Strategic Asset
將數(shù)據(jù)看做資產(chǎn),然后對(duì)數(shù)據(jù)投資,提到了signet bank的信用卡案例,通過向不同數(shù)據(jù)的用戶推送不同的服務(wù)類型和服務(wù)條款,收集和分析數(shù)據(jù)的花費(fèi)即是對(duì)數(shù)據(jù)資產(chǎn)的投資,需要考慮如何通過數(shù)據(jù)創(chuàng)造價(jià)值來贏回投資。
Amazon將用戶行為數(shù)據(jù)用來進(jìn)行商品推薦,以提高商品銷量。
Data-Analytic Thinking
因?yàn)閿?shù)據(jù)科學(xué)是支持商業(yè)決策提升的能力,所以缺了這個(gè)技能會(huì)讓你做出錯(cuò)誤決策,好好學(xué)?。?!
This Book
這本書集中在基礎(chǔ)概念和如何運(yùn)用概念解決問題,技術(shù)領(lǐng)域的覆蓋內(nèi)容較少。
Data Mining and Data Science,Revisited
基礎(chǔ)概念1:需要有數(shù)據(jù)架構(gòu)思維,即通過系統(tǒng)性的可歸因的步驟進(jìn)行數(shù)據(jù)商業(yè)問題解決;
基礎(chǔ)概念2:信息技術(shù)可從大量數(shù)據(jù)中提取實(shí)體的數(shù)據(jù)特征;
基礎(chǔ)概念3:避免過擬合overfitting;
基礎(chǔ)概念4:數(shù)據(jù)解決方案需要考慮結(jié)果被使用的上下文即關(guān)聯(lián)因素。
Chemistry Is Not About Test Tubes:Data Science Versus the Work of the Data Scientist
這本書不講技術(shù),只講數(shù)據(jù)分析原則,技術(shù)每年都變,數(shù)據(jù)分析原則十年都不會(huì)變。
Summary
沒啥實(shí)質(zhì)性內(nèi)容。