閱讀時間:2017.5.17——2017.5.22
摘要:
第一章:數(shù)據(jù)
什么是數(shù)據(jù)
數(shù)據(jù)、信息、知識的區(qū)別
數(shù)據(jù)的作用,從數(shù)據(jù)中總結(jié)
獲取數(shù)據(jù)——分析數(shù)據(jù)——建立模型——預(yù)測未知
數(shù)據(jù)相關(guān)性
統(tǒng)計學(xué):數(shù)理統(tǒng)計《數(shù)學(xué)之美》
數(shù)據(jù)量、質(zhì)
數(shù)據(jù)模型:
模型選擇(簡單模型、復(fù)雜模型)使用多個簡單模型契合
模型參數(shù)多少——數(shù)據(jù)驅(qū)動:數(shù)據(jù)量大,樣本代表性
小結(jié):數(shù)據(jù)是下一次技術(shù)革命的核心動力
第二章:大數(shù)據(jù)和機(jī)器智能
變智能問題為數(shù)據(jù)問題
什么是機(jī)器智能
歷史上輔助計算的機(jī)械
第一臺計算機(jī),質(zhì)變
圖靈測試
人工智能1.0
達(dá)特茅斯會議(香農(nóng))研究領(lǐng)域方向,起始于那次會議之后
機(jī)器智能(廣義)解決問題,不一定采用和人一樣的方法 ?數(shù)據(jù)驅(qū)動
人工智能(傳統(tǒng))了解人類如何產(chǎn)生智能
統(tǒng)計+數(shù)據(jù)
IBM
康奈爾大學(xué)——弗雷德~賈里尼克語音識別 ?70%-90%
數(shù)據(jù)創(chuàng)造奇跡:量變到質(zhì)變
google翻譯 ?發(fā)明人:奧科博士
數(shù)據(jù)擴(kuò)展——交叉——結(jié)成網(wǎng)——關(guān)聯(lián)性增強——大數(shù)據(jù)
一些大數(shù)據(jù)專家對大數(shù)據(jù)的定義:
量大
多樣性
及時性:地圖
傳統(tǒng)問卷收集的缺陷:成本高、取樣、填寫未必真實意愿
機(jī)器好回答what when ?where which who,難回答why ?how
第三章 思維的革命
在無法確定因果關(guān)系時,數(shù)據(jù)提供了解決問題的新方法。數(shù)據(jù)所包含的信息幫助我們消除不確定性。相關(guān)性可以取代因果關(guān)系,幫助我們得到想知道的答案,這便是大數(shù)據(jù)思維的核心。
方法論
歐幾里得 幾何 ?基于邏輯推理的公理化系統(tǒng)
托勒密:地心說、球坐標(biāo)、赤道、經(jīng)緯線、黃道、弧度制“通過觀察獲得數(shù)學(xué)模型的雛形,然后利用數(shù)據(jù)細(xì)化模型” ? ?假設(shè)簡單元模型——構(gòu)建復(fù)雜模型——與歷史數(shù)據(jù)吻合 ? 缺陷:1、整體模型很復(fù)雜;2、確定性假設(shè)
笛卡爾:科學(xué)的方法論 ? 大膽假設(shè) 小心求證
牛頓:思想家 ?用簡單的數(shù)學(xué)公式破解自然之謎 《自然哲學(xué)之?dāng)?shù)學(xué)原理》 力學(xué)三定律、萬有引力、微積分 《光學(xué)》 他告訴人們:世界萬物是運動的,這些運動又是可以被認(rèn)識的。科學(xué)時代
任何正確的理論從形式上講都是簡單的 ?大道至簡
牛頓的方法論——機(jī)械思維:
1、世界變化的規(guī)律是確定的
2、規(guī)律可以被認(rèn)知,可以用公式語言表述
3、規(guī)律放之四海而皆準(zhǔn),指導(dǎo)實踐
工業(yè)革命,機(jī)械思維的結(jié)果
瓦特
斯蒂芬森 火車
查爾斯 轉(zhuǎn)輪打字機(jī)
軋棉機(jī)
蒸汽船
愛因斯坦:狹義相對論、廣義相對論
青霉素
信息時代:并非所有規(guī)律都能用簡單的原理描述
難以尋找因果關(guān)系
承認(rèn)不確定性尋找方法
世界不確定性:影響變量多;客觀世界本身(測量本身影響了結(jié)果)
——概率模型
概率論:香農(nóng)——將世界的不確定性和信息聯(lián)系起來,信息論
熵——新的世界觀,信息論、不確定性的代名詞
信息的度量等于不確定性的多少 ? 不了解——需要大量信息 ?已經(jīng)了解——少量信息
用不確定眼光看世界,再用信息消除不確定性
香農(nóng)第一定律:信息源設(shè)計編碼。只把最短的編碼費分配給最常見的漢字。盡可能節(jié)省貴的資源,盡量多地采用便宜的資源
香農(nóng)第二定律:信息傳播速率不可能超過信道的容量
最大熵原理:對未知不要做主管假設(shè)
大數(shù)據(jù)的本質(zhì):
智能問題根本上是消除不確定性的問題
交叉熵:數(shù)據(jù)源的一致性
從因果關(guān)系到強相關(guān)關(guān)系
煙草公司
數(shù)據(jù)公司google
點擊模型70%~80%權(quán)重
第四章 大數(shù)據(jù)與商業(yè)
大數(shù)據(jù)和機(jī)器智能 ? ?像水和電這樣的資源
大麻 用電數(shù)據(jù)
納稅
懷孕購物
亞馬遜 ?1/3 ?時效性 個性化
Netflix
google 相關(guān)搜索
數(shù)據(jù)流:

酒吧
prada芯片、試衣間
金風(fēng)發(fā)電機(jī):學(xué)習(xí)IBM ?運營&服務(wù)
完備性:
自動駕駛
從歷史經(jīng)驗看大數(shù)據(jù)作用:
技術(shù)帶動社會變革:蒸汽機(jī)、電氣、信息革命(服務(wù)重要性)
服務(wù)重要性:
GE冰箱
小米VS格力
大數(shù)據(jù)時代,家電廠商,產(chǎn)品跟蹤技術(shù),
第三方服務(wù)
第五章
大數(shù)據(jù)和智能革命的技術(shù)挑戰(zhàn):
技術(shù)拐點
數(shù)據(jù)暴增
數(shù)據(jù)的產(chǎn)生:電腦、傳感器(RFID芯片)、已存在的非數(shù)字化信息(用戶產(chǎn)生)、
信息的存儲:磁帶、硬磁盤、固態(tài)存儲器、
傳輸?shù)募夹g(shù):LTE WIFI 藍(lán)牙
信息的處理:處理器、服務(wù)器、并行計算(要求交換機(jī)、網(wǎng)絡(luò))、云計算
數(shù)據(jù)收集:看似簡單的難題
大數(shù)據(jù)時代,沒有預(yù)設(shè)目標(biāo),數(shù)據(jù)收集。
大數(shù)據(jù)以全集作為樣本集。google TV
google VOICE
數(shù)據(jù)存儲的壓力和數(shù)據(jù)表示的難題
數(shù)據(jù)增長速度搞過存儲設(shè)備發(fā)展速度
數(shù)據(jù)安全
怎樣存儲信息便于使用
并行計算和實時處理
并行:每個服務(wù)器小任務(wù)計算量未必均衡 最后一個結(jié)束的處理器
實時性:
GOOGLE Dremel 工具 ?數(shù)據(jù)列優(yōu)先 ?方便多維度數(shù)據(jù)
數(shù)據(jù)挖掘:
數(shù)據(jù)清理:信噪比
機(jī)器學(xué)習(xí):人工神經(jīng)網(wǎng)絡(luò)算法、最大熵模型、邏輯自回歸、
期望值最大化
計算復(fù)雜度高
2010 googel brain ?深度學(xué)習(xí)工具
幾十年前的人工神經(jīng)網(wǎng)絡(luò)算法,靠數(shù)據(jù)量補齊
最好的解決方式,專門做機(jī)器學(xué)習(xí)的公司
數(shù)據(jù)安全的技術(shù):
數(shù)據(jù)集中放、多維度數(shù)據(jù)
業(yè)務(wù)流程,防止異常操作
掙錢的必要條件
隱私
假貨、機(jī)票
保護(hù)隱私技術(shù):預(yù)處理、雙向監(jiān)視
第六章:未來智能化產(chǎn)業(yè)
農(nóng)業(yè):以色列缺水、滴管、
體育:勇士隊、
制造業(yè):富士康
機(jī)器人 產(chǎn)品很容易個性化定制、參數(shù)
特斯拉、從設(shè)計到銷售全過程的智能化水平
未來的醫(yī)療:醫(yī)療成本(新藥研發(fā)、醫(yī)務(wù)人員)
醫(yī)學(xué)影像分析
手術(shù)機(jī)器人
解決醫(yī)療資源短缺問題
李文森 ?抗癌難點:1、不存在萬靈藥基因、2、癌細(xì)胞復(fù)制也會出錯、
定制抗癌藥
衰老基因 ?Calico ?人類長壽公司
未來律師業(yè):案例分析,降低訴訟成本
未來的記者和編輯:
小結(jié):需求沒有變,新技術(shù)新產(chǎn)業(yè)取代舊產(chǎn)業(yè)滿足人類的需求
第七章:智能革命和未來社會:
在歷次技術(shù)革命中,人、企業(yè)、國家可以選擇的道路:加入浪潮成為2%,或者觀望徘徊被淘汰
智能化社會:
智能交通。
反恐
精細(xì)化社會:
追蹤每一次交易
比特幣 ?區(qū)塊鏈
從標(biāo)準(zhǔn)化到個性化的服務(wù):
就醫(yī)、
無隱私的社會:
隱私 ?保險公司
蘋果 FBI
機(jī)器人搶掉人的飯碗
工業(yè)革命:1800-2000 1000美元——20000美元 ?改革開放
新技術(shù)出現(xiàn)初期,受益者很少,只有那些掌握或使用新技術(shù)、從事新行業(yè)的人
工業(yè)革命三階段:第一階段發(fā)明家收益 民眾沒有 第二階段全體英國民眾受益,世界沒有 第三階段 世界范圍內(nèi)受益
從第二次工業(yè)革命到鍍金時代:美國、德國。大部分地區(qū)享受成果,是在二戰(zhàn)之后。
依然沒有消化完的信息革命:
1967-2012 最富有的5%財富增長,其他人的財富變化很小
中國特殊,工業(yè)革命和信息革命一起完成
解決問題只有靠時間:耗
智能革命的沖擊:
趨勢一旦形成,不可阻擋。對人類社會帶來沖擊。甚至超出前幾次技術(shù)革命。
首先:信息革命影響還沒消化完
其次,沒有空白市場開拓
最后,智能革命要替代的是人類最值得自豪的部分,大腦
農(nóng)民——工人——服務(wù)業(yè)
受益于蘋果或google的公司,遠(yuǎn)比20世紀(jì)50年代普通汽車廠裝配工人的數(shù)量少的多
淘汰的勞動力怎么辦?
社會公平只能反饋在機(jī)會公平上,不是結(jié)果的公平
不滿情緒的根源?
不能簡單歸結(jié)為貧富懸殊或宗教紛爭
根源在于:很多人被社會拋棄了
面對現(xiàn)實
爭當(dāng)2%
茶葉
冰箱購物
心理上和觀念上的距離,比技術(shù)上和商業(yè)上的要遠(yuǎn)得多
小結(jié):長遠(yuǎn)看會使社會更好,最初收益的都是發(fā)展使用它的人2%,拒絕他的人迷茫的一代