一、相關信息
1.我的書評
這本書是2016年對我影響最大的書,共讀了兩遍。
讀這本書之前,對大數(shù)據(jù)和機器智能完全不知曉,讀完后則有一種深刻的危機感。2016年是機器智能時代到來的開端,很幸運了解了一些基本,雖然基于過去的知識積累和專業(yè),我不是計算機科學家,但卻可以借此機會建立大數(shù)據(jù)思維模式,并利用機器智能發(fā)展的成果,與自己的專業(yè)聯(lián)系,或者選擇投入機器智能的浪潮中,重新定位和選擇自己的事業(yè)。
收獲主要包含兩方面內(nèi)容:
第一作者用深入淺出的語言幫我理清了數(shù)據(jù)、信息、大數(shù)據(jù)、機器學習等最前沿的科技成果和應用,消除了我對大數(shù)據(jù)和機器智能的陌生感;
第二通過回顧歷次技術革命帶來的社會變革和影響,我對此次智能革命將會帶來的挑戰(zhàn)有了更深一步的認識,幫助我能看清自己的位置,做好準備。
2.書籍信息

3.作者簡介
吳軍,博士,于2002年加入谷歌公司
2010年加盟騰訊公司,出任負責搜索和搜索廣告的副總裁。
2012-2014年回到谷歌,領導計算機自動問答項目。
2014年,他在硅谷創(chuàng)辦了豐元資本風險投資公司。他在美國兩家風險投資基金(中國世紀基金和ZPark風險基金)分別擔任董事和顧問,也是約翰·霍普金斯大學工商學院董事會董事,以及該校國際事務委員會的顧問。
二、脈絡框架
本書包括前言和七章正文。
前言
詳細介紹了AlphaGo戰(zhàn)勝李世石的過程、原因以及代表的意義。除了在圍棋方面的應用外,機器智能還能完成醫(yī)療診斷、自動回答問題、駕駛汽車等任務。機器智能時代在2016年被宣布的來,我們要抓住智能時代的機遇而不回避它,成為有創(chuàng)意的人。
第一章??人類建造文明的基石
從最基本的數(shù)據(jù)概念、含義、作用、意義來闡述,以及局限性、如何破解局限性。
(1)首先引入數(shù)據(jù)和信息的概念,并對二者加以區(qū)分。
數(shù)據(jù)是人造的,它的范疇隨著社會發(fā)展越來越大,數(shù)據(jù)有三類,有用、無意義數(shù)據(jù)和偽造數(shù)據(jù)。信息分兩種,一是人造的,二是客觀存在的。信息比數(shù)據(jù)更加抽象,信息可以用數(shù)據(jù)來描述。
(2)?數(shù)據(jù)的作用
數(shù)據(jù)-信息-知識-改變和進步
自古以來人類都是通過處理數(shù)據(jù)中獲取信息,信息抽象出規(guī)律得到知識,由知識來改變和獲得進步。因此,處理數(shù)據(jù)的能力,從數(shù)據(jù)中得到信息的能力就是大數(shù)據(jù)應用的基礎。
(3)數(shù)據(jù)應用的模式
獲取數(shù)據(jù)-分析數(shù)據(jù)-建模-預測
大數(shù)據(jù)之前,人類應用數(shù)據(jù)主要通過這樣一種思維模式,于是決定是否能成功取決于數(shù)據(jù)是否精確,還有運氣的成分——能否碰巧找到一個可以彌合全部觀測數(shù)據(jù)的模型。
二者都很難
(4)大數(shù)據(jù)思維模式
通過數(shù)據(jù)之間的相關性我們不止可以獲取信息,還可以得到意料之外的驚喜。如預測事件發(fā)展的特點和趨勢。
我們可以利用數(shù)據(jù)之間的相關性,在無法直接獲得信息的時候,通過數(shù)學模型間接獲取數(shù)據(jù)。
而各種數(shù)學模型的建立離不開概率論和統(tǒng)計學。概率論和統(tǒng)計學要得到準確的結果需要樣本設計非常準確,獲取有代表性的數(shù)據(jù),此外還要找到準確的數(shù)學模型。這二者都非常困難。
于是在大數(shù)據(jù)思維下,我們改變了直接尋找的思維模式,而是采用數(shù)據(jù)驅動方法——用若干簡單模型替代一個復雜模型,此方法比傳統(tǒng)的通過理論突破改進數(shù)學方法更新迭代速度要快很多,因為前者受益于數(shù)據(jù)量和機器計算能力的提升。
總結,利用大數(shù)據(jù),采用數(shù)據(jù)驅動方法(解決IT行業(yè)的很多問題)和機器學習的大數(shù)據(jù)思維,獲得解決問題的能力,是智能時代我們每個人都應該掌握的新思維。
第二章???大數(shù)據(jù)和機器智能
這一章主要講了大數(shù)據(jù)和機器智能的發(fā)展淵源:從計算機的誕生、發(fā)展,提出機器智能的概念和發(fā)展情況,并總結了大數(shù)據(jù)的特點——大量,多維,及時性、完備性,其中最重要的特征是多維度。
人工智能1.0(1956模仿人類語言和思維)
人工智能2.0,(1970用統(tǒng)計+數(shù)據(jù)的方法,及數(shù)據(jù)統(tǒng)計和超級計算,找到數(shù)學模型后用統(tǒng)計方法訓練處模型參數(shù),數(shù)據(jù)驅動)
人工智能3.0(2000年后,奧科博士,老方法——數(shù)據(jù)驅動方法,大數(shù)據(jù)——用幾千倍甚至上萬倍數(shù)據(jù),量變引起質變。大背景——數(shù)據(jù)之間關聯(lián)性極大增強,各個維度數(shù)據(jù)從點和線連接成網(wǎng))
第三章 思維的革命
前兩章講了數(shù)據(jù)和信息的基本知識,機器智能的發(fā)展,這一章從方法論和思維方式(頭腦)方面闡述從古希臘時代到現(xiàn)代,我們?nèi)祟愓J識世界方法的演變和發(fā)展過程——思維方式和方法論的發(fā)展,尤其是牛頓開啟的機械思維向大數(shù)據(jù)思維的發(fā)展,提出了大數(shù)據(jù)思維誕生的必要性,面對更復雜的問題應用強相關性取代因果關系來解決不確定性。當然,大數(shù)據(jù)思維是機械思維的補充而不是對立。
第四章 大數(shù)據(jù)與商業(yè)
這一章主要講的是大數(shù)據(jù)在商業(yè)等領域現(xiàn)在的應用和影響,通過總結歷史規(guī)律提出對未來的展望。
(1)首先從微觀角度入手,通過舉例說明利用大數(shù)據(jù)發(fā)現(xiàn)的相關性,政府部門可以更有效的開展政府監(jiān)測工作,商業(yè)上通過應用大數(shù)據(jù)為用戶推薦更加有相關性、時效性和個性化的商品,提升競爭力,實現(xiàn)巨大的商業(yè)利好;
(2)緊接著介紹了大數(shù)據(jù)商業(yè)的技術基礎——大數(shù)據(jù)收集、處理和建模的流程,數(shù)據(jù)由細節(jié)到整體來獲得規(guī)律,再從整體到細節(jié)用規(guī)律指導每一個商業(yè)行為;
(3)從宏觀的歷史經(jīng)驗出發(fā),通過舉例和細節(jié)描述,分析了第一次工業(yè)革命、第二次工業(yè)革命、信息革命發(fā)展以來的一個共性,就是“新技術+原有產(chǎn)業(yè)=新產(chǎn)業(yè)”。新技術對經(jīng)濟、生活以及各行各業(yè)的影響和沖擊;同時技術還在改變商業(yè)模式,進而導致社會生活方式的變化。最后總結經(jīng)驗給出結論,未來人們對服務的需求越來越強烈,生產(chǎn)和產(chǎn)品的優(yōu)勢反而會走向終結。
(4)未來商家將在數(shù)據(jù)層面和智能化方面展開競爭。但是大部分企業(yè)沒必要都從事新技術本身的開發(fā)和產(chǎn)品研制,大數(shù)據(jù)和機器智能的工具將由專門公司提供給全社會使用,當然,這些為全社會提供技術的公司將會站在浪潮之巔。
第五章 大數(shù)據(jù)和智能革命的技術挑戰(zhàn)
這一章主要描述了大數(shù)據(jù)出現(xiàn)的技術基礎和面臨的技術挑戰(zhàn)。
大數(shù)據(jù)的出現(xiàn)是其他相關技術成熟后帶來的必然結果。大數(shù)據(jù)涉及的幾個技術基礎包括數(shù)據(jù)的產(chǎn)生、存儲、傳輸、收集、處理,都是科技進步和發(fā)展帶來的副產(chǎn)品。
然而,大數(shù)據(jù)也給數(shù)據(jù)存儲和處理帶來了很大的挑戰(zhàn),主要原因是數(shù)據(jù)增長的速度超過了存儲的效率,根本的解決方法則需要重新設計數(shù)據(jù)存儲方式、開發(fā)新的存儲工具、專門公司研究算法等相關技術的進步。
此外大數(shù)據(jù)發(fā)展給普通大眾帶來的沖擊和負面影響主要表現(xiàn)在隱私和個人信息的泄露,一方面會對個人利益造成損害另一方面會阻礙大數(shù)據(jù)的發(fā)展。當然,目前有一些防止大數(shù)據(jù)泄露的方法。對于數(shù)據(jù)安全的考慮,個人要重視防止泄漏,社會也要開發(fā)新技術以更有效保護隱私。
第六章 未來智能化產(chǎn)業(yè)
本章具體描述了大數(shù)據(jù)和機器智能對各個產(chǎn)業(yè)造成的轉變和影響(導致社會產(chǎn)業(yè)升級和變遷),例如農(nóng)業(yè)、制造業(yè)、體育、醫(yī)療、律師,甚至編輯作者等。
這些改變的共性是精細化和智能化。
根據(jù)“已有產(chǎn)業(yè)+新技術=新產(chǎn)業(yè)”,這些智能產(chǎn)業(yè)與原有產(chǎn)業(yè)思維方式已完全不同,這些改變必將淘汰大部分普通工人,甚至是一部分腦力勞動者。那么,被機器取代的人怎么辦?但是,人類需求是沒有變的。固守舊產(chǎn)業(yè)是沒有出路的。
第七章?智能革命和未來社會
大數(shù)據(jù)和機器智能引導的智能時代既是最好的時代,也是最壞的時代。
新技術將給我們的生活帶來便利,讓我們的社會更加精細化、智能化,人性化的,讓社會資源利用率極大提高。然而,它也會給我們的社會帶來沖擊,例如隱私泄露、超級權利控制、失業(yè)等風險。只有投入技術浪潮,成為2%的控制這個世界的人,我們才能不會被淘汰。
這一章分4個部分,第一是智能時代給我們的社會帶來的好處,作者從宏觀層面(事故預警、智能交通、反恐闡述了社會智能化,從微觀層面(區(qū)域鏈)闡述了未來社會精細化;
第二個部分闡述智能時代可能帶來的社會沖擊,如無隱私、超級權利控制、失業(yè)、直接影響我們的健康和醫(yī)療等;
第三部分主要分析機器人對我們工作的影響。作者通過列舉之前三次技術革命對社會產(chǎn)生的沖擊(社會財富聚集在少數(shù)人手中,幸福指數(shù)沒有提升,大學畢業(yè)生就業(yè)更難,很多產(chǎn)業(yè)消失,一部分腦力勞動者也要被取代,社會動蕩),提出消除負面影響只能時間;
第四部分,作者在描述完技術革命可能對我們的社會產(chǎn)生強烈的沖擊后,提出解決之道——踏上浪潮,成為2%的人,希望大家接受一個新的思維方式,利用好大數(shù)據(jù)和機器智能。
三、謀篇布局
前言主要從2016年發(fā)生的“黑天鵝”事件之一——AlphaGo戰(zhàn)勝李世石談起,吸引讀者注意。
前三章主要是基本概念和知識。
第四章和第六章都是講大數(shù)據(jù)的應用,但側重點和目標不同。第三章一方面是詳細展開了在商業(yè)方面的應用,另一方面還是在闡述大數(shù)據(jù)和機器智能的特點、原理和作用。但是單講理論就很枯燥,所以放在具體的實例中會顯得妙趣橫生。
因為主要目的還是介紹理論,所以第四章就又回到了主線,技術和理論的安全性。
第六章才是真正的應用分析。由于作者已經(jīng)在第三章分析了商業(yè),這一章主要從其他幾個產(chǎn)業(yè)來闡述,這些行業(yè)也是逐級遞進的,從體力勞動到腦力勞動,體現(xiàn)使用人類智慧的不同程度逐級遞進。
我們會發(fā)現(xiàn),機器智能不止會替代體力勞動,還講替代越來越高級的腦力勞動,這不禁讓人覺得震撼和焦慮,那么,我們應該怎么辦,應該采取什么措施來應對智能時代的挑戰(zhàn)?那就是第七章的內(nèi)容了。
四、書中亮點和心得(心得用【】標注)
1.雖然機器學習和博弈樹搜索算法都是幾十年前大家知道的,但Google所做的工作是讓這些算法能夠在上萬條甚至上百萬臺服務器上并行運行,這就使得計算機解決職能問題的能力有了本質的提高。
AlphaGo的兩個關鍵技術:第一個關鍵技術是把棋盤上當前狀態(tài)變成一個獲勝概率的數(shù)學模型,第二個關鍵技術是啟發(fā)式搜索算法——蒙特卡羅樹搜索算法。
【相關性——萬維鋼老師有篇關于相關性的文章,提到科學家認為相關性在0.8以上才算強相關性,0.4以上算若相關性。很多心理學研究只是在0.3左右,其實相關性不大。在我們掌握的數(shù)據(jù)量不足,數(shù)學模型找的不準確的情況下很容易把沒有直接相關性的東西強加相關性,找錯解決問題的方法,以為是強相關能解決,其實不然。大數(shù)據(jù)應該會幫我們避免此類錯誤,以后會找到最直接相關的參數(shù),然后針對問題對癥下藥,獲得事半功倍的效果。
思維方式——無論是獲取數(shù)據(jù)-分析數(shù)據(jù)-建模-預測還是機器學習、數(shù)據(jù)驅動,都是思維的套路,這些東西是高度凝練和內(nèi)化的,需要形成冷意識(萬維剛)和內(nèi)力,不然每次遇到問題,從不知所措到找到方法已然又花費不少時間。從實踐中找到自己的套路是2017年需要加把勁做的事情。】
【大數(shù)據(jù)思維和方法應該會逐步代替未來傳統(tǒng)統(tǒng)計方法,如問卷調查。在未來問卷調查過程中,換一種思路,大數(shù)據(jù)思維思考問題??词欠衲軌蛲ㄟ^直接調用數(shù)據(jù)來進行分析。變智能問題為數(shù)據(jù)問題,是未來要注重培養(yǎng)自己的一個方面。遇到問題的時候,換一個思路,換一種角度來考慮,換一種方法,可以另辟蹊徑的解決問題?!?/p>
2.每一次技術革命,掌握了新的方法論的人才會獲得成功。例如瓦特,她的蒸汽機的通用性就好很多,同一種蒸汽機可以賣到不同工廠。他的成功不僅是技術的勝利,更重要的是她掌握了新的方法論——機械思維。
【不一定要完全從事大數(shù)據(jù)開發(fā),但要掌握新的方法論,嘗試建立大數(shù)據(jù)思維。其實,不論任何時代,能夠深入地進行有質量的思考是最重要的能力,也是永遠不會被淘汰的能力?!?/p>
3.吉爾德定律:要盡可能多地采用便宜的資源,盡可能節(jié)省貴的資源。
【對于個人來說,注意力和時間是她最重要的最貴的資源,要盡可能節(jié)省,如何節(jié)?。恳缅X取代時間,時間取代注意力?吉爾德定律,用便宜資源節(jié)省貴的資源,正如李笑來所說的,注意力是最寶貴的,要學會用錢買時間,用時間買注意力?!?/p>
4.信息的傳播速率不可能超過信道的容量。要不斷擴展帶寬。
【人也是如此,成長的速度不可能超過認知的帶寬,所以要不斷擴展認知的帶寬,用20%的時間去學習各個領域80%的知識,哪里水草豐美就轉向哪里,做智識的游牧民族。當然,至于專業(yè)和通識教育如何平衡,也是值得研究,總的來說也是二八原則吧?!?/p>
5.智能技術的拐點可能就發(fā)生在從10年前開始到接下來一二十年這一段時間。
【這一代孩子的成長與教育要與數(shù)據(jù)挖掘和大數(shù)據(jù)科技緊密相連】
【機器智能比人厲害的多的地方在于它對經(jīng)驗的學習能力,例如它在短期內(nèi)會比我們一輩子積累的行業(yè)經(jīng)驗還要多,而且數(shù)量級完全不在一個頻道。那么由此可知,未來因經(jīng)驗處于核心競爭力的行業(yè)或人都將被取代。然而人的基本需求是不變的,我們需要改變的方向是,換一種方式和思路去滿足人的需求,而這種思路和方式必定要依靠大數(shù)據(jù)。如果倒推的話,那么未來什么樣的人不會被淘汰,就是那些思維和思想能夠與時俱進,善于應用、使用工具,并且有創(chuàng)造力的人吧?!?/p>
6.在大多數(shù)產(chǎn)品和服務都被標準化的時代,大家很難找到最適合自己的,只能默認最權威的或者最貴的就是最好的。到了智能時代,極其的智能水平足以為我們提供各種個性化的服務,同時能夠做到成本和過去的標準化服務相當。
【吳軍老師問過,如果每個家里都有機器人了,你希望它能為你做什么?我想答案就在這里,我們所希望的和機器人能替我們做的,是基于我們條件的個性化產(chǎn)品和服務的提供。例如我們要制定旅行計劃,我只要輸入我的需求,它就能列出最適合我們的,性價比高的航班、酒店、車輛等信息安排,我們就可以省下比較的時間?!?/p>
7.我們也要在觀念上接受這樣一個事實,即越來越多的事情人類將做不過機器。我們今后的決定,應該根據(jù)這個前提來做,只有面對現(xiàn)實,才能最終建設一個讓所有積極向上的人都具有成就感和幸福感的社會。
【在為自己或者孩子做職業(yè)和事業(yè)的規(guī)劃時,首先要考慮一下,長遠看,這個事兒會不會被機器替代?】