吳軍老師的書一如既往的深入淺出,讀起來愛不釋手。今天白天參加公司的Big Data Day?活動(dòng)意猶未盡,下班讀《智能時(shí)代》,真是把大數(shù)據(jù)的本質(zhì)寫得非常透徹。
一般的大數(shù)據(jù)相關(guān)的書籍一般著眼于大數(shù)據(jù)的特點(diǎn)和作用。吳軍老師從更高的視角看待大數(shù)據(jù),指出大數(shù)據(jù)是智能時(shí)代的鑰匙。在智能時(shí)代以前是機(jī)器時(shí)代,以工業(yè)革命為機(jī)器時(shí)代的頂峰。機(jī)器時(shí)代的方法論的核心思想是要想得到結(jié)果,必須知道原因,然后找到解決辦法。以發(fā)現(xiàn)青霉素的過程為例,最初發(fā)現(xiàn)某些霉菌有殺菌的功效,繼而研究出里面的有效成分是青霉素,之后研究出青霉素的化學(xué)成分,并人工制造出來。這種辦法有效,但是往往周期長。相對于現(xiàn)代醫(yī)學(xué),傳統(tǒng)中醫(yī)并不知道科學(xué)的原理,但是知道相關(guān)關(guān)系,即病癥對應(yīng)的藥方,同樣可以解決問題。
機(jī)器時(shí)代的思路是弄清楚事情的原理,并據(jù)此找到解決問題的辦法。但是這種思路的前提是食物是確定型的,而現(xiàn)實(shí)世界并不全是確定的。有很多的不確定的事情,一類是因?yàn)橛泻芏嗟碾[含的因素沒有考慮到,還有一類是食物本身就是不確定的,比如微觀世界的運(yùn)動(dòng)。
相對于這種不確定的問題,解決的核心思路是把智能問題轉(zhuǎn)化為數(shù)據(jù)問題。通過把不確定問題轉(zhuǎn)化為概率問題而找到解決方法。這種方法一般是用相對簡單的模型,輔助以大量的數(shù)據(jù)去優(yōu)化參數(shù),所謂的機(jī)器學(xué)習(xí)。這種方式的前提是需要滿足數(shù)據(jù)量足夠大,數(shù)據(jù)完備性足夠強(qiáng)。否則容易出現(xiàn)黑天鵝事件。從而達(dá)到量變引起質(zhì)變的效果。比如語音識別,機(jī)器翻譯都是采用了這樣的方式實(shí)現(xiàn)了成功。把這類問題看成是通信問題,即對給定的信源S,識別成T的概率最大者勝出。圍棋也是類似的,在當(dāng)前的狀態(tài),怎么走能夠?qū)崿F(xiàn)勝率最大。
這本書還沒有讀完,但是讀到我可以肯定這是一本值得收藏的好書,推薦給大家。