AI大牛壓箱底的14本2018年進階書(附PDF鏈接)

作者 | 王天一出處 | 極客時間專欄《人工智能基礎(chǔ)課》編輯 | Emily 作者簡介

image

王天一,北京郵電大學(xué)工學(xué)博士,貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院副教授,貴州省3D數(shù)字醫(yī)療學(xué)會會員。在讀期間主要研究方向為連續(xù)變量量子通信理論與系統(tǒng),主持并參與多項國家級/省部級科研項目,以第一作者身份發(fā)表SCI論文5篇。

目前主要研究方向為大數(shù)據(jù)與人工智能,研究內(nèi)容包括以物聯(lián)網(wǎng)為基礎(chǔ)的大數(shù)據(jù)應(yīng)用及神經(jīng)網(wǎng)絡(luò)與機器學(xué)習(xí)。除技術(shù)領(lǐng)域外,對人工智能的發(fā)展方向與未來趨勢亦有深入思考,著有《人工智能革命》一書。

機器學(xué)習(xí)篇

在機器學(xué)習(xí)上,首先要推薦的是兩部國內(nèi)作者的著作:李航博士所著的《統(tǒng)計學(xué)習(xí)方法》和周志華教授的《機器學(xué)習(xí)》。

《統(tǒng)計學(xué)習(xí)方法》采用“總-分-總”的結(jié)構(gòu),在梳理了統(tǒng)計學(xué)習(xí)的基本概念后,系統(tǒng)而全面地介紹了統(tǒng)計學(xué)習(xí)中的10種主要方法,最后對這些算法做了總結(jié)與比較。這本書以數(shù)學(xué)公式為主,介紹每種方法時都給出了詳盡的數(shù)學(xué)推導(dǎo),幾乎不含任何廢話,因而對讀者的數(shù)學(xué)背景也提出了較高的要求。

image

相比之下,《機器學(xué)習(xí)》覆蓋的范圍更廣,具有更強的導(dǎo)論性質(zhì),有助于了解機器學(xué)習(xí)的全景。書中涵蓋了機器學(xué)習(xí)中幾乎所有算法類別的基本思想、適用范圍、優(yōu)缺點與主要實現(xiàn)方式,并穿插了大量通俗易懂的實例。

image

如果說《統(tǒng)計學(xué)習(xí)方法》勝在深度,那么《機器學(xué)習(xí)》就勝在廣度。在具備廣度的前提下,可以根據(jù)《機器學(xué)習(xí)》中提供的豐富參考文獻繼續(xù)深挖。

讀完以上兩本書,就可以閱讀一些經(jīng)典著作了。經(jīng)典著作首推Tom Mitchell所著的Machine Learning,中譯本名為《機器學(xué)習(xí)》。本書成書于1997年,雖然難以覆蓋機器學(xué)習(xí)中的最新進展,但對于基本理論和核心算法的論述依然鞭辟入里,畢竟經(jīng)典理論經(jīng)得起時間的考驗。這本書的側(cè)重點也在于廣度,并不涉及大量復(fù)雜的數(shù)學(xué)推導(dǎo),是比較理想的入門書籍。作者曾在自己的主頁上說本書要出新版,并補充了一些章節(jié)的內(nèi)容,也許近兩年可以期待新版本的出現(xiàn)。

image
image

另一本經(jīng)典著作是Trevor Hastie等人所著的Elements of Statistical Learning,于2016年出版了第二版。這本書沒有中譯,只有影印本。高手的書都不會用大量復(fù)雜的數(shù)學(xué)公式來嚇唬人(專于算法推導(dǎo)的書除外),這一本也不例外。它強調(diào)的是各種學(xué)習(xí)方法的內(nèi)涵和外延,相比于具體的推演,通過方法的來龍去脈來理解其應(yīng)用場景和發(fā)展方向恐怕更加重要。

image

壓軸登場的非Christopher Bishop所著的Pattern Recognition and Machine Learning莫屬了。本書出版于2007年,沒有中譯本,也許原因在于將這樣一本煌煌巨著翻譯出來不知要花費多少挑燈夜戰(zhàn)的夜晚。這本書的特點在于將機器學(xué)習(xí)看成一個整體,不管于基于頻率的方法還是貝葉斯方法,不管是回歸模型還是分類模型,都只是一個問題的不同側(cè)面。作者能夠開啟上帝視角,將機器學(xué)習(xí)的林林總總都納入一張巨網(wǎng)之中,遺憾的是,大多數(shù)讀者跟不上他高屋建瓴的思路(也包括我自己)。

image

最后推薦的是David J C MacKay所著的Information Theory, Inference and Learning Algorithms,成書于2003年,中譯本名為《信息論,推理與學(xué)習(xí)算法》。本書作者是一位全才型的科學(xué)家,這本書也并非機器學(xué)習(xí)的專著,而是將多個相關(guān)學(xué)科熔于一爐,內(nèi)容涉獵相當(dāng)廣泛。相比于前面板著臉的教科書,閱讀本書的感覺就像在和作者聊天,他會在談笑間拋出各種各樣的問題讓你思考。廣泛的主題使本書的閱讀體驗并不輕松,但可以作為擴展視野的一個調(diào)節(jié)。

image
image

數(shù)學(xué)篇

1、線性代數(shù)

推薦兩本國外的教材。其一是Gilbert Strang所著的Introduction to Linear Algebra,英文版在2016年出到第五版,暫無中譯本。這本通過直觀形象的概念性解釋闡述抽象的基本概念,同時輔以大量線性代數(shù)在各領(lǐng)域內(nèi)的實際應(yīng)用,對學(xué)習(xí)者非常友好。作者在麻省理工學(xué)院的OCW上開設(shè)了相應(yīng)的視頻課程,還配有習(xí)題解答、模擬試題等一系列電子資源。

image

其二是David C Lay所著的Linear Algebra and its Applications,英文版在2015年同樣出到第五版,中譯本名為《線性代數(shù)及其應(yīng)用》,對應(yīng)原書第四版。這本書通過向量和線性方程組這些基本概念深入淺出地介紹線代中的基本概念,著重公式背后的代數(shù)意義和幾何意義,同樣配有大量應(yīng)用實例,對理解基本概念幫助很大。

image
image

2、概率論

基礎(chǔ)讀物可以選擇Sheldon M Ross所著的A First Course in Probability,英文版在2013年出到第九版(18年馬上要出第十版),中譯本名為《概率論基礎(chǔ)教程》,對應(yīng)原書第九版,也有英文影印本。這本書拋開測度,從中心極限定理的角度討論概率問題,對概念的解釋更加通俗,書中還包含海量緊密聯(lián)系生活的應(yīng)用實例與例題習(xí)題。

image
image

另一本艱深的讀物是Edwin Thompson Jaynes所著的Probability Theory: The Logic of Science,本書暫無中譯本,影印本名為《概率論沉思錄》也已絕版。這本書是作者的遺著,花費半個世紀(jì)的時間完成,從名字就可以看出是一部神書。作者從邏輯的角度探討了基于頻率的概率,貝葉斯概率和統(tǒng)計推斷,將概率論這門偏經(jīng)驗的學(xué)科納入數(shù)理邏輯的框架之下。如果讀這本書,千萬要做好燒腦的準(zhǔn)備。

image

3、數(shù)理統(tǒng)計

基礎(chǔ)讀物可以選擇陳希孺院士所著的《數(shù)理統(tǒng)計學(xué)教程》。關(guān)于統(tǒng)計學(xué)是不是科學(xué)的問題依然莫衷一是,但它在機器學(xué)習(xí)中的重要作用毋庸置疑。陳老的書重在論述統(tǒng)計的概念和思想,力圖傳授利用統(tǒng)計觀點去觀察和分析事物的能力,這是非常難能可貴的。

image

進階閱讀可以選擇Roger Casella所著的Statistical Inference,由于作者已于2012年辭世,2001年的第二版便成為絕唱。中譯本名為《統(tǒng)計推斷》,亦有影印本。本書包含部分概率論的內(nèi)容,循循善誘地介紹了統(tǒng)計推斷、參數(shù)估計、方差回歸等統(tǒng)計學(xué)中的基本問題。

image

4、最優(yōu)化理論

可以參考Stephen Boyd所著的Convex Optimization,中譯本名為《凸優(yōu)化》。這本書雖然塊頭嚇人,但可讀性并不差,主要針對實際應(yīng)用而非理論證明,很多機器學(xué)習(xí)中廣泛使用的方法都能在這里找到源頭。

image
image

5、信息論

推薦Thomas Cover和Jay A Thomas合著的Elements of Information Theory,2006年出到第二版,中譯本為《信息論基礎(chǔ)》。這本書兼顧廣度和深度,雖然不是大部頭卻干貨滿滿,講清了信息論中各個基本概念的物理內(nèi)涵,但要順暢閱讀需要一定的數(shù)學(xué)基礎(chǔ)。另外,本書偏重于信息論在通信中的應(yīng)用。

image
image

PDF鏈接:

機器學(xué)習(xí)篇:

  1. Machine Learning

http://www.cs.ubbcluj.ro/~gabis/ml/ml-books/McGrawHill%20-%20Machine%20Learning%20-Tom%20Mitchell.pdf

  1. Elements of Statistical Learning

https://web.stanford.edu/~hastie/Papers/ESLII.pdf

  1. Pattern Recognition and Machine Learning

http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

  1. Information Theory, Inference and Learning Algorithms

http://www.inference.org.uk/itprnn/book.pdf

數(shù)學(xué)篇:

  1. Introduction to Linear Algebra

https://math.mit.edu/~gs/linearalgebra/linearalgebra5_Preface.pdf

  1. Linear Algebra and its Applications

http://www.zuj.edu.jo/download/linear-algebra-and-its-applications-david-c-lay-pdf/

  1. A First Course in Probability(8th edition)

http://julio.staff.ipb.ac.id/files/2015/02/Ross_8th_ed_English.pdf

  1. Probability Theory: The Logic of Science

http://www.med.mcgill.ca/epidemiology/hanley/bios601/GaussianModel/JaynesProbabilityTheory.pdf

  1. Statistical Inference

https://fsalamri.files.wordpress.com/2015/02/casella_berger_statistical_inference1.pdf

  1. Convex Optimization

https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf

  1. Elements of Information Theory

http://www.cs-114.org/wp-content/uploads/2015/01/Elements_of_Information_Theory_Elements.pdf

這么干的內(nèi)容,出自極客時間專欄《人工智能基礎(chǔ)課》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容