免費(fèi)數(shù)據(jù)分析+數(shù)據(jù)挖掘基礎(chǔ)統(tǒng)計(jì)教材

文章來(lái)源國(guó)外的analystics vidhya

原網(wǎng)址推薦書(shū)目,需要亞馬遜購(gòu)買(mǎi)。我已經(jīng)補(bǔ)全,望各位共同學(xué)習(xí)進(jìn)步!

前沿

谷歌數(shù)據(jù)科學(xué)家的篩選過(guò)程對(duì)統(tǒng)計(jì)學(xué)和數(shù)學(xué)背景強(qiáng)的候選人給予了更高的優(yōu)先考慮。不僅Google,世界上其他頂尖公司(亞馬遜,Airbnb,Uber等)也傾向于擁有強(qiáng)大的基礎(chǔ)知識(shí),而不僅僅是數(shù)據(jù)科學(xué)的專(zhuān)業(yè)知識(shí)。

如果您也希望日后為這些頂級(jí)公司工作,那么您必須開(kāi)發(fā)數(shù)據(jù)科學(xué)的數(shù)學(xué)理解。數(shù)據(jù)科學(xué)只是統(tǒng)計(jì)和數(shù)學(xué)的演進(jìn)版本,結(jié)合編程和業(yè)務(wù)邏輯。我遇到過(guò)許多數(shù)據(jù)科學(xué)家,他們很難在統(tǒng)計(jì)學(xué)上解釋預(yù)測(cè)模型。

不僅僅是獲得準(zhǔn)確性,理解和解釋每個(gè)度量,這個(gè)準(zhǔn)確度后面的計(jì)算是重要的。記住,每一個(gè)“變量”都有一個(gè)故事要講述。所以,如果沒(méi)有別的,盡量成為一個(gè)偉大的故事探險(xiǎn)家!

在這篇文章中,我編輯了一本必讀的統(tǒng)計(jì)和數(shù)學(xué)書(shū)籍。我明白數(shù)學(xué)沒(méi)有極限。因此,我只挑選那些可以幫助您更好地與數(shù)據(jù)科學(xué)聯(lián)系的書(shū)籍。

統(tǒng)計(jì)

統(tǒng)計(jì)學(xué)習(xí)簡(jiǎn)介

這是一個(gè)非常推薦的書(shū),用于實(shí)踐數(shù)據(jù)科學(xué)家。這本書(shū)的重點(diǎn)在于連接統(tǒng)計(jì)概念和機(jī)器學(xué)習(xí)。因此,您將了解所有流行的監(jiān)督和無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法。R用戶將獲得一定好處,因?yàn)樗惴ǚ矫嬉呀?jīng)使用R進(jìn)行了演示。除了理論,本書(shū)還著重于在現(xiàn)實(shí)生活中使用ML算法。

鏈接:http://www-bcf.usc.edu/~gareth/ISL/?

統(tǒng)計(jì)學(xué)習(xí)要素

這本書(shū)是先前書(shū)籍的先進(jìn)水平。這是由斯坦福大學(xué)教授Trevor Hastie和Rob Tibshirani撰寫(xiě)的。他們的第一本書(shū)“統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論”揭示了統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。本書(shū)將向您介紹諸如神經(jīng)網(wǎng)絡(luò),Bagging&Boosting,Kernel方法等更高級(jí)別的算法。該算法已在R程序中實(shí)現(xiàn)。

鏈接:http://statweb.stanford.edu/~tibs/ElemStatLearn/

認(rèn)識(shí)統(tǒng)計(jì)

這本書(shū)的作者是Alien B Downey。它基于Python中的實(shí)際統(tǒng)計(jì)分析。因此,在購(gòu)買(mǎi)此書(shū)之前,請(qǐng)確保您已經(jīng)掌握了Python的一些基本知識(shí)。它完全側(cè)重于通過(guò)流行案例研究了解統(tǒng)計(jì)的現(xiàn)實(shí)生活影響。既然,統(tǒng)計(jì)數(shù)學(xué)和數(shù)學(xué)關(guān)系密切,它也有專(zhuān)門(mén)的章節(jié),如貝葉斯估計(jì)。

鏈接:https://pan.baidu.com/s/1pKNDIOj

From Algorithms to Z Scores

你知道統(tǒng)計(jì)在編程中的關(guān)鍵作用嗎?這本書(shū)的作者是加州大學(xué)教授Norm Matloff。本書(shū)解釋了在R中使用概率概念和統(tǒng)計(jì)測(cè)量。再次,R用戶的良好做法來(lái)源。它教授處理概率模型的藝術(shù),并選擇最佳的模型進(jìn)行最終評(píng)估。這是一本非常推薦的書(shū)(特別是R用戶)。

鏈接:http://heather.cs.ucdavis.edu/probstatbook (進(jìn)去以后有書(shū)的手稿)。

使用R發(fā)現(xiàn)統(tǒng)計(jì)

這本書(shū)是由安迪·田野,杰里米·邁爾斯和佐伊菲爾德寫(xiě)的。我會(huì)強(qiáng)烈推薦這本書(shū)給數(shù)據(jù)科學(xué)的新手。從統(tǒng)計(jì)數(shù)據(jù)開(kāi)始,本書(shū)有一個(gè)很好的內(nèi)容,詳細(xì)介紹了其主題。與此同時(shí),統(tǒng)計(jì)概念與R一起進(jìn)行了說(shuō)明,這使得它更有用。它提供了一個(gè)一步一步的理解,同時(shí)支持有趣的練習(xí)示例。

鏈接:https://pan.baidu.com/s/1ge2puxl

數(shù)學(xué)

線性代數(shù)簡(jiǎn)介

這是推薦的線性代數(shù)書(shū)之一。這本書(shū)的作者是麻省理工學(xué)院教授Gilbert Strang。吉爾伯特提供知識(shí)的獨(dú)特方式將讓您在每一章之后向前推進(jìn)直覺(jué)和興奮。本書(shū)將幫助您為機(jī)器學(xué)習(xí)建立強(qiáng)大的數(shù)學(xué)基礎(chǔ)。它廣泛地征集了所有必要的章節(jié),如矢量,線性方程,決定因素,特征值,矩陣分解等.

鏈接:http://pan.baidu.com/share/link?shareid=2193713855&uk=1247605138

矩陣計(jì)算

矩陣和數(shù)據(jù)框架是機(jī)器學(xué)習(xí)的重要組成部分。這本書(shū)的作者是Gene H Golub和Charles F Van Loan。本書(shū)為學(xué)生提供了矩陣計(jì)算概念的良好開(kāi)端。作者介紹了高斯消除,矩陣因式分解,lancoz方法,誤差分析等重要課題。每一章都由直觀的實(shí)踐問(wèn)題支持。偽代碼在Matlab中可用。

鏈接 http://math.ecnu.edu.cn/~jypan/Teaching/books/2013%20Matrix%20Computations%204th.pdf

模式識(shí)別的概率理論

這是一個(gè)學(xué)習(xí)數(shù)學(xué)應(yīng)用的完整資源。這是機(jī)器學(xué)習(xí)中級(jí)和高級(jí)從業(yè)人員必讀的書(shū)。這本書(shū)由Luc Devroye,Laszlo Gyorfi和Gabor Lugosi編寫(xiě)。它涉及范圍廣泛的主題,從貝葉斯誤差,線性辨別到ε熵和神經(jīng)網(wǎng)絡(luò)。它提供了一個(gè)令人信服的解釋與復(fù)雜的定理與分段練習(xí)問(wèn)題。

鏈接:http://www.szit.bme.hu/~gyorfi/pbook.pdf

神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)介紹

如果你對(duì)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)有天生的興趣,這應(yīng)該是你開(kāi)始的地方。這本書(shū)的作者是Jeff Heaton。作者精心簡(jiǎn)化了神經(jīng)網(wǎng)絡(luò)的難點(diǎn)。本書(shū)向您介紹神經(jīng)網(wǎng)絡(luò)中基礎(chǔ)數(shù)學(xué)的基礎(chǔ)知識(shí)。它假定讀者具有代數(shù),微積分和編程的先前知識(shí)。它演示了可應(yīng)用于神經(jīng)網(wǎng)絡(luò)的各種數(shù)學(xué)工具。

鏈接:https://pan.baidu.com/s/1eS3n6lO

高級(jí)工程數(shù)學(xué)

這可能是機(jī)器學(xué)習(xí)用戶數(shù)學(xué)中最全面的書(shū)籍。這本書(shū)的作者是Erwin Kreyszig。事實(shí)上,這本書(shū)強(qiáng)烈推薦給大學(xué)生。如果你現(xiàn)在還沒(méi)有擅長(zhǎng)數(shù)學(xué),那么請(qǐng)務(wù)必遵循這本書(shū),你一定會(huì)看到你的數(shù)學(xué)理解有重大改進(jìn)。除了推導(dǎo)和實(shí)踐的例子,本書(shū)還有專(zhuān)門(mén)的演算,代數(shù),概率等等。絕對(duì)必須閱讀數(shù)據(jù)科學(xué)各級(jí)執(zhí)業(yè)者的書(shū)。

鏈接:http://www-elec.inaoep.mx/~jmram/Kreyzig-ECS-DIF1.pdf

概率與統(tǒng)計(jì)學(xué)手冊(cè)

這本食譜必須在你的數(shù)字書(shū)架上。這不完全是你會(huì)發(fā)現(xiàn)的教科書(shū),而是數(shù)學(xué)方程式的快速數(shù)字指南。這本書(shū)的作者是Matthias Vallentin。完成數(shù)學(xué)必修之后,本書(shū)將幫助您快速連接各種定理和算法及其公式。很難立即推導(dǎo)出方程,本書(shū)將幫助您快速導(dǎo)航到您想要的問(wèn)題并解決。

鏈接:http://pages.cs.wisc.edu/~tdw/files/cookbook-en.pdf

視頻分享:

MIT線性代數(shù)課程:https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/video-lectures/

MIT多變量微積分課程:https://ocw.mit.edu/courses/mathematics/18-02-multivariable-calculus-fall-2007/video-lectures/lecture-1-dot-product/

斯坦福統(tǒng)計(jì)課程:https://lagunita.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about

可汗大學(xué)數(shù)學(xué)課程:https://www.khanacademy.org/math

統(tǒng)計(jì)的海報(bào):http://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf

大家有什么好的這方面的國(guó)外材料可以相互補(bǔ)充,相互學(xué)習(xí),共同進(jìn)步,為了你們的數(shù)學(xué)科學(xué)家的夢(mèng)想而努力。

資料來(lái)源:analystics vidhya

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容