總結(jié)一下我讀過的機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘/數(shù)據(jù)分析方面的書,有的適合入門,有的適合進(jìn)階,沒有按照層次排列,先總結(jié)一下,等總結(jié)的差不多了再根據(jù)入門--->進(jìn)階分塊寫。下面列的書基本上我寫的都是讀完過的,不然不敢寫,怕誤人子弟? = =,持續(xù)更新ing~
數(shù)據(jù)分析
實(shí)習(xí)的時(shí)候只會(huì)Matlab,公司小,沒錢買正版,所以領(lǐng)導(dǎo)要我兩星期把R學(xué)會(huì),當(dāng)時(shí)看的有這些書
評(píng)價(jià):很好的入門書,從安裝、入門、基本的統(tǒng)計(jì)分析,作圖命令,以及常見的分類、回歸、降維等方法都有寫
推薦指數(shù):五顆星
2.數(shù)據(jù)分析-R語(yǔ)言實(shí)戰(zhàn)
評(píng)價(jià):專門用R語(yǔ)言寫的數(shù)據(jù)分析的書,掌握R的基礎(chǔ)后可以看看,側(cè)重?cái)?shù)據(jù)分析的基本方法,介紹了一些常見的分析方法,比較基礎(chǔ)。
推薦指數(shù):四星半
評(píng)價(jià):外國(guó)人寫的書,但是翻譯真的太爛了。而且內(nèi)容其實(shí)沒什么干貨啊,關(guān)于分位數(shù)、展布等這些概念直接找本統(tǒng)計(jì)學(xué)的教材看看吧。
推薦指數(shù):三顆星
評(píng)價(jià):在圖書館意外發(fā)現(xiàn)了這本好書,對(duì)于R中的數(shù)據(jù)結(jié)構(gòu)和性能提升講的不錯(cuò)。
推薦指數(shù):四顆星
5.利用Python進(jìn)行數(shù)據(jù)分析
評(píng)價(jià):這本書是pandas模塊的作者寫的書,一句話總結(jié):Pandas使用手冊(cè)。如果用Python做數(shù)據(jù)分析,基本上Pandas是必不可少的包。
推薦指數(shù):四顆星
數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)
4.大數(shù)據(jù)時(shí)代的R語(yǔ)言 數(shù)據(jù)挖掘:R語(yǔ)言實(shí)戰(zhàn)
評(píng)價(jià):和上面的“數(shù)據(jù)分析-R語(yǔ)言實(shí)戰(zhàn)”好像是一個(gè)系列的,基本上常見的數(shù)據(jù)挖掘方法都介紹了,有理論有實(shí)例,適合入門。
推薦指數(shù):四顆星
評(píng)價(jià):入門書,理論多,好像是很多研究生學(xué)數(shù)據(jù)挖掘的教材,很詳細(xì),孟小峰老師的翻譯還是不錯(cuò)的,相對(duì)很多翻譯很爛的還是可以的。
推薦指數(shù):四顆星
6.機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
評(píng)價(jià):Python寫的,沒有Python基礎(chǔ)的話還是先學(xué)學(xué)Python吧,基本上都是實(shí)例為主,代碼很詳細(xì),講的也很通俗易懂,github上可以下載代碼
推薦指數(shù):五顆星
7.集體智慧編程
評(píng)價(jià):和機(jī)器學(xué)習(xí)實(shí)戰(zhàn)一起看的,也基本上都是實(shí)例,翻譯的也可以,比“探索性數(shù)據(jù)分析”的翻譯好多了??!有代碼,可以實(shí)操,基本上真正掌握了可以應(yīng)對(duì)一般的數(shù)據(jù)挖掘的需求了。
推薦指數(shù):五顆星
評(píng)價(jià):李航博士寫的機(jī)器學(xué)習(xí)常見算法的數(shù)學(xué)推導(dǎo),講的算是比較詳細(xì)了,對(duì)于有數(shù)學(xué)基礎(chǔ)的還是很好理解的,如果沒有數(shù)學(xué)基礎(chǔ),可以先看看數(shù)分高代凸優(yōu)化之類的書再看。適合有一定基礎(chǔ)的學(xué)習(xí)。
推薦指數(shù):五顆星
評(píng)價(jià):看名字就知道是講推薦系統(tǒng)的,對(duì)于不知道推薦系統(tǒng)是啥的可以好好看看,看完基本上了解推薦系統(tǒng)的大概框架和流程,也有一些例子,但是每個(gè)例子以及理論都講的很淺,沒有深入,只適合入門。
推薦指數(shù):四顆星
評(píng)價(jià):實(shí)習(xí)的同事本科時(shí)上課的教材,也是一部大巨頭啊,外國(guó)人寫的書,很通俗易懂,非常非常詳細(xì)。
推薦指數(shù):四顆星
今天先寫到這兒吧,基本上都是一些入門書,還有一些在印象筆記里,回去再總結(jié)。下次寫看過的hadoop/Python/Spark的書,以及一些比較不錯(cuò)的論文。
#--------------------------------------------------------------4.12更新--------------------------------------------------------------
評(píng)價(jià):8.4/10,很薄的一本書,主要介紹的Spark的基本語(yǔ)法命令之類的,適合快速入門,Learning Spark的中文版
推薦指數(shù):五顆星
評(píng)價(jià):豆瓣上評(píng)價(jià)很少,但是我買回來看了以后發(fā)現(xiàn)還是不錯(cuò)的,基本上從分類,聚類,推薦,征信這幾塊都有實(shí)例講解,比較詳細(xì),看的也很快,上手不錯(cuò)。
推薦指數(shù):五顆星
評(píng)價(jià):7.8/10,很厚,Hadoop講的很深,不太適合入門,適合做數(shù)據(jù)倉(cāng)庫(kù)的人看,數(shù)據(jù)挖掘的可以先看看hadoop實(shí)戰(zhàn)
推薦指數(shù):三顆星
評(píng)價(jià):7.0/10,我看的是國(guó)內(nèi)的一個(gè)教授寫的,并不是“Hadoop in anction”的中文譯本,這個(gè)寫的很淺,適合入門,但是感覺還是Hadoop in action寫的好一些
推薦指數(shù):三星半
15.Hive編程指南
評(píng)價(jià):7.4/10 ,講Hive操作的,講真,如果真的只想了解下hive怎么操作,可以不用看這本書,直接去搜一下hive編程命令集合就可以了,這本書比較適合ETL的人,如果只是數(shù)據(jù)挖掘入門入門的話可以暫時(shí)先不用看這本書。但是書本身講的還是很好的
推薦指數(shù):四顆星
評(píng)價(jià):7.4/10,本來只是去國(guó)圖偶然看到的一本書,但是看了幾章后覺得講的挺清晰,而且后面的實(shí)例講的挺好的,就去亞馬遜上買了kindle電子書,關(guān)聯(lián)規(guī)則和社群分析講的都挺不錯(cuò)的,看的特別快。
推薦指數(shù):四顆星
17.R的極客理想工具篇
評(píng)價(jià):7.5/10,作者是張丹,最開始是關(guān)注他的博客,寫的很清晰,步驟也很明確,對(duì)于學(xué)習(xí)R的人來說是個(gè)不錯(cuò)的學(xué)習(xí)地方。這本書后面幾張講的主要是R的性能、以及數(shù)據(jù)庫(kù)、hadoop、hive結(jié)合起來做的方法,值得一看。
推薦指數(shù):四顆星
評(píng)價(jià):8.4/10,不多說,入門Mysql必讀書,很薄的一本小冊(cè)子。
推薦指數(shù):五顆星
19.高性能MySQL
評(píng)價(jià):8.7/10,專業(yè)級(jí)的MySQL書籍,適合進(jìn)階,但是中文翻譯很爛,買英文版英文版英文版
推薦指數(shù):兩顆星(還有三顆星給了英文版)
19.凸優(yōu)化
評(píng)價(jià):9.4/10,很好的教材,而且很全,之前上數(shù)值分析這門課學(xué)的很多內(nèi)容都包含在里面了,機(jī)器學(xué)習(xí)的很多概念也可以在里面找到,讀完可以讓你更深入的理解機(jī)器學(xué)習(xí),而不是僅僅只會(huì)套用包。
推薦指數(shù):五顆星?。?/p>
20.Pattern Recognition and Machine Learning
評(píng)價(jià):9.6/10,PRML是機(jī)器學(xué)習(xí)的經(jīng)典教材啊,非常值得看!有人翻譯了中文版的,如果需要的話可以留言我把鏈接發(fā)出來~
推薦指數(shù):五顆星
評(píng)價(jià):8.8/10,做自然語(yǔ)言處理的入門書,書很厚,但是講的很多概念性的東西,卻一點(diǎn)也不覺得枯燥,唯一的缺點(diǎn)就是,大概因?yàn)槭墙?jīng)典教材類的書,所以實(shí)例比較少,有點(diǎn)像綜述,大而全,如果想實(shí)戰(zhàn),可以看看Python寫的一本自然語(yǔ)言處理的書,nltk,忘記叫啥名了,想起來了貼上來
推薦指數(shù):四顆星
再推薦幾本科普書,業(yè)余可以看看提升下興趣
1.從0到1
2.大數(shù)據(jù)時(shí)代
3.浪潮之巔
4.數(shù)學(xué)之美
5.數(shù)據(jù)之巔
還有其他的暫時(shí)想不起來了,下次再更新~