【超級(jí)重磅】626篇!機(jī)器學(xué)習(xí)&深度學(xué)習(xí)資料匯總(三)

【整理】ty4z2008201《Understanding Convolutions》

【編輯】Major術(shù)業(yè)

文章鏈接地址:https://github.com/ty4z2008/Qix/blob/master/dl.md ? ? ? ??

401《How to Choose a Neural Network》

介紹:deeplearning4j官網(wǎng)提供的實(shí)際應(yīng)用場(chǎng)景NN選擇參考表,列舉了一些典型問題建議使用的神經(jīng)網(wǎng)絡(luò)

402《Deep Learning (Python, C/C++, Java, Scala, Go)》

介紹:一個(gè)深度學(xué)習(xí)項(xiàng)目,提供了Python, C/C++, Java, Scala, Go多個(gè)版本的代碼

403《Deep Learning Tutorials》

介紹:深度學(xué)習(xí)教程,github

404《自然語言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授》

介紹:自然語言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授.

405《FaceNet: A Unified Embedding for Face Recognition and Clustering》

介紹:Google對(duì)Facebook DeepFace的有力回?fù)簟?FaceNet,在LFW(Labeled Faces in the Wild)上達(dá)到99.63%準(zhǔn)確率(新紀(jì)錄),F(xiàn)aceNet embeddings可用于人臉識(shí)別、鑒別和聚類.

406《MLlib中的Random Forests和Boosting》

介紹:本文來自Databricks公司網(wǎng)站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們?cè)贛Llib中的分布式實(shí)現(xiàn),以及展示一些簡單的例子并建議該從何處上手.中文版.

407《Sum-Product Networks(SPN) 》

介紹:華盛頓大學(xué)Pedro Domingos團(tuán)隊(duì)的DNN,提供論文和實(shí)現(xiàn)代碼.

408《Neural Network Dependency Parser》

介紹:基于神經(jīng)網(wǎng)絡(luò)的自然語言依存關(guān)系解析器(已集成至Stanford CoreNLP),特點(diǎn)是超快、準(zhǔn)確,目前可處理中英文語料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路實(shí)現(xiàn).

409《神經(jīng)網(wǎng)絡(luò)語言模型》

介紹:本文根據(jù)神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,詳細(xì)講解神經(jīng)網(wǎng)絡(luò)語言模型在各個(gè)階段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結(jié)的特別好.

410《Classifying Spam Emails using Text and Readability Features》

介紹:經(jīng)典問題的新研究:利用文本和可讀性特征分類垃圾郵件。

411《BCI Challenge @ NER 2015》

介紹:Kaggle腦控計(jì)算機(jī)交互(BCI)競(jìng)賽優(yōu)勝方案源碼及文檔,包括完整的數(shù)據(jù)處理流程,是學(xué)習(xí)Python數(shù)據(jù)處理和Kaggle經(jīng)典參賽框架的絕佳實(shí)例

412《IPOL Journal · Image Processing On Line》

介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個(gè)算法及相應(yīng)的代碼、Demo和實(shí)驗(yàn)文檔。文本和源碼是經(jīng)過了同行評(píng)審的。IPOL是開放的科學(xué)和可重復(fù)的研究期刊。我一直想做點(diǎn)類似的工作,拉近產(chǎn)品和技術(shù)之間的距離.

413《Machine learning classification over encrypted data》

介紹:出自MIT,研究加密數(shù)據(jù)高效分類問題.

414《purine2》

介紹:新加坡LV實(shí)驗(yàn)室的神經(jīng)網(wǎng)絡(luò)并行框架Purine: A bi-graph based deep learning framework,支持構(gòu)建各種并行的架構(gòu),在多機(jī)多卡,同步更新參數(shù)的情況下基本達(dá)到線性加速。12塊Titan 20小時(shí)可以完成Googlenet的訓(xùn)練。

415《Machine Learning Resources》

介紹:這是一個(gè)機(jī)器學(xué)習(xí)資源庫,雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個(gè)由zheng Rui整理的機(jī)器學(xué)習(xí)資源.

416《Hands-on with machine learning》

介紹:Chase Davis在NICAR15上的主題報(bào)告材料,用Scikit-Learn做監(jiān)督學(xué)習(xí)的入門例子.

417《The Natural Language Processing Dictionary》

介紹:這是一本自然語言處理的詞典,從1998年開始到目前積累了成千上萬的專業(yè)詞語解釋,如果你是一位剛?cè)腴T的朋友.可以借這本詞典讓自己成長更快.

418《PageRank Approach to Ranking National Football Teams》

介紹:通過分析1930年至今的比賽數(shù)據(jù),用PageRank計(jì)算世界杯參賽球隊(duì)排行榜.

419《R Tutorial》

介紹:R語言教程,此外還推薦一個(gè)R語言教程An Introduction to R.

420《Fast unfolding of communities in large networks》

介紹:經(jīng)典老文,復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.

421《NUML》

介紹: 一個(gè)面向 .net 的開源機(jī)器學(xué)習(xí)庫,github地址

422《synaptic.Js》

介紹: 支持node.js的JS神經(jīng)網(wǎng)絡(luò)庫,可在客戶端瀏覽器中運(yùn)行,支持LSTM等 github地址

423《Machine learning for package users with R (1): Decision Tree》

介紹: 決策樹

424《Deep Learning, The Curse of Dimensionality, and Autoencoders》

介紹: 討論深度學(xué)習(xí)自動(dòng)編碼器如何有效應(yīng)對(duì)維數(shù)災(zāi)難,國內(nèi)翻譯

425《Advanced Optimization and Randomized Methods》

介紹: CMU的優(yōu)化與隨機(jī)方法課程,由A. Smola和S. Sra主講,優(yōu)化理論是機(jī)器學(xué)習(xí)的基石,值得深入學(xué)習(xí) 國內(nèi)云(視頻)

426《CS231n: Convolutional Neural Networks for Visual Recognition》

介紹: "面向視覺識(shí)別的CNN"課程設(shè)計(jì)報(bào)告集錦.近百篇,內(nèi)容涉及圖像識(shí)別應(yīng)用的各個(gè)方面

427《Topic modeling with LDA: MLlib meets GraphX》

介紹:用Spark的MLlib+GraphX做大規(guī)模LDA主題抽取.

428《Deep Learning for Multi-label Classification》

介紹: 基于深度學(xué)習(xí)的多標(biāo)簽分類,用基于RBM的DBN解決多標(biāo)簽分類(特征)問題

429《Google DeepMind publications》

介紹: DeepMind論文集錦

430《kaldi》

介紹: 一個(gè)開源語音識(shí)別工具包,它目前托管在sourceforge上面

431《Data Journalism Handbook》

介紹: 免費(fèi)電子書《數(shù)據(jù)新聞手冊(cè)》, 國內(nèi)有熱心的朋友翻譯了中文版,大家也可以在線閱讀

432《Data Mining Problems in Retail》

介紹: 零售領(lǐng)域的數(shù)據(jù)挖掘文章.

433《Understanding Convolution in Deep Learning》

介紹: 深度學(xué)習(xí)卷積概念詳解,深入淺出.

434《pandas: powerful Python data analysis toolkit》

介紹: 非常強(qiáng)大的Python的數(shù)據(jù)分析工具包.

435《Text Analytics 2015》

介紹: 2015文本分析(商業(yè))應(yīng)用綜述.

436《Deep Learning libraries and ?rst experiments with Theano》

介紹: 深度學(xué)習(xí)框架、庫調(diào)研及Theano的初步測(cè)試體會(huì)報(bào)告.

437《DEEP learning》

介紹: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人講深度學(xué)習(xí)的新書,還未定稿,線上提供Draft chapters收集反饋,超贊!強(qiáng)烈推薦.

438《simplebayes》

介紹: Python下開源可持久化樸素貝葉斯分類庫.

439《Paracel》

介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.

440《HanLP:Han Language processing》

介紹: 開源漢語言處理包.

441《Simple Neural Network implementation in Ruby》

介紹: 使用Ruby實(shí)現(xiàn)簡單的神經(jīng)網(wǎng)絡(luò)例子.

442《Hacker's guide to Neural Networks》

介紹:神經(jīng)網(wǎng)絡(luò)黑客入門.

443《The Open-Source Data Science Masters》

介紹:好多數(shù)據(jù)科學(xué)家名人推薦,還有資料.

444《Text Understanding from Scratch》

介紹:實(shí)現(xiàn)項(xiàng)目已經(jīng)開源在github上面Crepe

445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》

介紹:作者發(fā)現(xiàn),經(jīng)過調(diào)參,傳統(tǒng)的方法也能和word2vec取得差不多的效果。另外,無論作者怎么試,GloVe都比不過word2vec.

446《CS224d: Deep Learning for Natural Language Processing》

介紹:Stanford深度學(xué)習(xí)與自然語言處理課程,Richard Socher主講.

447《Math Essentials in Machine Learning》

介紹:機(jī)器學(xué)習(xí)中的重要數(shù)學(xué)概念.

448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》

介紹:用于改進(jìn)語義表示的樹型LSTM遞歸神經(jīng)網(wǎng)絡(luò),句子級(jí)相關(guān)性判斷和情感分類效果很好.實(shí)現(xiàn)代碼.

449《Statistical Machine Learning》

介紹:卡耐基梅隆Ryan Tibshirani和Larry Wasserman開設(shè)的機(jī)器學(xué)習(xí)課程,先修課程為機(jī)器學(xué)習(xí)(10-715)和中級(jí)統(tǒng)計(jì)學(xué)(36-705),聚焦統(tǒng)計(jì)理論和方法在機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用.

450《AM207: Monte Carlo Methods, Stochastic Optimization》

介紹:《哈佛大學(xué)蒙特卡洛方法與隨機(jī)優(yōu)化課程》是哈佛應(yīng)用數(shù)學(xué)研究生課程,由V Kaynig-Fittkau、P Protopapas主講,Python程序示例,對(duì)貝葉斯推理感興趣的朋友一定要看看,提供授課視頻及課上IPN講義.

451《生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用》

介紹:生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用.并且伯克利開源了他們的big data genomics系統(tǒng)ADAM,其他的內(nèi)容可以關(guān)注一下官方主頁.

452《ACL Anthology》

介紹:對(duì)自然語言處理技術(shù)或者機(jī)器翻譯技術(shù)感興趣的親們,請(qǐng)?jiān)谔岢鲎约号1频綗o以倫比的idea(自動(dòng)歸納翻譯規(guī)律、自動(dòng)理解語境、自動(dòng)識(shí)別語義等等)之前,請(qǐng)通過谷歌學(xué)術(shù)簡單搜一下,如果谷歌不可用,這個(gè)網(wǎng)址有這個(gè)領(lǐng)域幾大頂會(huì)的論文列表,切不可斷章取義,胡亂假設(shè).

453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》

介紹:論文+代碼:基于集成方法的Twitter情感分類,實(shí)現(xiàn)代碼.

454《NIPS 2014 CIML workshop》

介紹:NIPS CiML 2014的PPT,NIPS是神經(jīng)信息處理系統(tǒng)進(jìn)展大會(huì)的英文簡稱.

455《CS231n: Convolutional Neural Networks for Visual Recognition》

介紹:斯坦福的深度學(xué)習(xí)課程的Projects 每個(gè)人都要寫一個(gè)論文級(jí)別的報(bào)告 里面有一些很有意思的應(yīng)用 大家可以看看 .

456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》

介紹:R語言線性回歸多方案速度比較具體方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.

457《Back-to-Basics Weekend Reading - Machine Learning》

介紹:文中提到的三篇論文(機(jī)器學(xué)習(xí)那些事、無監(jiān)督聚類綜述、監(jiān)督分類綜述)都很經(jīng)典,Domnigos的機(jī)器學(xué)習(xí)課也很精彩

458《A Probabilistic Theory of Deep Learning》

介紹:萊斯大學(xué)(Rice University)的深度學(xué)習(xí)的概率理論.

459《Nonsensical beer reviews via Markov chains》

介紹:基于馬爾可夫鏈自動(dòng)生成啤酒評(píng)論的開源Twitter機(jī)器人,github地址.

460《Deep Learning for Natural Language Processing (without Magic)》

介紹:視頻+講義:深度學(xué)習(xí)用于自然語言處理教程(NAACL13).

461《Introduction to Data Analysis using Machine Learning》

介紹:用機(jī)器學(xué)習(xí)做數(shù)據(jù)分析,David Taylor最近在McGill University研討會(huì)上的報(bào)告,還提供了一系列講機(jī)器學(xué)習(xí)方法的ipn,很有價(jià)值 GitHub.國內(nèi)

462《Beyond Short Snippets: Deep Networks for Video Classification》

介紹:基于CNN+LSTM的視頻分類,google演示.

463《How does Quora use machine learning in 2015?》

介紹:Quora怎么用機(jī)器學(xué)習(xí).

464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》

介紹:亞馬遜在機(jī)器學(xué)習(xí)上面的一些應(yīng)用,代碼示例.

465《Parallel Machine Learning with scikit-learn and IPython》

介紹:并行機(jī)器學(xué)習(xí)指南(基于scikit-learn和IPython).notebook

466《Intro to machine learning with scikit-learn》

介紹:DataSchool的機(jī)器學(xué)習(xí)基本概念教學(xué).

467《DeepCLn》

介紹:一個(gè)基于OpenGL實(shí)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò),支持Linux及Windows系.

468《An Inside Look at the Components of a Recommendation Engine》

介紹:基于Mahout和Elasticsearch的推薦系統(tǒng).

469《Forecasting in Economics, Business, Finance and Beyond》

介紹:Francis X. Diebold的《(經(jīng)濟(jì)|商業(yè)|金融等領(lǐng)域)預(yù)測(cè)方法.

470《Time Series Econometrics - A Concise Course》

介紹:Francis X. Diebold的《時(shí)序計(jì)量經(jīng)濟(jì)學(xué)》.

471《A comparison of open source tools for sentiment analysis》

介紹:基于Yelp數(shù)據(jù)集的開源情感分析工具比較,評(píng)測(cè)覆蓋Naive Bayes、SentiWordNet、CoreNLP等 .

472《Pattern Recognition And Machine Learning》

介紹:國內(nèi)Pattern Recognition And Machine Learning讀書會(huì)資源匯總,各章pdf講稿,博客.

473《Probabilistic Data Structures for Web Analytics and Data Mining 》

介紹:用于Web分析和數(shù)據(jù)挖掘的概率數(shù)據(jù)結(jié)構(gòu).

474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》

介紹:機(jī)器學(xué)習(xí)在導(dǎo)航上面的應(yīng)用.

475《Neural Networks Demystified 》

介紹:Neural Networks Demystified系列視頻,Stephen Welch制作,純手繪風(fēng)格,淺顯易懂,國內(nèi)云.

476《swirl + DataCamp 》

介紹:{swirl}數(shù)據(jù)訓(xùn)練營:R&數(shù)據(jù)科學(xué)在線交互教程.

477《Learning to Read with Recurrent Neural Networks 》

介紹:關(guān)于深度學(xué)習(xí)和RNN的討論 Sequence to Sequence Learning with Neural Networks.

478《深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的資源》

介紹:Deep Reinforcement Learning.

479《Machine Learning with Scikit-Learn》

介紹:(PyCon2015)Scikit-Learn機(jī)器學(xué)習(xí)教程,Parallel Machine Learning with scikit-learn and IPython.

480《PDNN》

介紹:PDNN: A Python Toolkit for Deep Learning.

481《Introduction to Machine Learning》

介紹:15年春季學(xué)期CMU的機(jī)器學(xué)習(xí)課程,由Alex Smola主講,提供講義及授課視頻,很不錯(cuò).國內(nèi)鏡像.

482《Big Data Processing》

介紹:大數(shù)據(jù)處理課.內(nèi)容覆蓋流處理、MapReduce、圖算法等.

483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》

介紹:用Spark MLlib實(shí)現(xiàn)易用可擴(kuò)展的機(jī)器學(xué)習(xí),國內(nèi)鏡像.

484《Picture: A Probabilistic Programming Language for Scene Perception》

介紹:以往上千行代碼概率編程(語言)實(shí)現(xiàn)只需50行.

485《Beautiful plotting in R: A ggplot2 cheatsheet》

介紹:ggplot2速查小冊(cè)子,另外一個(gè),此外還推薦《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.

486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》

介紹:用結(jié)構(gòu)化模型來預(yù)測(cè)實(shí)時(shí)股票行情.

487《International Joint Conference on Artificial Intelligence Accepted paper》

介紹:國際人工智能聯(lián)合會(huì)議錄取論文列表,大部分論文可使用Google找到.

488《Why GEMM is at the heart of deep learning》

介紹:一般矩陣乘法(GEMM)對(duì)深度學(xué)習(xí)的重要性.

489《Distributed (Deep) Machine Learning Common》

介紹:A Community of awesome Distributed Machine Learning C++ projects.

490《Reinforcement Learning: An Introduction》

介紹:免費(fèi)電子書<強(qiáng)化學(xué)習(xí)介紹>,第一版(1998),第二版(2015草稿),相關(guān)課程資料,Reinforcement Learning.

491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》

介紹:免費(fèi)書:Azure ML使用精要.

492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》

介紹:A Deep Learning Tutorial: From Perceptrons to Deep Networks.

493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》

介紹:有趣的機(jī)器學(xué)習(xí):最簡明入門指南,中文版.

494《A Brief Overview of Deep Learning》

介紹:深度學(xué)習(xí)簡明介紹,中文版.

495《Wormhole》

介紹:Portable, scalable and reliable distributed machine learning.

496《convnet-benchmarks》

介紹:CNN開源實(shí)現(xiàn)橫向評(píng)測(cè),參評(píng)框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表現(xiàn)突出.

497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》

介紹:卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院語言技術(shù)系的資源大全,包括大量的NLP開源軟件工具包,基礎(chǔ)數(shù)據(jù)集,論文集,數(shù)據(jù)挖掘教程,機(jī)器學(xué)習(xí)資源.

498《Sentiment Analysis on Twitter》

介紹:Twitter情感分析工具SentiTweet,視頻+講義.

499《Machine Learning Repository @ Wash U》

介紹:華盛頓大學(xué)的Machine Learning Paper Repository.

500《Machine learning cheat sheet》

介紹:機(jī)器學(xué)習(xí)速查表.

501《Spark summit east 2015 agenda》

介紹:最新的Spark summit會(huì)議資料.

502《Learning Spark》

介紹:Ebook Learning Spark.

503《Advanced Analytics with Spark, Early Release Edition》

介紹:Ebook Advanced Analytics with Spark, Early Release Edition.

504《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:唐杰》

介紹:清華大學(xué)副教授,是圖挖掘方面的專家。他主持設(shè)計(jì)和實(shí)現(xiàn)的Arnetminer是國內(nèi)領(lǐng)先的圖挖掘系統(tǒng),該系統(tǒng)也是多個(gè)會(huì)議的支持商.

505《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:楊強(qiáng)》

介紹:遷移學(xué)習(xí)的國際領(lǐng)軍人物.

506《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:周志華》

介紹:在半監(jiān)督學(xué)習(xí),multi-label學(xué)習(xí)和集成學(xué)習(xí)方面在國際上有一定的影響力.

507《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:王海峰》

介紹:信息檢索,自然語言處理,機(jī)器翻譯方面的專家.

508《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:吳軍》

介紹:吳軍博士是當(dāng)前Google中日韓文搜索算法的主要設(shè)計(jì)者。在Google其間,他領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語言處理的項(xiàng)目,他的新個(gè)人主頁.

509《Cat Paper Collection》

介紹:喵星人相關(guān)論文集.

510《How to Evaluate Machine Learning Models, Part 1: Orientation》

介紹:如何評(píng)價(jià)機(jī)器學(xué)習(xí)模型系列文章,How to Evaluate Machine Learning Models, Part 2a: Classification Metrics,How to Evaluate Machine Learning Models, Part 2b: Ranking and Regression Metrics.

511《Building a new trends experience》

介紹:Twitter新trends的基本實(shí)現(xiàn)框架.

512《Storm Blueprints: Patterns for Distributed Real-time Computation》

介紹:Storm手冊(cè),國內(nèi)有中文翻譯版本,謝謝作者.

513《SmileMiner》

介紹:Java機(jī)器學(xué)習(xí)算法庫SmileMiner.

514《機(jī)器翻譯學(xué)術(shù)論文寫作方法和技巧》

介紹:機(jī)器翻譯學(xué)術(shù)論文寫作方法和技巧,Simon Peyton Jones的How to write a good research paper同類視頻How to Write a Great Research Paper,how to paper talk.

515《神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的Tricks之高效BP(反向傳播算法)》

介紹:神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的Tricks之高效BP,博主的其他博客也挺精彩的.

516《我和NLP的故事》

介紹:作者是NLP方向的碩士,短短幾年內(nèi)研究成果頗豐,推薦新入門的朋友閱讀.

517《The h Index for Computer Science 》

介紹:UCLA的Jens Palsberg根據(jù)Google Scholar建立了一個(gè)計(jì)算機(jī)領(lǐng)域的H-index牛人列表,我們熟悉的各個(gè)領(lǐng)域的大牛絕大多數(shù)都在榜上,包括1位諾貝爾獎(jiǎng)得主,35位圖靈獎(jiǎng)得主,近百位美國工程院/科學(xué)院院士,300多位ACM Fellow,在這里推薦的原因是大家可以在google通過搜索牛人的名字來獲取更多的資源,這份資料很寶貴.

518《Structured Learning for Taxonomy Induction with Belief Propagation》

介紹:用大型語料庫學(xué)習(xí)概念的層次關(guān)系,如鳥是鸚鵡的上級(jí),鸚鵡是虎皮鸚鵡的上級(jí)。創(chuàng)新性在于模型構(gòu)造,用因子圖刻畫概念之間依存關(guān)系,因引入兄弟關(guān)系,圖有環(huán),所以用有環(huán)擴(kuò)散(loopy propagation)迭代計(jì)算邊際概率(marginal probability).

519《Bayesian analysis》

介紹: 這是一款貝葉斯分析的商業(yè)軟件,官方寫的貝葉斯分析的手冊(cè)有250多頁,雖然R語言 已經(jīng)有類似的項(xiàng)目,但畢竟可以增加一個(gè)可選項(xiàng).

520《deep net highlights from 2014》

介紹:deep net highlights from 2014.

521《Fast R-CNN》

介紹:This paper proposes Fast R-CNN, a clean and fast framework for object detection.

522《Fingerprinting Images for Near-Duplicate Detection》

介紹:圖像指紋的重復(fù)識(shí)別,作者源碼,國內(nèi)翻譯版本.

523《The Computer Vision Industry 》

介紹:提供計(jì)算機(jī)視覺、機(jī)器視覺應(yīng)用的公司信息匯總.應(yīng)用領(lǐng)域包括:自動(dòng)輔助駕駛和交通管理、眼球和頭部跟蹤、影視運(yùn)動(dòng)分析、影視業(yè)、手勢(shì)識(shí)別、通用視覺系統(tǒng)、各種工業(yè)自動(dòng)化和檢驗(yàn)、醫(yī)藥和生物、移動(dòng)設(shè)備目標(biāo)識(shí)別和AR、人群跟蹤、攝像、安全監(jiān)控、生物監(jiān)控、三維建模、web和云應(yīng)用.

524《Seaborn: statistical data visualization》

介紹:Python版可視化數(shù)據(jù)統(tǒng)計(jì)開源庫.

525《IPython lecture notes for OCW MIT 18.06》

介紹:麻省理工Gilbert Strang線性代數(shù)課程筆記,Gilbert Strang《Linear Algebra》課程主頁視頻+講義.

526《Canova: A Vectorization Lib for ML》

介紹:面向機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的數(shù)據(jù)向量化工具Canova,github, 支持CSV文件、MNIST數(shù)據(jù)、TF-IDF/Bag of Words/word2vec文本向量化.

527《DZone Refcardz: Distributed Machine Learning with Apache Mahout》

介紹:快速入門:基于Apache Mahout的分布式機(jī)器學(xué)習(xí).

528《Learning scikit-learn: Machine Learning in Python》

介紹:基于scikit-learn講解了一些機(jī)器學(xué)習(xí)技術(shù),如SVM,NB,PCA,DT,以及特征工程、特征選擇和模型選擇問題.

529《Lightning fast Machine Learning with Spark》

介紹:基于Spark的高效機(jī)器學(xué)習(xí),視頻地址.

530《How we’re using machine learning to fight shell selling》

介紹:WePay用機(jī)器學(xué)習(xí)對(duì)抗信用卡"shell selling"詐騙.

531《Data Scientists Thoughts that Inspired Me》

介紹:16位數(shù)據(jù)科學(xué)家語錄精選.

532《Deep learning applications and challenges in big data analytics》

介紹:深度學(xué)習(xí)在大數(shù)據(jù)分析領(lǐng)域的應(yīng)用和挑戰(zhàn).

533《Free book:Machine Learning,Mathematics》

介紹:免費(fèi)的機(jī)器學(xué)習(xí)與數(shù)學(xué)書籍,除此之外還有其他的免費(fèi)編程書籍,編程語言,設(shè)計(jì),操作系統(tǒng)等.

534《Object detection via a multi-region & semantic segmentation-aware CNN model》

介紹:一篇關(guān)于CNN模型對(duì)象識(shí)別Paper.

535《A Statistical View of Deep Learning (V): Generalisation and Regularisation》

介紹:深度學(xué)習(xí)的統(tǒng)計(jì)分析V:泛化和正則化.

536《Highway Networks》

介紹:用SGD能高效完成訓(xùn)練的大規(guī)模(多層)深度網(wǎng)絡(luò)HN.

537《What I Read For Deep-Learning》

介紹:深度學(xué)習(xí)解讀文章.

538《An Introduction to Recommendation Engines》

介紹:Coursera上的推薦系統(tǒng)導(dǎo)論(Introduction to Recommender Systems)公開課.

539《Stanford Machine Learning》

介紹:Andrew Ng經(jīng)典機(jī)器學(xué)習(xí)課程筆記.

540《ICLR 2015》

介紹:ICLR 2015見聞錄,博客的其他機(jī)器學(xué)習(xí)文章也不錯(cuò).

541《Stanford Machine Learning》

介紹:推薦系統(tǒng)"個(gè)性化語義排序"模型.

542《The More Excited We Are, The Shorter We Tweet》

介紹:激情時(shí)分更惜字——MIT的最新Twitter研究結(jié)果.

543《蘇州大學(xué)人類語言技術(shù)研究論文主頁》

介紹:蘇州大學(xué)人類語言技術(shù)研究相關(guān)論文.

544《Neural Turing Machines implementation》

介紹:實(shí)現(xiàn)神經(jīng)圖靈機(jī)(NTM),項(xiàng)目地址,此外推薦相關(guān)神經(jīng)圖靈機(jī)算法.

545《Computer Vision - CSE 559A, Spring 2015》

介紹:華盛頓大學(xué)的機(jī)器視覺(2015),參考資料Computer Vision: Algorithms and Applications.

546《Mining of Massive Datasets》

介紹:"Mining of Massive Datasets"發(fā)布第二版,Jure Leskovec, Anand Rajaraman, Jeff Ullman 新版增加Jure Leskovec作為合作作者,新增社交網(wǎng)絡(luò)圖數(shù)據(jù)挖掘、降維和大規(guī)模機(jī)器學(xué)習(xí)三章,電子版依舊免費(fèi).

547《Learning Deep Learning》

介紹:一個(gè)深度學(xué)習(xí)資源頁,資料很豐富.

548《Learning Deep Learning》

介紹:免費(fèi)電子書"Learning Deep Learning".

549《Tutorial: Machine Learning for Astronomy with Scikit-learn》

介紹:Machine Learning for Astronomy with scikit-learn.

550《An Introduction to Random Forests for Beginners》

介紹:免費(fèi)電子書"隨機(jī)森林入門指南".

551《Top 10 data mining algorithms in plain English》

介紹:白話數(shù)據(jù)挖掘十大算法.

552《An Inside Look at the Components of a Recommendation Engine》

介紹:基于Mahout和Elasticsearch的推薦系統(tǒng),國內(nèi)譯版.

553《Advances in Extreme Learning Machines》

介紹:博士學(xué)位論文:ELM研究進(jìn)展.

554《10-minute tour of pandas》

介紹:Pandas十分鐘速覽,ipn.

555《Data doesn't grow in tables: harvesting journalistic insight from documents》

介紹:面向數(shù)據(jù)新聞的文本挖掘.

556《Time-lapse Mining from Internet Photos》

介紹:用網(wǎng)絡(luò)圖片合成延時(shí)視頻(SIGGRAPH 2015).

557《The Curse of Dimensionality in classification》

介紹:分類系統(tǒng)的維數(shù)災(zāi)難.

558《Deep Learning vs Big Data: Who owns what?》

介紹:深度學(xué)習(xí)vs.大數(shù)據(jù)——從數(shù)據(jù)到知識(shí):版權(quán)的思考,[翻譯版](http://www.csdn.net/article/2015-05-19/2824707

559《A Primer on Predictive Models》

介紹:預(yù)測(cè)模型入門.

560《Demistifying LSTM Neural Networks》

介紹:深入淺出LSTM.

561《ICLR 2015》

介紹:2015年ICLR會(huì)議視頻與講義.

562《On Visualizing Data Well》

介紹:Ben Jones的數(shù)據(jù)可視化建議.

563《Decoding Dimensionality Reduction, PCA and SVD》

介紹:解讀數(shù)據(jù)降維/PCA/SVD.

564《Supervised learning superstitions cheat sheet》

介紹:IPN:監(jiān)督學(xué)習(xí)方法示例/對(duì)比參考表,覆蓋logistic回歸, 決策樹, SVM, KNN, Naive Bayes等方法.

565《DopeLearning: A Computational Approach to Rap Lyrics Generation》

介紹:基于RankSVM和DNN自動(dòng)(重組)生成Rap歌詞.

566《An Introduction to Random Indexing》

介紹:隨機(jī)索引RI詞空間模型專題.

567《VDiscover》

介紹:基于機(jī)器學(xué)習(xí)的漏洞檢測(cè)工具VDiscover.

568《Minerva》

介紹:深度學(xué)習(xí)系統(tǒng)minerva。擁有python編程接口。多GPU幾乎達(dá)到線性加速。在4塊GPU上能在4天內(nèi)將GoogLeNet訓(xùn)練到68.7%的top-1以及89.0%的top-5準(zhǔn)確率。和同為dmlc項(xiàng)目的cxxnet相比,采用動(dòng)態(tài)數(shù)據(jù)流引擎,提供更多靈活性。未來將和cxxnet一起整合為mxnet項(xiàng)目,互取優(yōu)勢(shì).

569《CVPR 2015 paper》

介紹:2015年國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議paper.

570《What are the advantages of different classification algorithms?》

介紹:Netflix工程總監(jiān)眼中的分類算法:深度學(xué)習(xí)優(yōu)先級(jí)最低,中文版.

571《Results for Microsoft COCO Image Captioning Challenge》

介紹:Codalab圖像標(biāo)注競(jìng)賽排行+各家論文,Reddit上flukeskywalker整理了各家技術(shù)相關(guān)論文.

572《Caffe con Troll: Shallow Ideas to Speed Up Deep Learning》

介紹:基于Caffe的加速深度學(xué)習(xí)系統(tǒng)CcT.

573《Low precision storage for deep learning》

介紹:深度學(xué)習(xí)(模型)低精度(訓(xùn)練與)存儲(chǔ).

574《Model-Based Machine Learning (Early Access)》

介紹:新書預(yù)覽:模型機(jī)器學(xué)習(xí).

575《Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems》

介紹:免費(fèi)電子書多臂老虎機(jī),此外推薦Introduction to Bandits: Algorithms and Theory.

576《Kaggle R Tutorial on Machine Learing》

介紹:基于Kaggle's Titanic Competition的交互式R機(jī)器學(xué)習(xí)教程,介紹《Interactive R Tutorial: Machine Learning for the Titanic Competition》.

577《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》

介紹:Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列.

578《Introduction to Neural Machine Translation with GPUs 》

介紹:神經(jīng)(感知)機(jī)器翻譯介紹.

579《Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning》

介紹:Andrew Ng關(guān)于深度學(xué)習(xí)/自學(xué)習(xí)/無監(jiān)督特征學(xué)習(xí)的報(bào)告,國內(nèi)云.

580《Recurrent Neural Network Training with Dark Knowledge Transfer》

介紹:論文:通過潛在知識(shí)遷移訓(xùn)練RNN.

581《Show Me The Money》

介紹:面向金融數(shù)據(jù)的情感分析工具.

582《pyLDAvis》

介紹:(Python)主題模型交互可視化庫pyLDAvis.

583《Logistic Regression and Gradient Descent》

介紹:Logistic回歸與優(yōu)化實(shí)例教程.

584《賈揚(yáng)清微信講座記錄》

介紹:賈揚(yáng)清(谷歌大腦科學(xué)家、caffe締造者)微信講座記錄.

585《sketch》

介紹:Theano/Blocks實(shí)現(xiàn)RNN手寫字符串生成sketch.

586《Web Scale Document Clustering: Clustering 733 Million Web Pages》

介紹:基于TopSig的海量(7億+)網(wǎng)頁聚類.

587《NAACL 2015 Proceedings on ACL Anthology》

介紹:NAACL 2015 論文papers.

588《Stock Forecasting With Machine Learning - Seven Possible Errors》

介紹:機(jī)器學(xué)習(xí)預(yù)測(cè)股市的七個(gè)問題.

589《Are there any good resources for learning about neural networks?》

介紹:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)資料推薦.

590《A Critical Review of Recurrent Neural Networks for Sequence Learning》

介紹:面向序列學(xué)習(xí)的RNN綜述.

591《Handling and Processing Strings in R》

介紹:R文本處理手冊(cè).

592《Must-watch videos about Python》

介紹:“必看”的Python視頻集錦.

593《The Google Stack》

介紹:Google(基礎(chǔ)結(jié)構(gòu))棧.

594《Randomized Algorithms for Matrices and Data》

介紹:矩陣和數(shù)據(jù)的隨機(jī)算法(UC Berkeley 2013).

595《Intermediate R》

介紹:DataCamp中級(jí)R語言教程.

596《Topology Without Tears》

介紹:免費(fèi)電子書:輕松掌握拓?fù)鋵W(xué),中文版.

597《Information Theory, Pattern Recognition, and Neural Networks》

介紹:Book,video.

598《Scikit-learn》

介紹:Scikit-learn 是基于Scipy為機(jī)器學(xué)習(xí)建造的的一個(gè)Python模塊,他的特色就是多樣化的分類,回歸和聚類的算法包括支持向量機(jī),邏輯回歸,樸素貝葉斯分類器,隨機(jī)森林,Gradient Boosting,聚類算法和DBSCAN。而且也設(shè)計(jì)出了Python numerical和scientific libraries Numpy and Scipy

599《Pylearn2》

介紹:Pylearn是一個(gè)讓機(jī)器學(xué)習(xí)研究簡單化的基于Theano的庫程序。

600《NuPIC》

介紹:NuPIC是一個(gè)以HTM學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)。HTM是皮層的精確計(jì)算方法。HTM的核心是基于時(shí)間的持續(xù)學(xué)習(xí)算法和儲(chǔ)存和撤銷的時(shí)空模式。NuPIC適合于各種各樣的問題,尤其是檢測(cè)異常和預(yù)測(cè)的流數(shù)據(jù)來源。

601《Nilearn》

介紹:Nilearn 是一個(gè)能夠快速統(tǒng)計(jì)學(xué)習(xí)神經(jīng)影像數(shù)據(jù)的Python模塊。它利用Python語言中的scikit-learn 工具箱和一些進(jìn)行預(yù)測(cè)建模,分類,解碼,連通性分析的應(yīng)用程序來進(jìn)行多元的統(tǒng)計(jì)。

602《PyBrain》

介紹:Pybrain是基于Python語言強(qiáng)化學(xué)習(xí),人工智能,神經(jīng)網(wǎng)絡(luò)庫的簡稱。 它的目標(biāo)是提供靈活、容易使用并且強(qiáng)大的機(jī)器學(xué)習(xí)算法和進(jìn)行各種各樣的預(yù)定義的環(huán)境中測(cè)試來比較你的算法。

603《Pattern》

介紹:Pattern 是Python語言下的一個(gè)網(wǎng)絡(luò)挖掘模塊。它為數(shù)據(jù)挖掘,自然語言處理,網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)提供工具。它支持向量空間模型、聚類、支持向量機(jī)和感知機(jī)并且用KNN分類法進(jìn)行分類。

604《Fuel》

介紹:Fuel為你的機(jī)器學(xué)習(xí)模型提供數(shù)據(jù)。他有一個(gè)共享如MNIST, CIFAR-10 (圖片數(shù)據(jù)集), Google’s One Billion Words (文字)這類數(shù)據(jù)集的接口。你使用他來通過很多種的方式來替代自己的數(shù)據(jù)。

605《Bob》

介紹:Bob是一個(gè)免費(fèi)的信號(hào)處理和機(jī)器學(xué)習(xí)的工具。它的工具箱是用Python和C++語言共同編寫的,它的設(shè)計(jì)目的是變得更加高效并且減少開發(fā)時(shí)間,它是由處理圖像工具,音頻和視頻處理、機(jī)器學(xué)習(xí)和模式識(shí)別的大量軟件包構(gòu)成的。

606《Skdata》

介紹:Skdata是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的數(shù)據(jù)集的庫程序。這個(gè)模塊對(duì)于玩具問題,流行的計(jì)算機(jī)視覺和自然語言的數(shù)據(jù)集提供標(biāo)準(zhǔn)的Python語言的使用。

607《MILK》

介紹:MILK是Python語言下的機(jī)器學(xué)習(xí)工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機(jī)森林,決策樹中使用監(jiān)督分類法。 它還執(zhí)行特征選擇。 這些分類器在許多方面相結(jié)合,可以形成不同的例如無監(jiān)督學(xué)習(xí)、密切關(guān)系金傳播和由MILK支持的K-means聚類等分類系統(tǒng)。

608《IEPY》

介紹:IEPY是一個(gè)專注于關(guān)系抽取的開源性信息抽取工具。它主要針對(duì)的是需要對(duì)大型數(shù)據(jù)集進(jìn)行信息提取的用戶和想要嘗試新的算法的科學(xué)家。

609《Quepy》

介紹:Quepy是通過改變自然語言問題從而在數(shù)據(jù)庫查詢語言中進(jìn)行查詢的一個(gè)Python框架。他可以簡單的被定義為在自然語言和數(shù)據(jù)庫查詢中不同類型的問題。所以,你不用編碼就可以建立你自己的一個(gè)用自然語言進(jìn)入你的數(shù)據(jù)庫的系統(tǒng)。現(xiàn)在Quepy提供對(duì)于Sparql和MQL查詢語言的支持。并且計(jì)劃將它延伸到其他的數(shù)據(jù)庫查詢語言。

610《Hebel》

介紹:Hebel是在Python語言中對(duì)于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的一個(gè)庫程序,它使用的是通過PyCUDA來進(jìn)行GPU和CUDA的加速。它是最重要的神經(jīng)網(wǎng)絡(luò)模型的類型的工具而且能提供一些不同的活動(dòng)函數(shù)的激活功能,例如動(dòng)力,涅斯捷羅夫動(dòng)力,信號(hào)丟失和停止法。

611《mlxtend》

介紹:它是一個(gè)由有用的工具和日常數(shù)據(jù)科學(xué)任務(wù)的擴(kuò)展組成的一個(gè)庫程序。

612《nolearn》

介紹:這個(gè)程序包容納了大量能對(duì)你完成機(jī)器學(xué)習(xí)任務(wù)有幫助的實(shí)用程序模塊。其中大量的模塊和scikit-learn一起工作,其它的通常更有用。

613《Ramp》

介紹:Ramp是一個(gè)在Python語言下制定機(jī)器學(xué)習(xí)中加快原型設(shè)計(jì)的解決方案的庫程序。他是一個(gè)輕型的pandas-based機(jī)器學(xué)習(xí)中可插入的框架,它現(xiàn)存的Python語言下的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)工具(比如scikit-learn,rpy2等)Ramp提供了一個(gè)簡單的聲明性語法探索功能從而能夠快速有效地實(shí)施算法和轉(zhuǎn)換。

614《Feature Forge》

介紹:這一系列工具通過與scikit-learn兼容的API,來創(chuàng)建和測(cè)試機(jī)器學(xué)習(xí)功能。這個(gè)庫程序提供了一組工具,它會(huì)讓你在許多機(jī)器學(xué)習(xí)程序使用中很受用。當(dāng)你使用scikit-learn這個(gè)工具時(shí),你會(huì)感覺到受到了很大的幫助。(雖然這只能在你有不同的算法時(shí)起作用。)

615《REP》

介紹:REP是以一種和諧、可再生的方式為指揮數(shù)據(jù)移動(dòng)驅(qū)動(dòng)所提供的一種環(huán)境。它有一個(gè)統(tǒng)一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一個(gè)群體以平行的方式訓(xùn)練分類器。同時(shí)它也提供了一個(gè)交互式的情節(jié)。

616《Python 學(xué)習(xí)機(jī)器樣品》

介紹:用亞馬遜的機(jī)器學(xué)習(xí)建造的簡單軟件收集。

617《Python-ELM》

介紹:這是一個(gè)在Python語言下基于scikit-learn的極端學(xué)習(xí)機(jī)器的實(shí)現(xiàn)。

618《Dimension Reduction》

介紹:電子書降維方法,此外還推薦Dimensionality Reduction A Short Tutorial、Matlab Toolbox for Dimensionality Reduction、Unsupervised Kernel Dimension Reduction

619《Datasets Used For Benchmarking Deep Learning Algorithms》

介紹:deeplearning.net整理的深度學(xué)習(xí)數(shù)據(jù)集列表.

620《Golang Natural Language Processing》

介紹:Go語言編寫的自然語言處理工具.

621《Rehabilitation of Count-based Models for Word Vector Representations》

介紹:詞頻模型對(duì)詞向量的反擊,參考Improving Distributional Similarity with Lessons Learned from Word Embeddings 。

622《Three Aspects of Predictive Modeling》

介紹:預(yù)測(cè)模型的三個(gè)方面.

623《CS224d: Deep Learning for Natural Language Processing》

介紹:斯坦福大學(xué)深度學(xué)習(xí)與自然語言處理課程,部分課程筆記詞向量、引言

624《Google Computer Vision research at CVPR 2015》

介紹:CVPR2015上Google的CV研究列表.

625《Using Deep Learning to Find Basketball Highlights》

介紹:利用(Metamind)深度學(xué)習(xí)自動(dòng)發(fā)現(xiàn)籃球賽精彩片段.

626《Learning Deep Features for Discriminative Localization》

介紹:對(duì)本土化特征學(xué)習(xí)的分析

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容