【整理】ty4z2008201《Understanding Convolutions》
【編輯】Major術(shù)業(yè)
文章鏈接地址:https://github.com/ty4z2008/Qix/blob/master/dl.md ? ? ? ??
401《How to Choose a Neural Network》
介紹:deeplearning4j官網(wǎng)提供的實(shí)際應(yīng)用場(chǎng)景NN選擇參考表,列舉了一些典型問題建議使用的神經(jīng)網(wǎng)絡(luò)
402《Deep Learning (Python, C/C++, Java, Scala, Go)》
介紹:一個(gè)深度學(xué)習(xí)項(xiàng)目,提供了Python, C/C++, Java, Scala, Go多個(gè)版本的代碼
403《Deep Learning Tutorials》
介紹:深度學(xué)習(xí)教程,github
404《自然語言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授》
介紹:自然語言處理的發(fā)展趨勢(shì)——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授.
405《FaceNet: A Unified Embedding for Face Recognition and Clustering》
介紹:Google對(duì)Facebook DeepFace的有力回?fù)簟?FaceNet,在LFW(Labeled Faces in the Wild)上達(dá)到99.63%準(zhǔn)確率(新紀(jì)錄),F(xiàn)aceNet embeddings可用于人臉識(shí)別、鑒別和聚類.
406《MLlib中的Random Forests和Boosting》
介紹:本文來自Databricks公司網(wǎng)站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們?cè)贛Llib中的分布式實(shí)現(xiàn),以及展示一些簡單的例子并建議該從何處上手.中文版.
407《Sum-Product Networks(SPN) 》
介紹:華盛頓大學(xué)Pedro Domingos團(tuán)隊(duì)的DNN,提供論文和實(shí)現(xiàn)代碼.
408《Neural Network Dependency Parser》
介紹:基于神經(jīng)網(wǎng)絡(luò)的自然語言依存關(guān)系解析器(已集成至Stanford CoreNLP),特點(diǎn)是超快、準(zhǔn)確,目前可處理中英文語料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路實(shí)現(xiàn).
409《神經(jīng)網(wǎng)絡(luò)語言模型》
介紹:本文根據(jù)神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,詳細(xì)講解神經(jīng)網(wǎng)絡(luò)語言模型在各個(gè)階段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結(jié)的特別好.
410《Classifying Spam Emails using Text and Readability Features》
介紹:經(jīng)典問題的新研究:利用文本和可讀性特征分類垃圾郵件。
411《BCI Challenge @ NER 2015》
介紹:Kaggle腦控計(jì)算機(jī)交互(BCI)競(jìng)賽優(yōu)勝方案源碼及文檔,包括完整的數(shù)據(jù)處理流程,是學(xué)習(xí)Python數(shù)據(jù)處理和Kaggle經(jīng)典參賽框架的絕佳實(shí)例
412《IPOL Journal · Image Processing On Line》
介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個(gè)算法及相應(yīng)的代碼、Demo和實(shí)驗(yàn)文檔。文本和源碼是經(jīng)過了同行評(píng)審的。IPOL是開放的科學(xué)和可重復(fù)的研究期刊。我一直想做點(diǎn)類似的工作,拉近產(chǎn)品和技術(shù)之間的距離.
413《Machine learning classification over encrypted data》
介紹:出自MIT,研究加密數(shù)據(jù)高效分類問題.
414《purine2》
介紹:新加坡LV實(shí)驗(yàn)室的神經(jīng)網(wǎng)絡(luò)并行框架Purine: A bi-graph based deep learning framework,支持構(gòu)建各種并行的架構(gòu),在多機(jī)多卡,同步更新參數(shù)的情況下基本達(dá)到線性加速。12塊Titan 20小時(shí)可以完成Googlenet的訓(xùn)練。
415《Machine Learning Resources》
介紹:這是一個(gè)機(jī)器學(xué)習(xí)資源庫,雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個(gè)由zheng Rui整理的機(jī)器學(xué)習(xí)資源.
416《Hands-on with machine learning》
介紹:Chase Davis在NICAR15上的主題報(bào)告材料,用Scikit-Learn做監(jiān)督學(xué)習(xí)的入門例子.
417《The Natural Language Processing Dictionary》
介紹:這是一本自然語言處理的詞典,從1998年開始到目前積累了成千上萬的專業(yè)詞語解釋,如果你是一位剛?cè)腴T的朋友.可以借這本詞典讓自己成長更快.
418《PageRank Approach to Ranking National Football Teams》
介紹:通過分析1930年至今的比賽數(shù)據(jù),用PageRank計(jì)算世界杯參賽球隊(duì)排行榜.
419《R Tutorial》
介紹:R語言教程,此外還推薦一個(gè)R語言教程An Introduction to R.
420《Fast unfolding of communities in large networks》
介紹:經(jīng)典老文,復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.
421《NUML》
介紹: 一個(gè)面向 .net 的開源機(jī)器學(xué)習(xí)庫,github地址
422《synaptic.Js》
介紹: 支持node.js的JS神經(jīng)網(wǎng)絡(luò)庫,可在客戶端瀏覽器中運(yùn)行,支持LSTM等 github地址
423《Machine learning for package users with R (1): Decision Tree》
介紹: 決策樹
424《Deep Learning, The Curse of Dimensionality, and Autoencoders》
介紹: 討論深度學(xué)習(xí)自動(dòng)編碼器如何有效應(yīng)對(duì)維數(shù)災(zāi)難,國內(nèi)翻譯
425《Advanced Optimization and Randomized Methods》
介紹: CMU的優(yōu)化與隨機(jī)方法課程,由A. Smola和S. Sra主講,優(yōu)化理論是機(jī)器學(xué)習(xí)的基石,值得深入學(xué)習(xí) 國內(nèi)云(視頻)
426《CS231n: Convolutional Neural Networks for Visual Recognition》
介紹: "面向視覺識(shí)別的CNN"課程設(shè)計(jì)報(bào)告集錦.近百篇,內(nèi)容涉及圖像識(shí)別應(yīng)用的各個(gè)方面
427《Topic modeling with LDA: MLlib meets GraphX》
介紹:用Spark的MLlib+GraphX做大規(guī)模LDA主題抽取.
428《Deep Learning for Multi-label Classification》
介紹: 基于深度學(xué)習(xí)的多標(biāo)簽分類,用基于RBM的DBN解決多標(biāo)簽分類(特征)問題
429《Google DeepMind publications》
介紹: DeepMind論文集錦
430《kaldi》
介紹: 一個(gè)開源語音識(shí)別工具包,它目前托管在sourceforge上面
431《Data Journalism Handbook》
介紹: 免費(fèi)電子書《數(shù)據(jù)新聞手冊(cè)》, 國內(nèi)有熱心的朋友翻譯了中文版,大家也可以在線閱讀
432《Data Mining Problems in Retail》
介紹: 零售領(lǐng)域的數(shù)據(jù)挖掘文章.
433《Understanding Convolution in Deep Learning》
介紹: 深度學(xué)習(xí)卷積概念詳解,深入淺出.
434《pandas: powerful Python data analysis toolkit》
介紹: 非常強(qiáng)大的Python的數(shù)據(jù)分析工具包.
435《Text Analytics 2015》
介紹: 2015文本分析(商業(yè))應(yīng)用綜述.
436《Deep Learning libraries and ?rst experiments with Theano》
介紹: 深度學(xué)習(xí)框架、庫調(diào)研及Theano的初步測(cè)試體會(huì)報(bào)告.
437《DEEP learning》
介紹: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人講深度學(xué)習(xí)的新書,還未定稿,線上提供Draft chapters收集反饋,超贊!強(qiáng)烈推薦.
438《simplebayes》
介紹: Python下開源可持久化樸素貝葉斯分類庫.
439《Paracel》
介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
440《HanLP:Han Language processing》
介紹: 開源漢語言處理包.
441《Simple Neural Network implementation in Ruby》
介紹: 使用Ruby實(shí)現(xiàn)簡單的神經(jīng)網(wǎng)絡(luò)例子.
442《Hacker's guide to Neural Networks》
介紹:神經(jīng)網(wǎng)絡(luò)黑客入門.
443《The Open-Source Data Science Masters》
介紹:好多數(shù)據(jù)科學(xué)家名人推薦,還有資料.
444《Text Understanding from Scratch》
介紹:實(shí)現(xiàn)項(xiàng)目已經(jīng)開源在github上面Crepe
445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
介紹:作者發(fā)現(xiàn),經(jīng)過調(diào)參,傳統(tǒng)的方法也能和word2vec取得差不多的效果。另外,無論作者怎么試,GloVe都比不過word2vec.
446《CS224d: Deep Learning for Natural Language Processing》
介紹:Stanford深度學(xué)習(xí)與自然語言處理課程,Richard Socher主講.
447《Math Essentials in Machine Learning》
介紹:機(jī)器學(xué)習(xí)中的重要數(shù)學(xué)概念.
448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
介紹:用于改進(jìn)語義表示的樹型LSTM遞歸神經(jīng)網(wǎng)絡(luò),句子級(jí)相關(guān)性判斷和情感分類效果很好.實(shí)現(xiàn)代碼.
449《Statistical Machine Learning》
介紹:卡耐基梅隆Ryan Tibshirani和Larry Wasserman開設(shè)的機(jī)器學(xué)習(xí)課程,先修課程為機(jī)器學(xué)習(xí)(10-715)和中級(jí)統(tǒng)計(jì)學(xué)(36-705),聚焦統(tǒng)計(jì)理論和方法在機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用.
450《AM207: Monte Carlo Methods, Stochastic Optimization》
介紹:《哈佛大學(xué)蒙特卡洛方法與隨機(jī)優(yōu)化課程》是哈佛應(yīng)用數(shù)學(xué)研究生課程,由V Kaynig-Fittkau、P Protopapas主講,Python程序示例,對(duì)貝葉斯推理感興趣的朋友一定要看看,提供授課視頻及課上IPN講義.
451《生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用》
介紹:生物醫(yī)學(xué)的SPARK大數(shù)據(jù)應(yīng)用.并且伯克利開源了他們的big data genomics系統(tǒng)ADAM,其他的內(nèi)容可以關(guān)注一下官方主頁.
452《ACL Anthology》
介紹:對(duì)自然語言處理技術(shù)或者機(jī)器翻譯技術(shù)感興趣的親們,請(qǐng)?jiān)谔岢鲎约号1频綗o以倫比的idea(自動(dòng)歸納翻譯規(guī)律、自動(dòng)理解語境、自動(dòng)識(shí)別語義等等)之前,請(qǐng)通過谷歌學(xué)術(shù)簡單搜一下,如果谷歌不可用,這個(gè)網(wǎng)址有這個(gè)領(lǐng)域幾大頂會(huì)的論文列表,切不可斷章取義,胡亂假設(shè).
453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
介紹:論文+代碼:基于集成方法的Twitter情感分類,實(shí)現(xiàn)代碼.
454《NIPS 2014 CIML workshop》
介紹:NIPS CiML 2014的PPT,NIPS是神經(jīng)信息處理系統(tǒng)進(jìn)展大會(huì)的英文簡稱.
455《CS231n: Convolutional Neural Networks for Visual Recognition》
介紹:斯坦福的深度學(xué)習(xí)課程的Projects 每個(gè)人都要寫一個(gè)論文級(jí)別的報(bào)告 里面有一些很有意思的應(yīng)用 大家可以看看 .
456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
介紹:R語言線性回歸多方案速度比較具體方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.
457《Back-to-Basics Weekend Reading - Machine Learning》
介紹:文中提到的三篇論文(機(jī)器學(xué)習(xí)那些事、無監(jiān)督聚類綜述、監(jiān)督分類綜述)都很經(jīng)典,Domnigos的機(jī)器學(xué)習(xí)課也很精彩
458《A Probabilistic Theory of Deep Learning》
介紹:萊斯大學(xué)(Rice University)的深度學(xué)習(xí)的概率理論.
459《Nonsensical beer reviews via Markov chains》
介紹:基于馬爾可夫鏈自動(dòng)生成啤酒評(píng)論的開源Twitter機(jī)器人,github地址.
460《Deep Learning for Natural Language Processing (without Magic)》
介紹:視頻+講義:深度學(xué)習(xí)用于自然語言處理教程(NAACL13).
461《Introduction to Data Analysis using Machine Learning》
介紹:用機(jī)器學(xué)習(xí)做數(shù)據(jù)分析,David Taylor最近在McGill University研討會(huì)上的報(bào)告,還提供了一系列講機(jī)器學(xué)習(xí)方法的ipn,很有價(jià)值 GitHub.國內(nèi)
462《Beyond Short Snippets: Deep Networks for Video Classification》
介紹:基于CNN+LSTM的視頻分類,google演示.
463《How does Quora use machine learning in 2015?》
介紹:Quora怎么用機(jī)器學(xué)習(xí).
464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》
介紹:亞馬遜在機(jī)器學(xué)習(xí)上面的一些應(yīng)用,代碼示例.
465《Parallel Machine Learning with scikit-learn and IPython》
介紹:并行機(jī)器學(xué)習(xí)指南(基于scikit-learn和IPython).notebook
466《Intro to machine learning with scikit-learn》
介紹:DataSchool的機(jī)器學(xué)習(xí)基本概念教學(xué).
467《DeepCLn》
介紹:一個(gè)基于OpenGL實(shí)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò),支持Linux及Windows系.
468《An Inside Look at the Components of a Recommendation Engine》
介紹:基于Mahout和Elasticsearch的推薦系統(tǒng).
469《Forecasting in Economics, Business, Finance and Beyond》
介紹:Francis X. Diebold的《(經(jīng)濟(jì)|商業(yè)|金融等領(lǐng)域)預(yù)測(cè)方法.
470《Time Series Econometrics - A Concise Course》
介紹:Francis X. Diebold的《時(shí)序計(jì)量經(jīng)濟(jì)學(xué)》.
471《A comparison of open source tools for sentiment analysis》
介紹:基于Yelp數(shù)據(jù)集的開源情感分析工具比較,評(píng)測(cè)覆蓋Naive Bayes、SentiWordNet、CoreNLP等 .
472《Pattern Recognition And Machine Learning》
介紹:國內(nèi)Pattern Recognition And Machine Learning讀書會(huì)資源匯總,各章pdf講稿,博客.
473《Probabilistic Data Structures for Web Analytics and Data Mining 》
介紹:用于Web分析和數(shù)據(jù)挖掘的概率數(shù)據(jù)結(jié)構(gòu).
474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》
介紹:機(jī)器學(xué)習(xí)在導(dǎo)航上面的應(yīng)用.
475《Neural Networks Demystified 》
介紹:Neural Networks Demystified系列視頻,Stephen Welch制作,純手繪風(fēng)格,淺顯易懂,國內(nèi)云.
476《swirl + DataCamp 》
介紹:{swirl}數(shù)據(jù)訓(xùn)練營:R&數(shù)據(jù)科學(xué)在線交互教程.
477《Learning to Read with Recurrent Neural Networks 》
介紹:關(guān)于深度學(xué)習(xí)和RNN的討論 Sequence to Sequence Learning with Neural Networks.
478《深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的資源》
介紹:Deep Reinforcement Learning.
479《Machine Learning with Scikit-Learn》
介紹:(PyCon2015)Scikit-Learn機(jī)器學(xué)習(xí)教程,Parallel Machine Learning with scikit-learn and IPython.
480《PDNN》
介紹:PDNN: A Python Toolkit for Deep Learning.
481《Introduction to Machine Learning》
介紹:15年春季學(xué)期CMU的機(jī)器學(xué)習(xí)課程,由Alex Smola主講,提供講義及授課視頻,很不錯(cuò).國內(nèi)鏡像.
482《Big Data Processing》
介紹:大數(shù)據(jù)處理課.內(nèi)容覆蓋流處理、MapReduce、圖算法等.
483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》
介紹:用Spark MLlib實(shí)現(xiàn)易用可擴(kuò)展的機(jī)器學(xué)習(xí),國內(nèi)鏡像.
484《Picture: A Probabilistic Programming Language for Scene Perception》
介紹:以往上千行代碼概率編程(語言)實(shí)現(xiàn)只需50行.
485《Beautiful plotting in R: A ggplot2 cheatsheet》
介紹:ggplot2速查小冊(cè)子,另外一個(gè),此外還推薦《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.
486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》
介紹:用結(jié)構(gòu)化模型來預(yù)測(cè)實(shí)時(shí)股票行情.
487《International Joint Conference on Artificial Intelligence Accepted paper》
介紹:國際人工智能聯(lián)合會(huì)議錄取論文列表,大部分論文可使用Google找到.
488《Why GEMM is at the heart of deep learning》
介紹:一般矩陣乘法(GEMM)對(duì)深度學(xué)習(xí)的重要性.
489《Distributed (Deep) Machine Learning Common》
介紹:A Community of awesome Distributed Machine Learning C++ projects.
490《Reinforcement Learning: An Introduction》
介紹:免費(fèi)電子書<強(qiáng)化學(xué)習(xí)介紹>,第一版(1998),第二版(2015草稿),相關(guān)課程資料,Reinforcement Learning.
491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》
介紹:免費(fèi)書:Azure ML使用精要.
492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介紹:A Deep Learning Tutorial: From Perceptrons to Deep Networks.
493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》
介紹:有趣的機(jī)器學(xué)習(xí):最簡明入門指南,中文版.
494《A Brief Overview of Deep Learning》
介紹:深度學(xué)習(xí)簡明介紹,中文版.
495《Wormhole》
介紹:Portable, scalable and reliable distributed machine learning.
496《convnet-benchmarks》
介紹:CNN開源實(shí)現(xiàn)橫向評(píng)測(cè),參評(píng)框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表現(xiàn)突出.
497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》
介紹:卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院語言技術(shù)系的資源大全,包括大量的NLP開源軟件工具包,基礎(chǔ)數(shù)據(jù)集,論文集,數(shù)據(jù)挖掘教程,機(jī)器學(xué)習(xí)資源.
498《Sentiment Analysis on Twitter》
介紹:Twitter情感分析工具SentiTweet,視頻+講義.
499《Machine Learning Repository @ Wash U》
介紹:華盛頓大學(xué)的Machine Learning Paper Repository.
500《Machine learning cheat sheet》
介紹:機(jī)器學(xué)習(xí)速查表.
501《Spark summit east 2015 agenda》
介紹:最新的Spark summit會(huì)議資料.
502《Learning Spark》
介紹:Ebook Learning Spark.
503《Advanced Analytics with Spark, Early Release Edition》
介紹:Ebook Advanced Analytics with Spark, Early Release Edition.
504《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:唐杰》
介紹:清華大學(xué)副教授,是圖挖掘方面的專家。他主持設(shè)計(jì)和實(shí)現(xiàn)的Arnetminer是國內(nèi)領(lǐng)先的圖挖掘系統(tǒng),該系統(tǒng)也是多個(gè)會(huì)議的支持商.
505《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:楊強(qiáng)》
介紹:遷移學(xué)習(xí)的國際領(lǐng)軍人物.
506《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:周志華》
介紹:在半監(jiān)督學(xué)習(xí),multi-label學(xué)習(xí)和集成學(xué)習(xí)方面在國際上有一定的影響力.
507《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:王海峰》
介紹:信息檢索,自然語言處理,機(jī)器翻譯方面的專家.
508《國內(nèi)機(jī)器學(xué)習(xí)算法及應(yīng)用領(lǐng)域人物篇:吳軍》
介紹:吳軍博士是當(dāng)前Google中日韓文搜索算法的主要設(shè)計(jì)者。在Google其間,他領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語言處理的項(xiàng)目,他的新個(gè)人主頁.
509《Cat Paper Collection》
介紹:喵星人相關(guān)論文集.
510《How to Evaluate Machine Learning Models, Part 1: Orientation》
介紹:如何評(píng)價(jià)機(jī)器學(xué)習(xí)模型系列文章,How to Evaluate Machine Learning Models, Part 2a: Classification Metrics,How to Evaluate Machine Learning Models, Part 2b: Ranking and Regression Metrics.
511《Building a new trends experience》
介紹:Twitter新trends的基本實(shí)現(xiàn)框架.
512《Storm Blueprints: Patterns for Distributed Real-time Computation》
介紹:Storm手冊(cè),國內(nèi)有中文翻譯版本,謝謝作者.
513《SmileMiner》
介紹:Java機(jī)器學(xué)習(xí)算法庫SmileMiner.
514《機(jī)器翻譯學(xué)術(shù)論文寫作方法和技巧》
介紹:機(jī)器翻譯學(xué)術(shù)論文寫作方法和技巧,Simon Peyton Jones的How to write a good research paper同類視頻How to Write a Great Research Paper,how to paper talk.
515《神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的Tricks之高效BP(反向傳播算法)》
介紹:神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的Tricks之高效BP,博主的其他博客也挺精彩的.
516《我和NLP的故事》
介紹:作者是NLP方向的碩士,短短幾年內(nèi)研究成果頗豐,推薦新入門的朋友閱讀.
517《The h Index for Computer Science 》
介紹:UCLA的Jens Palsberg根據(jù)Google Scholar建立了一個(gè)計(jì)算機(jī)領(lǐng)域的H-index牛人列表,我們熟悉的各個(gè)領(lǐng)域的大牛絕大多數(shù)都在榜上,包括1位諾貝爾獎(jiǎng)得主,35位圖靈獎(jiǎng)得主,近百位美國工程院/科學(xué)院院士,300多位ACM Fellow,在這里推薦的原因是大家可以在google通過搜索牛人的名字來獲取更多的資源,這份資料很寶貴.
518《Structured Learning for Taxonomy Induction with Belief Propagation》
介紹:用大型語料庫學(xué)習(xí)概念的層次關(guān)系,如鳥是鸚鵡的上級(jí),鸚鵡是虎皮鸚鵡的上級(jí)。創(chuàng)新性在于模型構(gòu)造,用因子圖刻畫概念之間依存關(guān)系,因引入兄弟關(guān)系,圖有環(huán),所以用有環(huán)擴(kuò)散(loopy propagation)迭代計(jì)算邊際概率(marginal probability).
519《Bayesian analysis》
介紹: 這是一款貝葉斯分析的商業(yè)軟件,官方寫的貝葉斯分析的手冊(cè)有250多頁,雖然R語言 已經(jīng)有類似的項(xiàng)目,但畢竟可以增加一個(gè)可選項(xiàng).
520《deep net highlights from 2014》
介紹:deep net highlights from 2014.
521《Fast R-CNN》
介紹:This paper proposes Fast R-CNN, a clean and fast framework for object detection.
522《Fingerprinting Images for Near-Duplicate Detection》
介紹:圖像指紋的重復(fù)識(shí)別,作者源碼,國內(nèi)翻譯版本.
523《The Computer Vision Industry 》
介紹:提供計(jì)算機(jī)視覺、機(jī)器視覺應(yīng)用的公司信息匯總.應(yīng)用領(lǐng)域包括:自動(dòng)輔助駕駛和交通管理、眼球和頭部跟蹤、影視運(yùn)動(dòng)分析、影視業(yè)、手勢(shì)識(shí)別、通用視覺系統(tǒng)、各種工業(yè)自動(dòng)化和檢驗(yàn)、醫(yī)藥和生物、移動(dòng)設(shè)備目標(biāo)識(shí)別和AR、人群跟蹤、攝像、安全監(jiān)控、生物監(jiān)控、三維建模、web和云應(yīng)用.
524《Seaborn: statistical data visualization》
介紹:Python版可視化數(shù)據(jù)統(tǒng)計(jì)開源庫.
525《IPython lecture notes for OCW MIT 18.06》
介紹:麻省理工Gilbert Strang線性代數(shù)課程筆記,Gilbert Strang《Linear Algebra》課程主頁視頻+講義.
526《Canova: A Vectorization Lib for ML》
介紹:面向機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的數(shù)據(jù)向量化工具Canova,github, 支持CSV文件、MNIST數(shù)據(jù)、TF-IDF/Bag of Words/word2vec文本向量化.
527《DZone Refcardz: Distributed Machine Learning with Apache Mahout》
介紹:快速入門:基于Apache Mahout的分布式機(jī)器學(xué)習(xí).
528《Learning scikit-learn: Machine Learning in Python》
介紹:基于scikit-learn講解了一些機(jī)器學(xué)習(xí)技術(shù),如SVM,NB,PCA,DT,以及特征工程、特征選擇和模型選擇問題.
529《Lightning fast Machine Learning with Spark》
介紹:基于Spark的高效機(jī)器學(xué)習(xí),視頻地址.
530《How we’re using machine learning to fight shell selling》
介紹:WePay用機(jī)器學(xué)習(xí)對(duì)抗信用卡"shell selling"詐騙.
531《Data Scientists Thoughts that Inspired Me》
介紹:16位數(shù)據(jù)科學(xué)家語錄精選.
532《Deep learning applications and challenges in big data analytics》
介紹:深度學(xué)習(xí)在大數(shù)據(jù)分析領(lǐng)域的應(yīng)用和挑戰(zhàn).
533《Free book:Machine Learning,Mathematics》
介紹:免費(fèi)的機(jī)器學(xué)習(xí)與數(shù)學(xué)書籍,除此之外還有其他的免費(fèi)編程書籍,編程語言,設(shè)計(jì),操作系統(tǒng)等.
534《Object detection via a multi-region & semantic segmentation-aware CNN model》
介紹:一篇關(guān)于CNN模型對(duì)象識(shí)別Paper.
535《A Statistical View of Deep Learning (V): Generalisation and Regularisation》
介紹:深度學(xué)習(xí)的統(tǒng)計(jì)分析V:泛化和正則化.
536《Highway Networks》
介紹:用SGD能高效完成訓(xùn)練的大規(guī)模(多層)深度網(wǎng)絡(luò)HN.
537《What I Read For Deep-Learning》
介紹:深度學(xué)習(xí)解讀文章.
538《An Introduction to Recommendation Engines》
介紹:Coursera上的推薦系統(tǒng)導(dǎo)論(Introduction to Recommender Systems)公開課.
539《Stanford Machine Learning》
介紹:Andrew Ng經(jīng)典機(jī)器學(xué)習(xí)課程筆記.
540《ICLR 2015》
介紹:ICLR 2015見聞錄,博客的其他機(jī)器學(xué)習(xí)文章也不錯(cuò).
541《Stanford Machine Learning》
介紹:推薦系統(tǒng)"個(gè)性化語義排序"模型.
542《The More Excited We Are, The Shorter We Tweet》
介紹:激情時(shí)分更惜字——MIT的最新Twitter研究結(jié)果.
543《蘇州大學(xué)人類語言技術(shù)研究論文主頁》
介紹:蘇州大學(xué)人類語言技術(shù)研究相關(guān)論文.
544《Neural Turing Machines implementation》
介紹:實(shí)現(xiàn)神經(jīng)圖靈機(jī)(NTM),項(xiàng)目地址,此外推薦相關(guān)神經(jīng)圖靈機(jī)算法.
545《Computer Vision - CSE 559A, Spring 2015》
介紹:華盛頓大學(xué)的機(jī)器視覺(2015),參考資料Computer Vision: Algorithms and Applications.
546《Mining of Massive Datasets》
介紹:"Mining of Massive Datasets"發(fā)布第二版,Jure Leskovec, Anand Rajaraman, Jeff Ullman 新版增加Jure Leskovec作為合作作者,新增社交網(wǎng)絡(luò)圖數(shù)據(jù)挖掘、降維和大規(guī)模機(jī)器學(xué)習(xí)三章,電子版依舊免費(fèi).
547《Learning Deep Learning》
介紹:一個(gè)深度學(xué)習(xí)資源頁,資料很豐富.
548《Learning Deep Learning》
介紹:免費(fèi)電子書"Learning Deep Learning".
549《Tutorial: Machine Learning for Astronomy with Scikit-learn》
介紹:Machine Learning for Astronomy with scikit-learn.
550《An Introduction to Random Forests for Beginners》
介紹:免費(fèi)電子書"隨機(jī)森林入門指南".
551《Top 10 data mining algorithms in plain English》
介紹:白話數(shù)據(jù)挖掘十大算法.
552《An Inside Look at the Components of a Recommendation Engine》
介紹:基于Mahout和Elasticsearch的推薦系統(tǒng),國內(nèi)譯版.
553《Advances in Extreme Learning Machines》
介紹:博士學(xué)位論文:ELM研究進(jìn)展.
554《10-minute tour of pandas》
介紹:Pandas十分鐘速覽,ipn.
555《Data doesn't grow in tables: harvesting journalistic insight from documents》
介紹:面向數(shù)據(jù)新聞的文本挖掘.
556《Time-lapse Mining from Internet Photos》
介紹:用網(wǎng)絡(luò)圖片合成延時(shí)視頻(SIGGRAPH 2015).
557《The Curse of Dimensionality in classification》
介紹:分類系統(tǒng)的維數(shù)災(zāi)難.
558《Deep Learning vs Big Data: Who owns what?》
介紹:深度學(xué)習(xí)vs.大數(shù)據(jù)——從數(shù)據(jù)到知識(shí):版權(quán)的思考,[翻譯版](http://www.csdn.net/article/2015-05-19/2824707
559《A Primer on Predictive Models》
介紹:預(yù)測(cè)模型入門.
560《Demistifying LSTM Neural Networks》
介紹:深入淺出LSTM.
561《ICLR 2015》
介紹:2015年ICLR會(huì)議視頻與講義.
562《On Visualizing Data Well》
介紹:Ben Jones的數(shù)據(jù)可視化建議.
563《Decoding Dimensionality Reduction, PCA and SVD》
介紹:解讀數(shù)據(jù)降維/PCA/SVD.
564《Supervised learning superstitions cheat sheet》
介紹:IPN:監(jiān)督學(xué)習(xí)方法示例/對(duì)比參考表,覆蓋logistic回歸, 決策樹, SVM, KNN, Naive Bayes等方法.
565《DopeLearning: A Computational Approach to Rap Lyrics Generation》
介紹:基于RankSVM和DNN自動(dòng)(重組)生成Rap歌詞.
566《An Introduction to Random Indexing》
介紹:隨機(jī)索引RI詞空間模型專題.
567《VDiscover》
介紹:基于機(jī)器學(xué)習(xí)的漏洞檢測(cè)工具VDiscover.
568《Minerva》
介紹:深度學(xué)習(xí)系統(tǒng)minerva。擁有python編程接口。多GPU幾乎達(dá)到線性加速。在4塊GPU上能在4天內(nèi)將GoogLeNet訓(xùn)練到68.7%的top-1以及89.0%的top-5準(zhǔn)確率。和同為dmlc項(xiàng)目的cxxnet相比,采用動(dòng)態(tài)數(shù)據(jù)流引擎,提供更多靈活性。未來將和cxxnet一起整合為mxnet項(xiàng)目,互取優(yōu)勢(shì).
569《CVPR 2015 paper》
介紹:2015年國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議paper.
570《What are the advantages of different classification algorithms?》
介紹:Netflix工程總監(jiān)眼中的分類算法:深度學(xué)習(xí)優(yōu)先級(jí)最低,中文版.
571《Results for Microsoft COCO Image Captioning Challenge》
介紹:Codalab圖像標(biāo)注競(jìng)賽排行+各家論文,Reddit上flukeskywalker整理了各家技術(shù)相關(guān)論文.
572《Caffe con Troll: Shallow Ideas to Speed Up Deep Learning》
介紹:基于Caffe的加速深度學(xué)習(xí)系統(tǒng)CcT.
573《Low precision storage for deep learning》
介紹:深度學(xué)習(xí)(模型)低精度(訓(xùn)練與)存儲(chǔ).
574《Model-Based Machine Learning (Early Access)》
介紹:新書預(yù)覽:模型機(jī)器學(xué)習(xí).
575《Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems》
介紹:免費(fèi)電子書多臂老虎機(jī),此外推薦Introduction to Bandits: Algorithms and Theory.
576《Kaggle R Tutorial on Machine Learing》
介紹:基于Kaggle's Titanic Competition的交互式R機(jī)器學(xué)習(xí)教程,介紹《Interactive R Tutorial: Machine Learning for the Titanic Competition》.
577《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
介紹:Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列.
578《Introduction to Neural Machine Translation with GPUs 》
介紹:神經(jīng)(感知)機(jī)器翻譯介紹.
579《Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning》
介紹:Andrew Ng關(guān)于深度學(xué)習(xí)/自學(xué)習(xí)/無監(jiān)督特征學(xué)習(xí)的報(bào)告,國內(nèi)云.
580《Recurrent Neural Network Training with Dark Knowledge Transfer》
介紹:論文:通過潛在知識(shí)遷移訓(xùn)練RNN.
581《Show Me The Money》
介紹:面向金融數(shù)據(jù)的情感分析工具.
582《pyLDAvis》
介紹:(Python)主題模型交互可視化庫pyLDAvis.
583《Logistic Regression and Gradient Descent》
介紹:Logistic回歸與優(yōu)化實(shí)例教程.
584《賈揚(yáng)清微信講座記錄》
介紹:賈揚(yáng)清(谷歌大腦科學(xué)家、caffe締造者)微信講座記錄.
585《sketch》
介紹:Theano/Blocks實(shí)現(xiàn)RNN手寫字符串生成sketch.
586《Web Scale Document Clustering: Clustering 733 Million Web Pages》
介紹:基于TopSig的海量(7億+)網(wǎng)頁聚類.
587《NAACL 2015 Proceedings on ACL Anthology》
介紹:NAACL 2015 論文papers.
588《Stock Forecasting With Machine Learning - Seven Possible Errors》
介紹:機(jī)器學(xué)習(xí)預(yù)測(cè)股市的七個(gè)問題.
589《Are there any good resources for learning about neural networks?》
介紹:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)資料推薦.
590《A Critical Review of Recurrent Neural Networks for Sequence Learning》
介紹:面向序列學(xué)習(xí)的RNN綜述.
591《Handling and Processing Strings in R》
介紹:R文本處理手冊(cè).
592《Must-watch videos about Python》
介紹:“必看”的Python視頻集錦.
593《The Google Stack》
介紹:Google(基礎(chǔ)結(jié)構(gòu))棧.
594《Randomized Algorithms for Matrices and Data》
介紹:矩陣和數(shù)據(jù)的隨機(jī)算法(UC Berkeley 2013).
595《Intermediate R》
介紹:DataCamp中級(jí)R語言教程.
596《Topology Without Tears》
介紹:免費(fèi)電子書:輕松掌握拓?fù)鋵W(xué),中文版.
597《Information Theory, Pattern Recognition, and Neural Networks》
介紹:Book,video.
598《Scikit-learn》
介紹:Scikit-learn 是基于Scipy為機(jī)器學(xué)習(xí)建造的的一個(gè)Python模塊,他的特色就是多樣化的分類,回歸和聚類的算法包括支持向量機(jī),邏輯回歸,樸素貝葉斯分類器,隨機(jī)森林,Gradient Boosting,聚類算法和DBSCAN。而且也設(shè)計(jì)出了Python numerical和scientific libraries Numpy and Scipy
599《Pylearn2》
介紹:Pylearn是一個(gè)讓機(jī)器學(xué)習(xí)研究簡單化的基于Theano的庫程序。
600《NuPIC》
介紹:NuPIC是一個(gè)以HTM學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)。HTM是皮層的精確計(jì)算方法。HTM的核心是基于時(shí)間的持續(xù)學(xué)習(xí)算法和儲(chǔ)存和撤銷的時(shí)空模式。NuPIC適合于各種各樣的問題,尤其是檢測(cè)異常和預(yù)測(cè)的流數(shù)據(jù)來源。
601《Nilearn》
介紹:Nilearn 是一個(gè)能夠快速統(tǒng)計(jì)學(xué)習(xí)神經(jīng)影像數(shù)據(jù)的Python模塊。它利用Python語言中的scikit-learn 工具箱和一些進(jìn)行預(yù)測(cè)建模,分類,解碼,連通性分析的應(yīng)用程序來進(jìn)行多元的統(tǒng)計(jì)。
602《PyBrain》
介紹:Pybrain是基于Python語言強(qiáng)化學(xué)習(xí),人工智能,神經(jīng)網(wǎng)絡(luò)庫的簡稱。 它的目標(biāo)是提供靈活、容易使用并且強(qiáng)大的機(jī)器學(xué)習(xí)算法和進(jìn)行各種各樣的預(yù)定義的環(huán)境中測(cè)試來比較你的算法。
603《Pattern》
介紹:Pattern 是Python語言下的一個(gè)網(wǎng)絡(luò)挖掘模塊。它為數(shù)據(jù)挖掘,自然語言處理,網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)提供工具。它支持向量空間模型、聚類、支持向量機(jī)和感知機(jī)并且用KNN分類法進(jìn)行分類。
604《Fuel》
介紹:Fuel為你的機(jī)器學(xué)習(xí)模型提供數(shù)據(jù)。他有一個(gè)共享如MNIST, CIFAR-10 (圖片數(shù)據(jù)集), Google’s One Billion Words (文字)這類數(shù)據(jù)集的接口。你使用他來通過很多種的方式來替代自己的數(shù)據(jù)。
605《Bob》
介紹:Bob是一個(gè)免費(fèi)的信號(hào)處理和機(jī)器學(xué)習(xí)的工具。它的工具箱是用Python和C++語言共同編寫的,它的設(shè)計(jì)目的是變得更加高效并且減少開發(fā)時(shí)間,它是由處理圖像工具,音頻和視頻處理、機(jī)器學(xué)習(xí)和模式識(shí)別的大量軟件包構(gòu)成的。
606《Skdata》
介紹:Skdata是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的數(shù)據(jù)集的庫程序。這個(gè)模塊對(duì)于玩具問題,流行的計(jì)算機(jī)視覺和自然語言的數(shù)據(jù)集提供標(biāo)準(zhǔn)的Python語言的使用。
607《MILK》
介紹:MILK是Python語言下的機(jī)器學(xué)習(xí)工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機(jī)森林,決策樹中使用監(jiān)督分類法。 它還執(zhí)行特征選擇。 這些分類器在許多方面相結(jié)合,可以形成不同的例如無監(jiān)督學(xué)習(xí)、密切關(guān)系金傳播和由MILK支持的K-means聚類等分類系統(tǒng)。
608《IEPY》
介紹:IEPY是一個(gè)專注于關(guān)系抽取的開源性信息抽取工具。它主要針對(duì)的是需要對(duì)大型數(shù)據(jù)集進(jìn)行信息提取的用戶和想要嘗試新的算法的科學(xué)家。
609《Quepy》
介紹:Quepy是通過改變自然語言問題從而在數(shù)據(jù)庫查詢語言中進(jìn)行查詢的一個(gè)Python框架。他可以簡單的被定義為在自然語言和數(shù)據(jù)庫查詢中不同類型的問題。所以,你不用編碼就可以建立你自己的一個(gè)用自然語言進(jìn)入你的數(shù)據(jù)庫的系統(tǒng)。現(xiàn)在Quepy提供對(duì)于Sparql和MQL查詢語言的支持。并且計(jì)劃將它延伸到其他的數(shù)據(jù)庫查詢語言。
610《Hebel》
介紹:Hebel是在Python語言中對(duì)于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的一個(gè)庫程序,它使用的是通過PyCUDA來進(jìn)行GPU和CUDA的加速。它是最重要的神經(jīng)網(wǎng)絡(luò)模型的類型的工具而且能提供一些不同的活動(dòng)函數(shù)的激活功能,例如動(dòng)力,涅斯捷羅夫動(dòng)力,信號(hào)丟失和停止法。
611《mlxtend》
介紹:它是一個(gè)由有用的工具和日常數(shù)據(jù)科學(xué)任務(wù)的擴(kuò)展組成的一個(gè)庫程序。
612《nolearn》
介紹:這個(gè)程序包容納了大量能對(duì)你完成機(jī)器學(xué)習(xí)任務(wù)有幫助的實(shí)用程序模塊。其中大量的模塊和scikit-learn一起工作,其它的通常更有用。
613《Ramp》
介紹:Ramp是一個(gè)在Python語言下制定機(jī)器學(xué)習(xí)中加快原型設(shè)計(jì)的解決方案的庫程序。他是一個(gè)輕型的pandas-based機(jī)器學(xué)習(xí)中可插入的框架,它現(xiàn)存的Python語言下的機(jī)器學(xué)習(xí)和統(tǒng)計(jì)工具(比如scikit-learn,rpy2等)Ramp提供了一個(gè)簡單的聲明性語法探索功能從而能夠快速有效地實(shí)施算法和轉(zhuǎn)換。
614《Feature Forge》
介紹:這一系列工具通過與scikit-learn兼容的API,來創(chuàng)建和測(cè)試機(jī)器學(xué)習(xí)功能。這個(gè)庫程序提供了一組工具,它會(huì)讓你在許多機(jī)器學(xué)習(xí)程序使用中很受用。當(dāng)你使用scikit-learn這個(gè)工具時(shí),你會(huì)感覺到受到了很大的幫助。(雖然這只能在你有不同的算法時(shí)起作用。)
615《REP》
介紹:REP是以一種和諧、可再生的方式為指揮數(shù)據(jù)移動(dòng)驅(qū)動(dòng)所提供的一種環(huán)境。它有一個(gè)統(tǒng)一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一個(gè)群體以平行的方式訓(xùn)練分類器。同時(shí)它也提供了一個(gè)交互式的情節(jié)。
616《Python 學(xué)習(xí)機(jī)器樣品》
介紹:用亞馬遜的機(jī)器學(xué)習(xí)建造的簡單軟件收集。
617《Python-ELM》
介紹:這是一個(gè)在Python語言下基于scikit-learn的極端學(xué)習(xí)機(jī)器的實(shí)現(xiàn)。
618《Dimension Reduction》
介紹:電子書降維方法,此外還推薦Dimensionality Reduction A Short Tutorial、Matlab Toolbox for Dimensionality Reduction、Unsupervised Kernel Dimension Reduction
619《Datasets Used For Benchmarking Deep Learning Algorithms》
介紹:deeplearning.net整理的深度學(xué)習(xí)數(shù)據(jù)集列表.
620《Golang Natural Language Processing》
介紹:Go語言編寫的自然語言處理工具.
621《Rehabilitation of Count-based Models for Word Vector Representations》
介紹:詞頻模型對(duì)詞向量的反擊,參考Improving Distributional Similarity with Lessons Learned from Word Embeddings 。
622《Three Aspects of Predictive Modeling》
介紹:預(yù)測(cè)模型的三個(gè)方面.
623《CS224d: Deep Learning for Natural Language Processing》
介紹:斯坦福大學(xué)深度學(xué)習(xí)與自然語言處理課程,部分課程筆記詞向量、引言
624《Google Computer Vision research at CVPR 2015》
介紹:CVPR2015上Google的CV研究列表.
625《Using Deep Learning to Find Basketball Highlights》
介紹:利用(Metamind)深度學(xué)習(xí)自動(dòng)發(fā)現(xiàn)籃球賽精彩片段.
626《Learning Deep Features for Discriminative Localization》
介紹:對(duì)本土化特征學(xué)習(xí)的分析