機(jī)器學(xué)習(xí)各語(yǔ)言領(lǐng)域工具庫(kù)中文版匯總

** 轉(zhuǎn)載自URl-team

本文鏈接地址: 機(jī)器學(xué)習(xí)各語(yǔ)言領(lǐng)域工具庫(kù)中文版匯總

主要資源來(lái)自TensorFlow中文社區(qū),翻譯借助谷歌翻譯,僅用于資源分享。
以下是根據(jù)不同語(yǔ)言類型和應(yīng)用領(lǐng)域收集的各類工具庫(kù),持續(xù)更新中。

C

通用機(jī)器學(xué)習(xí)

  • 推薦人 -一個(gè)產(chǎn)品推薦的?語(yǔ)言庫(kù),利用了協(xié)同過濾。

計(jì)算機(jī)視覺

  • CCV – C / Cached /核心計(jì)算機(jī)視覺庫(kù),是一個(gè)現(xiàn)代化的計(jì)算機(jī)視覺庫(kù)。
  • VLFeat – VLFeat是開源的計(jì)算機(jī)視覺算法庫(kù),有Matlab工具箱。

C ++

計(jì)算機(jī)視覺

  • OpenCV – 最常用的視覺庫(kù)。有C ++,C,Python以及Java接口),支持Windows,Linux,Android和Mac OS。
  • DLib – DLib有C ++和Python臉部識(shí)別和物體檢測(cè)接口。
  • EBLearn – Eblearn是一個(gè)面向?qū)ο蟮腃 ++庫(kù),實(shí)現(xiàn)了各種機(jī)器學(xué)習(xí)模型。
  • VIGRA – VIGRA是一個(gè)跨平臺(tái)的機(jī)器視覺和機(jī)器學(xué)習(xí)庫(kù),可以處理任意維度的數(shù)據(jù),有Python接口。

通用機(jī)器學(xué)習(xí)

  • MLPack – 可拓展的C ++機(jī)器學(xué)習(xí)庫(kù)。
  • DLib – 設(shè)計(jì)為方便嵌入到其他系統(tǒng)中。
  • encog-CPP
  • 鯊魚
  • Vowpal Wabbit(VW) – 快速的核心外學(xué)習(xí)系統(tǒng)。
  • sofia-ml – 快速增量算法套件。
  • 幕府將軍 – 學(xué)徒機(jī)器學(xué)習(xí)工具箱
  • Caffe – 深度學(xué)習(xí)框架,結(jié)構(gòu)清晰,可讀性好,速度快。
  • CXXNET – 精簡(jiǎn)的框架,核心代碼不到1000行。
  • XGBoost – 為并行計(jì)算優(yōu)化過的梯度提升庫(kù)。
  • CUDA – 這是一個(gè)快速的C ++ / CUDA實(shí)現(xiàn)卷積[DEEP LEARNING]
  • Stan – 一種使用哈密爾頓蒙特卡洛取樣執(zhí)行完全貝葉斯統(tǒng)計(jì)推理的概率編程語(yǔ)言
  • BanditLib – 一個(gè)簡(jiǎn)單的多武裝強(qiáng)盜圖書館。
  • Timbl – 實(shí)現(xiàn)了多個(gè)基于內(nèi)存的算法,其中IB1-IG(KNN分類算法)和IGTree(決策樹)在NLP中廣泛應(yīng)用。

自然語(yǔ)言處理

  • MIT信息提取工具包 – C,C ++和Python工具,用來(lái)命名實(shí)體識(shí)別和關(guān)系抽取。
  • CRF ++ – 條件隨機(jī)場(chǎng)的開源實(shí)現(xiàn),可以用作分詞,詞性標(biāo)注等。
  • CRFsuite – CRFsuite是條件隨機(jī)場(chǎng)的實(shí)現(xiàn),可以用作詞性標(biāo)注等。
  • BLLIP解析器 – 即Charniak-Johnson解析器。
  • colibri-core – 一組C ++庫(kù),命令行工具以及Python綁定,高效實(shí)現(xiàn)了n-gram和skipgrams。
  • ucto – 多語(yǔ)言tokenizer,支持面向Unicode的正則表達(dá)式,支持FoLiA格式。
  • libfoliaFoLiA格式的 C ++庫(kù)
  • MeTAMeTA:ModErn文本分析從巨量文本中挖掘數(shù)據(jù)。

機(jī)器翻譯

語(yǔ)音識(shí)別

  • Kaldi – Kaldi是一個(gè)C ++工具,以Apache許可證V2.0發(fā)布.Kaldi適用于語(yǔ)音識(shí)別的研究。

序列分析

  • ToPS – 這是一個(gè)面向?qū)ο蟮目蚣?,有助于在用戶定義的字母表上整合序列的概率模型。

Java

自然語(yǔ)言處理

  • Cortical.io – Retina:此API執(zhí)行復(fù)雜的NLP操作(消歧義,分類,流文本過濾等),快速,直觀如同大腦一般。
  • CoreNLP – Stanford CoreNLP提供了一組自然語(yǔ)言分析工具,可采取原始英語(yǔ)文本輸入并給出單詞的基本形式。
  • 斯坦福解析器 – 解析器是一個(gè)程序,能分析出句子的語(yǔ)法結(jié)構(gòu)。
  • Stanford POS Tagger – 詞性標(biāo)注器
  • 斯坦福大學(xué)名稱實(shí)體識(shí)別器 – 斯坦福大學(xué)NER是一個(gè)Java實(shí)現(xiàn)的命名實(shí)體識(shí)別器。
  • Stanford Word Segmenter – 原始文本的令牌化是許多NLP任務(wù)的標(biāo)準(zhǔn)預(yù)處理步驟。
  • Tregex,Tsurgeon和Semgrex – Tregex是匹配樹模式的工具,基于樹的關(guān)系和正則表達(dá)式的節(jié)點(diǎn)匹配(“樹正則表達(dá)式”的縮寫)。
  • 斯坦福Phrasal:基于短語(yǔ)的翻譯系統(tǒng)
  • 斯坦福英語(yǔ)Tokenizer – Stanford Phrasal是最先進(jìn)的統(tǒng)計(jì)的基于短語(yǔ)的機(jī)器翻譯系統(tǒng),用Java編寫。
  • 斯坦福令牌正則表達(dá)式標(biāo)記器將文本劃分成一系列令牌,大致對(duì)應(yīng)于“單詞”
  • 斯坦福時(shí)代標(biāo)簽 – SUTime是識(shí)別和規(guī)范時(shí)間表達(dá)式的庫(kù)。
  • 斯坦福SPIED – 從種子集開始,迭代使用模式,從未標(biāo)注文本中習(xí)得實(shí)體。
  • 斯坦福主題建模工具箱 – 主題建模工具,社會(huì)學(xué)家用它分析的數(shù)據(jù)集。
  • Twitter Text Java – Java實(shí)現(xiàn)的Twitter文本處理庫(kù)。
  • MALLET – 基于Java的軟件包,包括統(tǒng)計(jì)自然語(yǔ)言處理,文檔分類,聚類,主題建模,信息提取,以及其它機(jī)器學(xué)習(xí)應(yīng)用。
  • OpenNLP – 一個(gè)基于機(jī)器學(xué)習(xí)的自然語(yǔ)言處理的工具包。
  • LingPipe – 計(jì)算語(yǔ)言學(xué)工具包。
  • ClearTK – ClearTK提供了開發(fā)統(tǒng)計(jì)自然語(yǔ)言處理組件的框架,其建立在Apache UIMA之上。
  • Apache cTAKES – Apache臨床文本分析及知識(shí)提取系統(tǒng)(cTAKES)是從電子病歷,臨床文本中進(jìn)行信息抽取的一個(gè)開源系統(tǒng)。

通用機(jī)器學(xué)習(xí)

  • 氣溶膠 – Airbnb從頭開始設(shè)計(jì)的機(jī)器學(xué)習(xí)庫(kù),易用性好。
  • Datumbox – 機(jī)器學(xué)習(xí)和統(tǒng)計(jì)應(yīng)用程序的快速開發(fā)框架。
  • ELKI – 數(shù)據(jù)挖掘工具。(非監(jiān)督學(xué)習(xí):聚類,離群點(diǎn)檢測(cè)等。)
  • Encog中包含用于創(chuàng)建各種網(wǎng)絡(luò),以及規(guī)范和處理數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)Encog訓(xùn)練采用多線程彈性的傳播方式。Encog還可以利用GPU的進(jìn)一步加快處理時(shí)間。有基于GUI的工作臺(tái)。
  • H2O – 機(jī)器學(xué)習(xí)引擎,支持Hadoop,Spark等分布式系統(tǒng)和個(gè)人電腦,可以通過R,Python,Scala,REST / JSON調(diào)用API。
  • htm.java – 通用機(jī)器學(xué)習(xí)庫(kù),使用Numenta的皮質(zhì)學(xué)習(xí)算法
  • Java-deeplearning – 分布式深度學(xué)習(xí)平臺(tái)Java,Clojure,Scala
  • JAVA-ML – Java通用機(jī)器學(xué)習(xí)庫(kù),所有算法統(tǒng)一接口。
  • JSAT – 具有很多分類,回歸,聚類等機(jī)器學(xué)習(xí)算法。
  • Mahout – 分布式機(jī)器學(xué)習(xí)工具。
  • Meka – 一個(gè)開源實(shí)現(xiàn)的多標(biāo)簽分類和評(píng)估方法。
  • Apache Spark中的 MLlib – Spark分布式機(jī)器學(xué)習(xí)庫(kù)
  • Neuroph – 輕量級(jí)Java神經(jīng)網(wǎng)絡(luò)框架
  • ORYX – Lambda架構(gòu)框架,使用Apache Spark和Apache Kafka實(shí)現(xiàn)實(shí)時(shí)大規(guī)模機(jī)器學(xué)習(xí)。
  • RankLib排序算法學(xué)習(xí)庫(kù)。
  • 斯坦福分類器 – 分類器是一種機(jī)器學(xué)習(xí)工具,它將獲取數(shù)據(jù)項(xiàng)并將它們放入k類之一。
  • SmileMiner – 統(tǒng)計(jì)機(jī)器智能和學(xué)習(xí)引擎
  • SystemML – 靈活的,可擴(kuò)展的機(jī)器學(xué)習(xí)語(yǔ)言。
  • WalnutiQ – 面向?qū)ο蟮娜四X模型
  • Weka – WEKA是機(jī)器學(xué)習(xí)算法用于數(shù)據(jù)挖掘任務(wù)的算法集合。

語(yǔ)音識(shí)別

  • CMU Sphinx – 開源工具包,用于語(yǔ)音識(shí)別,完全基于Java的語(yǔ)音識(shí)別庫(kù)。

數(shù)據(jù)分析,可視化

深度學(xué)習(xí)

  • Deeplearning4j – 可擴(kuò)展的產(chǎn)業(yè)化的深度學(xué)習(xí),利用并行的GPU。

Python

計(jì)算機(jī)視覺

  • Scikit-Image – Python中的圖像處理算法的集合。
  • SimpleCV – 一個(gè)開源的計(jì)算機(jī)視覺框架,允許訪問幾個(gè)高性能計(jì)算機(jī)視覺庫(kù),如OpenCV??梢赃\(yùn)行在Mac,Windows和Ubuntu Linux操作系統(tǒng)上。
  • Vigranumpy – 計(jì)算機(jī)視覺庫(kù)VIGRA C ++的Python綁定。

自然語(yǔ)言處理

  • NLTK – 構(gòu)建與人類語(yǔ)言數(shù)據(jù)相關(guān)工作的Python程序的領(lǐng)先平臺(tái)。
  • 模式 – 基于Python的Web挖掘模塊。它有自然語(yǔ)言處理,機(jī)器學(xué)習(xí)等工具。
  • Quepy – 將自然語(yǔ)言問題轉(zhuǎn)換成數(shù)據(jù)庫(kù)查詢語(yǔ)言。
  • TextBlob – 為普通的自然語(yǔ)言處理(NLP)任務(wù)提供一致的API。構(gòu)建于NLTK和Pattern上,并且很好地與兩者交互。
  • YAlign – 句子對(duì)齊工具,從對(duì)照語(yǔ)料中抽取并行句子。
  • jieba – 中文分詞工具
  • SnowNLP – 中文文本處理庫(kù)。
  • loso – 中文分詞工具
  • 天才 – 基于條件隨機(jī)場(chǎng)的中文分詞工具
  • KoNLPy韓語(yǔ)自然語(yǔ)言處理
  • 堅(jiān)果 – 自然語(yǔ)言理解工具
  • Rosetta – 文字處理工具和包裝紙(例如Vowpal Wabbit)
  • BLLIP解析器 – BLLIP自然語(yǔ)言解析器的Python綁定(即Charniak-Johnson解析器)
  • PyNLPl – Python的自然語(yǔ)言處理庫(kù)。還包含用于解析常見NLP格式的工具,如FoLiA,以及ARPA語(yǔ)言模型,Moses短語(yǔ),GIZA ++對(duì)齊等。
  • python-ucto – ucto(面向unicode的基于規(guī)則的tokenizer)的Python綁定
  • python-frog – Frog的Python綁定。荷蘭語(yǔ)的詞性標(biāo)注,lemmatisation,依存分析,NER。
  • python-zparZPar的Python綁定(英文的基于統(tǒng)計(jì)的詞性標(biāo)注,constiuency解析器和依賴解析器)
  • colibri-core – 高效提取n-gram和skipgrams的C ++庫(kù)的Python綁定
  • spaCy – 工業(yè)級(jí)NLP與Python和Cython。
  • PyStanfordDependencies – 將Penn Treebank樹轉(zhuǎn)換到Stanford依存樹的Python接口。

通用機(jī)器學(xué)習(xí)

  • 機(jī)器學(xué)習(xí) – 構(gòu)建和Web界面, 程序化界面兼容的支持向量機(jī)API。相應(yīng)的數(shù)據(jù)集存儲(chǔ)到一個(gè)SQL數(shù)據(jù)庫(kù),然后生成用于預(yù)測(cè)的模型,存儲(chǔ)到一個(gè)的NoSQL的數(shù)據(jù)庫(kù)。
  • XGBoost – eXtreme Gradient Boosting(Tree)庫(kù)的Python綁定
  • Featureforge一組工具,用于創(chuàng)建和測(cè)試機(jī)器學(xué)習(xí)的特征,具有與scikit學(xué)習(xí)兼容的API
  • scikit-learning – 基于SciPy的機(jī)器學(xué)習(xí)的Python模塊。
  • 度量學(xué)習(xí) – 度量學(xué)習(xí)的Python模塊
  • SimpleAI – 實(shí)現(xiàn)了“人工智能現(xiàn)代方法”一書中描述的許多人工智能算法。它著重于提供一個(gè)易于使用的,文檔良好的和經(jīng)過測(cè)試的庫(kù)。
  • astroML – 天文學(xué)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫(kù)。
  • graphlab-create – 基于磁盤支持的DataFrame的庫(kù),實(shí)現(xiàn)了各種機(jī)器學(xué)習(xí)模型(回歸,聚類,推薦系統(tǒng),圖形分析等)。
  • BigML – 與外部服務(wù)器交流的庫(kù)。
  • 模式 – Web數(shù)據(jù)挖掘模塊。
  • NuPIC – Numenta智能計(jì)算平臺(tái)。
  • Pylearn2 – 基于Theano的機(jī)器學(xué)習(xí)庫(kù)。
  • keras – 基于Theano的神經(jīng)網(wǎng)絡(luò)庫(kù)
  • hebel – GPU加速的Python深度學(xué)習(xí)庫(kù)。
  • Chainer – 靈活的神經(jīng)網(wǎng)絡(luò)架構(gòu)
  • gensim – 易用的主題建模工具
  • topik – 主題建模工具包
  • PyBrain – 另一個(gè)Python機(jī)器學(xué)習(xí)庫(kù)。
  • Crab – 靈活的,快速的推薦引擎
  • python-recsys – 實(shí)現(xiàn)一個(gè)推薦系統(tǒng)的Python工具
  • 限制玻爾茲曼機(jī)器 – 受限玻爾茲曼機(jī)
  • CoverTree – 覆蓋樹的Python實(shí)現(xiàn),scipy.spatial.kdtree的近似替換
  • nilearn – NeuroImaging機(jī)器學(xué)習(xí)庫(kù)
  • 幕府將軍學(xué)習(xí)機(jī)器學(xué)習(xí)工具箱
  • Pyevolve – 遺傳算法框架
  • Caffe – 深度學(xué)習(xí)框架,結(jié)構(gòu)清晰,可讀性好,速度快。
  • breze – 基于Theano的深度神經(jīng)網(wǎng)絡(luò)
  • pyhsmm -貝葉斯隱馬爾可夫模型近似無(wú)監(jiān)督的推理和顯式時(shí)長(zhǎng)隱半馬爾可夫模型,專注于貝葉斯非參數(shù)擴(kuò)展時(shí),HDP-HMM和HDP-HSMM,大多是弱極限近似。
  • mrjob – 使得Python程序可以跑在Hadoop上。
  • SKLL – 簡(jiǎn)化的scikit-learn接口,易于做實(shí)驗(yàn)
  • neurolabhttps://github.com/zueve/neurolab
  • 薄荷 – 貝葉斯算法的優(yōu)化。方法見于論文:機(jī)器學(xué)習(xí)算法的實(shí)踐貝葉斯優(yōu)化。Jasper Snoek,Hugo Larochelle和Ryan P. Adams。2012年神經(jīng)信息處理系統(tǒng)進(jìn)展。
  • Pebl – 貝葉斯學(xué)習(xí)的Python環(huán)境
  • Theano – 優(yōu)化GPU元編程代碼,生成面向矩陣的優(yōu)化的數(shù)學(xué)編譯器
  • TensorFlow – 用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算的開源軟件庫(kù)
  • yahmm – 隱馬爾可夫模型,用Cython實(shí)現(xiàn)
  • python-timbl – 包裝了完整的TiMBL C ++編程接口。Timbl是一個(gè)精心制作的?最近鄰機(jī)器學(xué)習(xí)工具包。
  • deap – 進(jìn)化算法框架
  • pydeep – Python深度學(xué)習(xí)
  • mlxtend – 對(duì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)任務(wù)非常有用的工具庫(kù)。
  • 霓虹燈高性能深度學(xué)習(xí)框架
  • Optunity – 致力于自動(dòng)化超參數(shù)優(yōu)化過程,使用一個(gè)簡(jiǎn)單的,輕量級(jí)的API,以方便直接替換網(wǎng)格搜索。
  • 惹惱 -近似最近鄰居執(zhí)行
  • skflow – TensorFlow的簡(jiǎn)化界面,類似Scikit Learn。
  • TPOT – 自動(dòng)創(chuàng)建并利用遺傳編程優(yōu)化機(jī)器學(xué)習(xí)的管道。將它看作您的數(shù)據(jù)科學(xué)助理,自動(dòng)化機(jī)器學(xué)習(xí)中大部分的枯燥工作。

數(shù)據(jù)分析,可視化

  • SciPy – 一個(gè)基于Python的數(shù)據(jù),科學(xué)和工程開源軟件生態(tài)系統(tǒng)。
  • NumPy – 用Python進(jìn)行科學(xué)計(jì)算的基礎(chǔ)軟件包。
  • Numba – Python JIT(及時(shí))編譯為L(zhǎng)LVM,由Cython和NumPy的開發(fā)人員針對(duì)科學(xué)Python。
  • NetworkX – 復(fù)雜網(wǎng)絡(luò)的高生產(chǎn)率軟件。
  • 熊貓 – 提供高性能,易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具的庫(kù)。
  • 開放采礦 – Python中的商業(yè)智能(BI)(熊貓網(wǎng)絡(luò)界面)
  • PyMC – 馬爾可夫鏈蒙特卡洛取樣工具包。
  • zipline – 一個(gè)Pythonic算法交易庫(kù)。
  • PyDy – Python Dynamics的簡(jiǎn)稱,用于協(xié)助基于NumPy,SciPy,IPython和matplotlib的動(dòng)態(tài)運(yùn)動(dòng)建模中的工作流程。
  • SymPy – 符號(hào)數(shù)學(xué)的Python庫(kù)。
  • statsmodels – Python中的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)。
  • astropy – 一個(gè)用于天文學(xué)的社區(qū)Python庫(kù)。
  • matplotlib – 一個(gè)Python 2D繪圖庫(kù)。
  • 散景 – Python的互動(dòng)網(wǎng)絡(luò)繪圖。
  • 劇情 – Python和matplotlib的協(xié)作網(wǎng)絡(luò)繪圖。
  • vincent – 一個(gè)Python到Vega翻譯器。
  • d3py -一個(gè)plottling庫(kù)的Python,基于D3.js
  • ggplot – 與ggplot2相同的API
  • ggfortify – ggplot2流行的R包的統(tǒng)一接口。
  • Kartograph.py – 在Python中呈現(xiàn)美麗的SVG地圖。
  • pygal – 一個(gè)Python SVG圖表創(chuàng)建者。
  • PyQtGraph – 一個(gè)基于PyQt4 / PySide和NumPy的純python圖形和GUI庫(kù)。
  • pycascading
  • Petrel – 用于編寫,提交,調(diào)試和監(jiān)視純Python中的風(fēng)暴拓?fù)涞墓ぞ摺?/li>
  • Blaze – NumPy和Pandas與Big Data接口。
  • emcee – 仿射不變MCMC的Python集合采樣工具包。
  • windML – 風(fēng)能分析與預(yù)測(cè)的Python框架
  • vispy – 基于GPU的高性能交互式OpenGL 2D / 3D數(shù)據(jù)可視化庫(kù)
  • cerebro2 NuPIC的基于Web的可視化和調(diào)試平臺(tái)。
  • NuPIC Studio一體化NuPIC分層時(shí)態(tài)內(nèi)存可視化和調(diào)試超級(jí)工具!
  • PySpark上的SparklingPandas Pandas(POPS)
  • Seaborn – 基于matplotlib的python可視化庫(kù)
  • bqplot – 用于在Jupyter(IPython)中繪制的API

常見的Lisp

通用機(jī)器學(xué)習(xí)

  • mgl – 神經(jīng)網(wǎng)絡(luò)(boltzmann機(jī)器,前饋和復(fù)發(fā)網(wǎng)絡(luò)),高斯過程
  • mgl-gpr – 進(jìn)化算法
  • cl-libsvm – libsvm支持向量機(jī)庫(kù)的包裝器

Clojure

自然語(yǔ)言處理

通用機(jī)器學(xué)習(xí)

  • Touchstone – Clojure A / B測(cè)試庫(kù)
  • Clojush – 他推動(dòng)編程語(yǔ)言和在Clojure中實(shí)現(xiàn)的PushGP遺傳編程系統(tǒng)
  • Infer – 推理和機(jī)器學(xué)習(xí)在clojure
  • Clj-ML – 一個(gè)用于Clojure的機(jī)器學(xué)習(xí)庫(kù),建于Weka和朋友之上
  • Encog – 用于Encog(v3)的Clojure包裝器(專門從事神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)框架)
  • Fungp – Clojure的遺傳編程庫(kù)
  • Statistiker – Clojure中的基本機(jī)器學(xué)習(xí)算法。
  • clortex – 通用機(jī)器學(xué)習(xí)庫(kù)使用Numenta的皮質(zhì)學(xué)習(xí)算法
  • comportex – 功能可組合的機(jī)器學(xué)習(xí)庫(kù),使用Numenta的皮質(zhì)學(xué)習(xí)算法

數(shù)據(jù)分析,可視化

  • Incanter – Incanter是一個(gè)基于Clojure的R類統(tǒng)計(jì)計(jì)算和圖形平臺(tái)。
  • PigPen – Map-Reduce for Clojure。
  • Envision – Clojure數(shù)據(jù)可視化庫(kù),基于Statistiker和D3

MATLAB

計(jì)算機(jī)視覺

  • 輪廓 – 實(shí)現(xiàn)輪廓變換的 MATLAB源代碼及其效用函數(shù)。
  • Shearlets – 用于小波變換的MATLAB代碼
  • 曲線 – 曲線變換是小波變換的更高維度泛化,旨在表示不同尺度和不同角度的圖像。
  • Bandlets – 用于帶狀變換的MATLAB代碼
  • mexopencv – OpenCV庫(kù)的收集和MATLAB mex功能的開發(fā)工具包

自然語(yǔ)言處理

  • NLP – 一個(gè)用于Matlab的NLP庫(kù)

通用機(jī)器學(xué)習(xí)

  • t分布隨機(jī)相鄰嵌入 – t-SNE是一個(gè)獲獎(jiǎng)的技術(shù),可以降維,尤其適合高維數(shù)據(jù)可視化
  • 蜘蛛 – 蜘蛛有望成為matlab里機(jī)器學(xué)習(xí)中的完整的面向?qū)ο蟓h(huán)境。
  • LibSVM – 著名的支持向量機(jī)庫(kù)。
  • LibLinear – 大型線性分類圖書館
  • Caffe – 深度學(xué)習(xí)框架,結(jié)構(gòu)清晰,可讀性好,速度快。
  • 模式識(shí)別工具箱 – Matlab機(jī)器學(xué)習(xí)中一個(gè)完整的面向?qū)ο蟮沫h(huán)境。
  • Optunity – 一個(gè)致力于自動(dòng)化超參數(shù)優(yōu)化的庫(kù),具有簡(jiǎn)單輕便的API,便于網(wǎng)格搜索的替換。Optunity是用Python編寫的,但與MATLAB無(wú)縫連接。致力于自動(dòng)化超參數(shù)優(yōu)化的一個(gè)簡(jiǎn)單的,輕量級(jí)的API庫(kù),方便直接替換網(wǎng)格搜索。Optunity是用Python編寫的,但與MATLAB的無(wú)縫連接。

數(shù)據(jù)分析,可視化

  • matlab_gbl – MatlabBGL是一個(gè)用于處理圖形的Matlab包。
  • gamic – 圖形算法的高效純Matlab實(shí)現(xiàn),以補(bǔ)充MatlabBGL的mex函數(shù)。

C#

計(jì)算機(jī)視覺

  • OpenCVDotNet – 用于與.NET應(yīng)用程序一起使用的OpenCV項(xiàng)目的包裝器。
  • Emgu CV – OpenCV的跨平臺(tái)包裝器,可以在Mono中編譯為在Windows,Linus,Mac OS X,iOS和Android上運(yùn)行。
  • AForge.NET – 開發(fā)人員和研究人員在計(jì)算機(jī)視覺和人工智能領(lǐng)域的開源C??蚣堋0l(fā)展現(xiàn)在已經(jīng)轉(zhuǎn)移到GitHub。
  • Accord.NET – 與AForge.NET一起,該庫(kù)可以為Windows,Windows RT和Windows Phone提供圖像處理和計(jì)算機(jī)視覺算法。一些組件也可用于Java和Android。

自然語(yǔ)言處理

  • Stanford.NLP for .NET – 一個(gè)完整的斯坦福NLP包到.NET,并且可以作為NuGet包預(yù)編譯。

通用機(jī)器學(xué)習(xí)

  • 協(xié)調(diào)框架 – 一個(gè)完整的框架,可以用于機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺,計(jì)算機(jī)試聽,信號(hào)處理,統(tǒng)計(jì)應(yīng)用等。
  • Accord.MachineLearning – 支持向量機(jī),決策樹,樸素貝葉斯模型,K均值,高斯混合模型和一般算法,如機(jī)器學(xué)習(xí)應(yīng)用的Ransac,交叉驗(yàn)證和網(wǎng)格搜索。此包是Accord.NET Framework的一部分。
  • DiffSharp – 一種用于機(jī)器學(xué)習(xí)和優(yōu)化應(yīng)用程序的自動(dòng)差分(AD)庫(kù),提供精確和高效的衍生物(梯度,Hessians,Jacobians,方向?qū)?shù)和無(wú)矩陣Hessian和Jacobian矢量產(chǎn)品)。操作可以嵌套到任何級(jí)別,這意味著您可以計(jì)算精確的高階導(dǎo)數(shù)并區(qū)分在內(nèi)部使用差異化的功能,例如超參數(shù)優(yōu)化應(yīng)用程序。
  • Vulpes – 用F#編寫的深度信念和深度學(xué)習(xí)實(shí)現(xiàn),并利用與Alea.cuBase的CUDA GPU執(zhí)行。
  • Encog – 一個(gè)先進(jìn)的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)框架。Encog包含創(chuàng)建各種網(wǎng)絡(luò)的類,以及支持類來(lái)規(guī)范和處理這些神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)。使用多線程彈性傳播的火車。Encog還可以利用GPU來(lái)進(jìn)一步加快處理時(shí)間。還提供了基于GUI的工作臺(tái)來(lái)幫助模擬和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
  • 神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)師 – DBMS管理系統(tǒng)和神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)師。設(shè)計(jì)師應(yīng)用程序是使用WPF開發(fā)的,是一個(gè)用戶界面,允許您設(shè)計(jì)神經(jīng)網(wǎng)絡(luò),查詢網(wǎng)絡(luò),創(chuàng)建和配置可以從您的反饋中提出問題和學(xué)習(xí)的聊天機(jī)器人。聊天機(jī)器人甚至可以刮擦互聯(lián)網(wǎng)以獲取信息以返回其輸出以及用于學(xué)習(xí)。

數(shù)據(jù)分析,可視化

  • numl – numl是一個(gè)機(jī)器學(xué)習(xí)庫(kù),旨在簡(jiǎn)化使用標(biāo)準(zhǔn)建模技術(shù)進(jìn)行預(yù)測(cè)和聚類。
  • Math.NET數(shù)學(xué) – Math.NET項(xiàng)目的數(shù)學(xué)基礎(chǔ),旨在為科學(xué),工程和日常使用中的數(shù)值計(jì)算提供方法和算法。支持Windows,Linux和Mac上的.Net 4.0,.Net 3.5和Mono; Silverlight 5,WindowsPhone / SL 8,WindowsPhone 8.1和Windows 8與PCL便攜式配置文件47和344; Android / iOS與Xamarin。
  • Sho -Sho是用于數(shù)據(jù)分析和科學(xué)計(jì)算的交互式環(huán)境,可讓您將腳本(在IronPython中)與編譯代碼(.NET)無(wú)縫連接,以實(shí)現(xiàn)快速靈活的原型設(shè)計(jì)。環(huán)境包括用于線性代數(shù)的強(qiáng)大而高效的庫(kù),以及可以從任何.NET語(yǔ)言使用的數(shù)據(jù)可視化,以及用于快速開發(fā)的功能豐富的交互式shell。

Ruby

自然語(yǔ)言處理

  • 對(duì)待 – 文本REtrieval和注釋工具包,絕對(duì)是我迄今為止遇到的最全面的工具包
  • Ruby語(yǔ)言學(xué) – 語(yǔ)言學(xué)是用于為任何語(yǔ)言的Ruby對(duì)象構(gòu)建語(yǔ)言實(shí)用程序的框架。它包括通用語(yǔ)言無(wú)關(guān)的前端,用于將語(yǔ)言代碼映射到語(yǔ)言名稱的模塊,以及包含各種英語(yǔ)工具的模塊。
  • Stemmer – 將libstemmer_c發(fā)布給Ruby
  • Ruby Wordnet – 該庫(kù)是WordNet的一個(gè)Ruby接口
  • Raspel – raspell是一個(gè)綁定ruby的界面
  • UEA Stemmer – UEALite Stemmer的Ruby端口 – 搜索和索引的保守干預(yù)
  • Twitter-text-rb – 在Twitter中自動(dòng)鏈接和提取用戶名,列表和主題標(biāo)簽的圖書館

通用機(jī)器學(xué)習(xí)

數(shù)據(jù)分析,可視化

  • rsruby – Ruby – R橋
  • data-visualization-ruby – 使用Ruby進(jìn)行數(shù)據(jù)可視化的Ruby Manor演示文稿的源代碼和支持內(nèi)容
  • ruby-plot – 用于ruby的gnuplot包裝,特別是用于將roc曲線繪制到svg文件中
  • plot-rb – 建立在Vega和D3之上的Ruby中的繪圖庫(kù)。
  • 襤褸 – 一個(gè)美麗的圖形工具包Ruby
  • SciRuby
  • Glean – 人類的數(shù)據(jù)管理工具
  • Bioruby
  • 阿雷爾

雜項(xiàng)


R

通用機(jī)器學(xué)習(xí)

  • ahaz – ahaz:半?yún)?shù)加性危險(xiǎn)回歸的正則化
  • 弧形 – 弧形:采礦協(xié)會(huì)規(guī)則和頻繁項(xiàng)集
  • bigrf – bigrf:大隨機(jī)森林:大數(shù)據(jù)集的分類和回歸森林
  • bigRR – bigRR:廣義嶺回歸(對(duì)于p >> n個(gè)情況具有特殊優(yōu)勢(shì))
  • bmrm – bmrm:用于正則化風(fēng)險(xiǎn)最小化包的捆綁方法
  • Boruta – Boruta:用于所有相關(guān)特征選擇的包裝算法
  • bst – bst:漸變提升
  • C50 – C50:C5.0決策樹和基于規(guī)則的模型
  • 插入符號(hào) – 分類和回歸訓(xùn)練:統(tǒng)一接口到?150 ML算法在R.
  • 護(hù)理裝配 – 護(hù)理裝配:適合多個(gè)插入符號(hào)模型的框架以及創(chuàng)建這種模型的集合。
  • 機(jī)器學(xué)習(xí)的巧妙算法
  • CORElearn – CORElearn:分類,回歸,特征評(píng)估和序數(shù)評(píng)估
  • CoxBoost – CoxBoost:Cox模型通過基于可能性的單一生存終點(diǎn)提升或競(jìng)爭(zhēng)風(fēng)險(xiǎn)
  • 立體主義者 – 立體主義者:基于規(guī)則和實(shí)例的回歸建模
  • 統(tǒng)計(jì)部門的其他功能(e1071),TU Wien
  • 地球:多變量自適應(yīng)回歸樣條模型
  • elasticnet – elasticnet:彈性網(wǎng)稀疏估計(jì)和稀疏PCA
  • ElemStatLearn – ElemStatLearn:本書的數(shù)據(jù)集,功能和示例:Trevor Hastie,Robert Tibshirani和Jerome Friedman預(yù)測(cè)的“統(tǒng)計(jì)學(xué)習(xí),數(shù)據(jù)挖掘,推理和預(yù)測(cè)的要素”,由Trevor Hastie,Robert Tibshirani和Jerome Friedman
  • evtree – evtree:全球最佳樹的進(jìn)化學(xué)習(xí)
  • fpc – fpc:靈活的聚類過程
  • frbs – frbs:用于分類和回歸任務(wù)的基于模糊規(guī)則的系統(tǒng)
  • GAMBoost – GAMBoost:通過基于可能性的增強(qiáng)的廣義線性和加性模型
  • gamboostLSS – gamboostLSS:GAMLSS的增強(qiáng)方法
  • gbm – gbm:廣義增強(qiáng)回歸模型
  • glmnet – glmnet:拉索和彈性網(wǎng)絡(luò)正則化廣義線性模型
  • glmpath – glmpath:L1廣義線性模型和Cox比例危險(xiǎn)模型的正則化路徑
  • GMMBoost – GMMBoost:廣義混合模型的基于可能的推動(dòng)
  • grplasso – grplasso:適合用戶指定的模型與組拉索罰款
  • grpreg – grpreg:具有分組協(xié)變量的回歸模型的正則化路徑
  • h2o – 快速,平行和分布式機(jī)器學(xué)習(xí)算法的框架 – 深度學(xué)習(xí),隨機(jī)森林,GBM,KMeans,PCA,GLM
  • hda – hda:異方差判別分析
  • 統(tǒng)計(jì)學(xué)習(xí)簡(jiǎn)介
  • ipred – ipred:改進(jìn)的預(yù)測(cè)器
  • kernlab – kernlab:基于內(nèi)核的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室
  • klaR – klaR:分類和可視化
  • Lars – lars:最小角度回歸,Lasso和Forward Stage
  • lasso2 – lasso2:L1約束估計(jì)aka’lasso’
  • LiblineaR – LiblineaR:基于線性C / C ++庫(kù)的線性預(yù)測(cè)模型
  • LogicReg – LogicReg:邏輯回歸
  • 機(jī)器學(xué)習(xí)黑客
  • maptree – maptree:映射,修剪和圖形樹模型
  • mboost – mboost:基于模型的增強(qiáng)
  • 混合混合:混合回歸模型,使用貪心逐步的方法
  • mlr – mlr:機(jī)器學(xué)習(xí)在R
  • mvpart – mvpart:多變量分區(qū)
  • ncvreg – ncvreg:SCAD和MCP懲罰回歸模型的正則化路徑
  • nnet -nnet:前饋神經(jīng)網(wǎng)絡(luò)和多項(xiàng)對(duì)數(shù)線性模型
  • slope.tree – tilt.tree:分類數(shù)據(jù)的斜樹
  • pamr – pamr:Pam:微陣列預(yù)測(cè)分析
  • 黨派:遞歸提問實(shí)驗(yàn)室
  • partykit – partykit:一個(gè)遞歸提交工具包
  • 懲罰 – 處罰:在GLMs和Cox模型中的L1(套索和融合套索)和L2(脊)懲罰估計(jì)
  • 懲罰LDA – 處罰LDA:使用Fisher線性判別的懲罰分類
  • 懲罰的 SVM – 處罰的SVM:使用懲罰函數(shù)的特征選擇SVM
  • quantregForest – quantregForest:分位數(shù)回歸森林
  • randomForest – randomForest:Breiman和Cutler的隨機(jī)森林進(jìn)行分類和歸一化
  • randomForestSRC – randomForestSRC:為生存,回歸和分類隨機(jī)森林(RF-SRC)
  • rattle – rattle:R中數(shù)據(jù)挖掘的圖形用戶界面
  • rda – rda:Shrunken Centroids正則判別分析
  • rdetools – rdetools:特征空間中的相關(guān)維度估計(jì)(RDE)
  • REEMtree – REEMtree:回歸樹與縱向(面板)數(shù)據(jù)隨機(jī)效應(yīng)
  • relaxo – relaxo:輕松的套索
  • rgenoud – rgenoud:R版本的使用衍生物的遺傳優(yōu)化
  • rgp – rgp:R遺傳編程框架
  • Rmalschains – Rmalschains:使用R中的本地搜索鏈(MA-LS鏈)的Memetic算法進(jìn)行連續(xù)優(yōu)化
  • 簡(jiǎn)單的:在分類和回歸中更簡(jiǎn)單地使用數(shù)據(jù)挖掘方法(如NN和SVM)
  • ROCR – ROCR:可視化評(píng)分分類器的性能
  • RoughSets – RoughSets:數(shù)據(jù)分析基于粗糙集與模糊粗糙集理論
  • rpart – rpart:遞歸分區(qū)和回歸樹
  • RPMM – RPMM:遞歸分區(qū)混合模型
  • RSNNS – RSNNS:使用斯圖加特神經(jīng)網(wǎng)絡(luò)模擬器(SNNS)的R中的神經(jīng)網(wǎng)絡(luò)
  • RWeka – RWeka:R / Weka界面
  • RXshrink – RXshrink:通過通用脊或最小角度回歸的最大似然收縮
  • sda -sda:收縮判別分析和CAT分?jǐn)?shù)變量選擇
  • SDDA – SDDA:逐步對(duì)角判別分析
  • 超級(jí)聽眾組合 – 多算法集成學(xué)習(xí)包。
  • svmpath – svmpath:svmpath:SVM路徑算法
  • tgp – tgp:貝葉斯高斯過程模型
  • – 樹:分類和回歸樹
  • varSelRF – varSelRF:使用隨機(jī)林的變量選擇
  • XGBoost.R – R綁定用于eXtreme漸變提升(樹)庫(kù)
  • Optunity – 一個(gè)致力于自動(dòng)化超參數(shù)優(yōu)化的庫(kù),具有簡(jiǎn)單輕便的API,便于網(wǎng)格搜索的替換。Optunity是用Python編寫的,但是可以無(wú)縫地連接到R.

數(shù)據(jù)分析,可視化

  • ggplot2 – 基于圖形語(yǔ)法的數(shù)據(jù)可視化包。

Scala

自然語(yǔ)言處理

  • ScalaNLP – ScalaNLP是一套機(jī)器學(xué)習(xí)和數(shù)字計(jì)算庫(kù)。
  • 微風(fēng) – 微風(fēng)是Scala的數(shù)字處理庫(kù)。
  • 粉筆 – 粉筆是自然語(yǔ)言處理圖書館。
  • FACTORIE – FACTORIE是可部署概率建模的工具包,在Scala中作為軟件庫(kù)實(shí)現(xiàn)。它為用戶提供了一種簡(jiǎn)潔的語(yǔ)言,用于創(chuàng)建關(guān)系因子圖,估計(jì)參數(shù)和執(zhí)行推理。

數(shù)據(jù)分析,可視化

  • Apache Spark中的 MLlib – Spark中的分布式機(jī)器學(xué)習(xí)庫(kù)
  • Scalding – 用于級(jí)聯(lián)的Scala API
  • 總結(jié)鳥 – 流行的MapReduce與Scalding和風(fēng)暴
  • Algebird – Scala的抽象代數(shù)
  • xerial – Scala的數(shù)據(jù)管理工具
  • – 減少你的數(shù)據(jù)。用于algebird供電聚合的unix過濾器。
  • PredictionIO – PredictionIO,用于軟件開發(fā)人員和數(shù)據(jù)工程師的機(jī)器學(xué)習(xí)服務(wù)器。
  • BIDMat – CPU和GPU加速矩陣庫(kù),旨在支持大規(guī)模的探索性數(shù)據(jù)分析。
  • 沃爾夫聲明機(jī)器學(xué)習(xí)

通用機(jī)器學(xué)習(xí)

  • 推測(cè) – 可擴(kuò)展機(jī)器學(xué)習(xí)在縮放
  • 刷火 – Scala中的分布式?jīng)Q策樹合奏學(xué)習(xí)
  • ganitha燙金機(jī)器學(xué)習(xí)
  • adam – 使用Apache Avro,Apache Spark和Parquet構(gòu)建的基因組處理引擎和專用文件格式。Apache 2許可。
  • bioscala – Scala編程語(yǔ)言的生物信息學(xué)
  • BIDMach – CPU和GPU加速機(jī)器學(xué)習(xí)庫(kù)。
  • 費(fèi)加羅 – 構(gòu)建概率模型的Scala庫(kù)。
  • H2O閃蒸水 – H2O和Spark互操作性。
    <div style="margin-top: 15px; font-style: italic">

** 轉(zhuǎn)載自URl-team

本文鏈接地址: 機(jī)器學(xué)習(xí)各語(yǔ)言領(lǐng)域工具庫(kù)中文版匯總

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容