20個在機器學習和數(shù)據(jù)科學中最常用的R語言包

https://www.iteblog.com/archives/1709.html?from=like

我們通過分析從2015年1月至5月下載次數(shù)最多的R包,列出了前20名流行的機器學習R包。
  大多數(shù)R包都深受Kagglers大神的最愛,也被資深的筆者所贊美,而這些包的使用率或評價高低不僅僅取決于其它的包對于這個
  這個包的依賴程度。還也取決于Crantastic.org并使用其眾包能解決方案的用戶。但是,用戶評價太低以至于不能基于分析來做決定。
  我們根據(jù)從一月到五月的下載量,通過分析CRAN的日均下載量來統(tǒng)計有多少關于機器學習的包被下載了。


1、e1071
潛類分析函數(shù),短暫性的傅里葉變化、模糊的集群、支持向量機、最短路徑計算、裝袋集群、樸素貝葉斯分類器等(下載量:142470)。
2、rpart
遞歸分割和回歸樹(下載量:135390)。
3、igraph
網(wǎng)絡分析工具的集合(下載量:122930)。
4、nnet
前饋神經(jīng)網(wǎng)絡和多元對數(shù)線性模型(下載量:108298)。
5、randomForest
Breiman and Cutler的關于分類和回歸的隨機森林(下載量:105375)。
6、caret
一套試圖簡化創(chuàng)建預測模型的函數(shù)集(下載量:87151)。
7、kernlab
基于內(nèi)核的機器學習實驗室(下載量:62064)。
8、glmnet
Lasso和彈性網(wǎng)正規(guī)化廣義線性模型(下載量:56948)。
9、ROCR
可視評分分類的操作(下載量:51323)。
10、gbm
產(chǎn)生改良的回歸模型(下載量:44670)。
11、party
一個遞歸分割實驗室(下載量:43290)。
12、arules
關聯(lián)規(guī)則挖掘和頻繁項集(下載量:39654)。
13、tree
分類和回歸樹(下載量:27882)。
14、klaR
分類和可視化操作(下載量:27828)。
15、RWeka
關于R或Weka的接口(下載量:26973)。
16、ipred
改良的預測變量(下載量:22358)
17、lars
最小回歸角、Lasso和逐步回歸分析階段(下載量:19691)。
18、earth
多元自適應回歸樣條分析。(下載量:15901)。
19、CORElearn
分類、回歸、功能評估和有序評估(下載量:13856)。
20、mboost
基于模型的Booting(下載量:13078)。
你會發(fā)現(xiàn)記住這些越來越受人追捧的開源R工具如Rattle,R的一種圖形用戶界面的數(shù)據(jù)挖掘工具(下載量:35539),以及fastcluster,R和Python(下載量:14214)的快速的分級聚類程序。
英文原文:Top 20 R Machine Learning and Data Science packages

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容