[ZT] 2018 年 Github 最受歡迎機器學習語言 Python 穩(wěn)坐冠軍,numpy、scipy 是最受歡迎軟件包

英文原文: GitHub: Numpy and Scipy are the most popular packages for machine learning projects, 翻譯

在 GitHub 2018 年的 Octoverse 報告中,機器學習和數(shù)據(jù)科學是 GitHub 上的熱門話題。其中,tensorflow / tensorflow 是項目貢獻最多的項目之一,pytorch / pytorch 是增長最快的項目之一,而 Python 是 GitHub 上第三大最受歡迎的語言。于是,GitHub 決定更加深入地研究一下,機器學習和數(shù)據(jù)科學在該平臺究竟是怎樣的情況。

GitHub 提取了 2018 年 1 月 1 日到 2018 年 12 月 31 日之間的貢獻數(shù)據(jù)。這些貢獻可能包括推送代碼、發(fā)起話題或提取請求、評論問題或提取請求,以及審查拉取請求。對于大多數(shù)導入的程序包,GitHub 使用了從依賴關(guān)系圖中獲得的數(shù)據(jù),其中包括所有公共存儲庫和已選擇加入依賴關(guān)系圖的所有私有存儲庫。

機器學習編程語言:Python 穩(wěn)坐冠軍

十大Github機器學習語言

GitHub 以使用“機器學習”主題標記的存儲庫的貢獻者為依據(jù),對存儲庫中最常見的主要編程語言進行了排名。結(jié)果顯示,Python 是機器學習庫中最常用的語言,也是 GitHub 上第三種最常用的語言。然而,并非所有機器學習項目都使用 Python:GitHub 上還有其他一些最常見的機器學習通用語言,如 C ++、JavaScript、Java、C#、Shel l 和 TypeScript 躋身 GitHub 編程語言 Top10,同時是機器學習項目的 Top10 語言。Julia、R 和 Scala 都出現(xiàn)在機器學習項目編程語言的前 10 名,但未上榜 GitHub 整體最受歡迎編程語言 Top10。Julia 和 R 都是數(shù)據(jù)科學家常用的語言,Scala 在 與 Apache Spark 等大數(shù)據(jù)系統(tǒng)交互時變得越來越常用。

最受歡迎機器學習和數(shù)據(jù)科學包:numpy、scipy、pandas 占據(jù)前三

Github中引入最多的十種機器學習包

我們從依賴圖中提取數(shù)據(jù),以計算導入流行 Python 包的機器學習或數(shù)據(jù)科學項目的百分比。上表為項目導入最多程序包 Top10 排名。我們發(fā)現(xiàn):

  • Numpy,一個支持多維數(shù)據(jù)數(shù)學運算的軟件包,是導入最多的軟件包,近四分之三的機器學習和數(shù)據(jù)科學項目使用此包。
  • Scipy,一個用于科學計算的軟件,pandas,一個用于管理數(shù)據(jù)集的軟件包,以及可視化庫matplotlib,都在超過 40% 的機器學習和數(shù)據(jù)科學項目中使用。
  • Scikit-learn 是一種流行的機器學習包,包含大量機器學習算法的實現(xiàn),近 40% 的項目使用此包。
  • Tensorflow 是一種用于處理神經(jīng)網(wǎng)絡(luò)的軟件包,近四分之一的項目使用。

前十名中其他的包均為實用程序包:排名第六的是 Python 2 和 3 兼容性庫,python-dateutilpytz 是用于處理日期的包。

最受歡迎的機器學習項目:Tensorflow

最受歡迎的十個機器學習項目

2018 年,帶有“機器學習”標簽、貢獻最多的開源項目為 Tensorflow,是迄今為止最受歡迎的機器學習項目,且其貢獻者數(shù)量是第二大受歡迎項目 scikit-learn 的五倍多。排名第三和第九的 explosion/spaCy/ spaCy 和 RasaHQ / rasa_nlu 是兩個專注于自然語言處理問題的項目。另外四個項目,CMU-Perceptual-Computing-Lab / openpose,thtrieu / darkflow,ageitgey / face_recognition 和 tesseract-ocr / tesseract 則專注于圖像處理。另外,Julia 語言源代碼也是 2018 年項目貢獻最多的項目之一。

該翻譯引用的原文鏈接(圖掛了):https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容