【呆鳥譯Py】2018年8月,GitHub上的Python數(shù)據(jù)科學(xué)明星項(xiàng)目:自動(dòng)化機(jī)器學(xué)習(xí)、自然語言處理、可視化、機(jī)器學(xué)習(xí)工作流

原文作者:Matthew Mayo
原文地址:GitHub Python Data Science Spotlight: AutoML, NLP, Visualization, ML Workflows

Python數(shù)據(jù)分析

本文是“五個(gè)不容忽視的機(jī)器學(xué)習(xí)項(xiàng)目”一文的續(xù)篇。和上篇文章相比,這次選出的項(xiàng)目涉及更多數(shù)據(jù)科學(xué)領(lǐng)域,并且都是GitHub上的開源項(xiàng)目,我們?yōu)槊總€(gè)項(xiàng)目都附上了Repo、文檔和入門指南的鏈接,并對(duì)每個(gè)項(xiàng)目進(jìn)行了簡(jiǎn)單介紹。
下面一起來了解一下這些新興的熱門Python庫(kù)吧,希望本文對(duì)你的工作能有所幫助:

  1. Auto-Keras自動(dòng)機(jī)器學(xué)習(xí)庫(kù)
    項(xiàng)目鏈接:https://github.com/jhfjhfj1/autokeras
    文檔:http://autokeras.com
    入門指南:https://autokeras.com/#example
    Auto-Keras是用于自動(dòng)機(jī)器學(xué)習(xí)(AutoML)的開源軟件庫(kù)。自動(dòng)機(jī)器學(xué)習(xí)的最終目標(biāo)是讓僅擁有一定數(shù)據(jù)科學(xué)知識(shí)或機(jī)器學(xué)習(xí)背景的行業(yè)專家可以輕松地應(yīng)用深度學(xué)習(xí)模型。Auto-Keras提供了很多用于自動(dòng)研究深度學(xué)習(xí)模型架構(gòu)與超參數(shù)的函數(shù)。
  2. Finetune Scikit-Learn風(fēng)格的自然語言處理模型微調(diào)器
    項(xiàng)目鏈接:https://github.com/IndicoDataSolutions/finetune
    文檔:https://finetune.indico.io
    入門指南:https://finetune.indico.io
    Finetune提供了“通過生成式預(yù)訓(xùn)練改進(jìn)對(duì)語言的理解”的預(yù)訓(xùn)練語言模型,并擴(kuò)充了OpenAI/finetune-language-model庫(kù)。
  3. GluonNLP - 讓自然語言處理變得更簡(jiǎn)單
    項(xiàng)目鏈接:https://github.com/dmlc/gluon-nlp
    文檔:http://gluon-nlp.mxnet.io
    入門指南: https://github.com/dmlc/gluon-nlp#quick-start-guide
    GluonNLP可以使文本處理、數(shù)據(jù)加載及構(gòu)建神經(jīng)模型變得更容易,加快自然語言處理研究的速度。
  4. animatplot - 基于Matplotlib的Python動(dòng)圖庫(kù)
    項(xiàng)目鏈接:https://github.com/t-makaro/animatplot
    文檔:https://animatplot.readthedocs.io/en/latest
    入門指南: https://animatplot.readthedocs.io/en/latest/tutorial/getting_started.html
    請(qǐng)注意,本庫(kù)文檔里的例子比較簡(jiǎn)單,本文引用的是該庫(kù)在GitHub上列出的功能更全、形式更酷的示例圖。
    animatplot
  5. MLflow - 機(jī)器學(xué)習(xí)生命周期的開源平臺(tái)
    項(xiàng)目鏈接:https://github.com/mlflow/mlflow
    文檔:https://mlflow.org/docs/latest/index.html
    入門指南:https://mlflow.org/docs/latest/quickstart.html
    MLflow是用來管理機(jī)器學(xué)習(xí)整體生命周期的開源平臺(tái),這個(gè)平臺(tái)提供了以下主要三個(gè)功能:
  • MLflow Tracking:跟蹤實(shí)驗(yàn),以用來記錄和比較機(jī)器學(xué)習(xí)的參數(shù)。
  • MLflow Projects:以可復(fù)用、可再現(xiàn)的形式,將機(jī)器學(xué)習(xí)的代碼進(jìn)行打包,以便分享給其他數(shù)據(jù)科學(xué)家或傳遞給生產(chǎn)環(huán)境。
  • MLflow Models:管理各類機(jī)器學(xué)習(xí)庫(kù)中的模型,并部署到不同的模型服務(wù)及應(yīng)用平臺(tái)。
    MLflow通過訪問REST API和CLI實(shí)現(xiàn)其功能,所以它不依賴于某個(gè)庫(kù),并且支持多種機(jī)器學(xué)習(xí)庫(kù)與編程語言,為了使用方便,它還內(nèi)置了Python API。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,802評(píng)論 25 709
  • # Python 資源大全中文版 我想很多程序員應(yīng)該記得 GitHub 上有一個(gè) Awesome - XXX 系列...
    小邁克閱讀 3,122評(píng)論 1 3
  • 世界是另一扇窗 色彩斑斕,陽(yáng)光明媚 愛情是另一處風(fēng)景 沁人心脾,沒入心扉 我曾夢(mèng)見,世界之窗,愛情之眼 光的芒璀璨...
    山半閱讀 471評(píng)論 20 20
  • 之前看捉妖記的時(shí)候,被劇中的胡巴所萌倒,表情豐富萌態(tài)十足,長(zhǎng)得像個(gè)蘿卜,整天黏著喊爹爹爹爹。我們脊髓康復(fù)科就...
    風(fēng)飛雪閱讀 651評(píng)論 4 0
  • test1
    檀玉飛閱讀 148評(píng)論 0 1

友情鏈接更多精彩內(nèi)容