今天,在GitHub上偶然看到了Kailash Ahirwar作者的一個項目cheatsheets-ai,該項目包含了從不同渠道收集的數(shù)十張速查表,涉及到大數(shù)據(jù)分析、機器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域,包括數(shù)據(jù)科學(xué)相關(guān)庫Pandas、PySpark等,機器學(xué)習(xí)相關(guān)庫Scikit-learn等,以及深度學(xué)習(xí)相關(guān)庫TensorFlow等,非常適用于初學(xué)者。還等什么,趕快拿去用吧。
1. 數(shù)據(jù)科學(xué)庫速查表
1. 1 Numpy
Numpy 作為Python科學(xué)計算核心庫之一,能夠創(chuàng)建高性能多維數(shù)組對象Array,并提供了處理數(shù)組的相關(guān)工具。
這里還是要推薦下小編的大數(shù)據(jù)學(xué)習(xí)QQ裙:532218147,Python學(xué)習(xí)群:483546416,不管你是小白還是大牛,小編我都?xì)g迎,不定期分享干貨,包括小編自己整理的一份2018最新的大數(shù)據(jù)資料和0基礎(chǔ)入門教程,歡迎初學(xué)和進階中的小伙伴。在不忙的時間我會給解答
Numpy速查表
1.2?Pandas
Pandas是基于Numpy的數(shù)據(jù)分析庫,提供了python編程語言的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。
Pandas速查表
1.3 Scipy
Scipy也是基于Numpy的擴展包,包含一些Python語言的數(shù)學(xué)算法和便捷方程,是科學(xué)計算核心庫之一。
Scipy速查表
1.4 PySpark/PySpark-RDD/PySparkSQL
PySpark、PySpark-RDD與PySparkSQL是 Spark 為 Python 開發(fā)者提供的 API,是大數(shù)據(jù)內(nèi)存計算的常用框架之一。
PySpark速查表
PySparkSQL速查表
2. 數(shù)據(jù)可視化庫速查表
2.1 Matplotlib
Matplotlib是python的2D繪制圖庫,它以各種硬拷貝格式和跨平臺的交互式環(huán)境生成出版質(zhì)量級別的圖形。
Matplotlib速查表
2.2 ggplot2
基于圖形語法的ggplot2核心理念是把是每張圖片拆解為一個數(shù)據(jù)集、一套可以展示數(shù)據(jù)點的視覺系統(tǒng)和一個坐標(biāo)系。
ggplot2速查表
3. 機器學(xué)習(xí)庫速查表
3.1 Scikit-learn
Scikit-learn是python的一個用統(tǒng)一接口進行機器學(xué)習(xí)預(yù)處理、交叉驗證和可視化算法的開源庫。
Scikit-learn速查表
4. 深度學(xué)習(xí)庫速查表
4.1 TensorFlow
作為深度學(xué)習(xí)領(lǐng)域最流行的框架,并不需要什么介紹。
TensorFlow速查表
4.2 Karas
Karas是Theano和TensorFlow平臺上一款強大易用的深度學(xué)習(xí)庫。
Karas速查表
4.3 Neural Networks Zoo
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)盤點。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)