數(shù)據(jù)科學(xué)已經(jīng)發(fā)展成為一個(gè)龐大的系統(tǒng),包含數(shù)學(xué)、統(tǒng)計(jì)學(xué)、概率論、計(jì)算機(jī)、數(shù)據(jù)庫、編程等各種理論技術(shù)。
目前在主流的數(shù)據(jù)科學(xué)領(lǐng)域一般有三大生態(tài),一是以sas、matlab、spss等為代表的商業(yè)軟件生態(tài),二是圍繞R語言建立起來的開源生態(tài),三是目前較為火熱的Python數(shù)據(jù)科學(xué)生態(tài)。
為什么Python會(huì)脫穎而出,成為數(shù)據(jù)科學(xué)的第三極,而且越來越受歡迎呢?
這是因?yàn)閿?shù)據(jù)科學(xué)編程需要非常靈活的語言,編寫代碼很簡(jiǎn)單,但可以處理高度復(fù)雜的數(shù)學(xué)處理。
Python可以說最適合這樣的需求,所以大量的數(shù)據(jù)科學(xué)庫如春筍般冒出來,有的已經(jīng)發(fā)展成高度完善的企業(yè)級(jí)庫。
比如說Pandas、Numpy、Matplotlib、Sklearn、NLTK等,還有深度學(xué)習(xí)領(lǐng)域的Keras、Tensorflow、Pytorch、Caffe等,都是頂尖的數(shù)據(jù)科學(xué)工具。
Github上有一個(gè)項(xiàng)目,專門匯總了Python數(shù)據(jù)科學(xué)的核心知識(shí)點(diǎn),并以速查表的形式,濃縮在一張張圖片里。
速查表清單:

Python基礎(chǔ)

1.Python基礎(chǔ).png
Pandas基礎(chǔ)

2.Pandas基礎(chǔ).png
Pandas進(jìn)階

3.Pandas進(jìn)階.png
Numpy基礎(chǔ)

4.Numpy基礎(chǔ).png
Matplotlib基礎(chǔ)

5.Matplotlib基礎(chǔ).png
Seaborn基礎(chǔ)

6.Seaborn基礎(chǔ).png
Bokeh基礎(chǔ)

7.Bokeh基礎(chǔ).png
Scipy基礎(chǔ)

8.Scipy基礎(chǔ).png
scikit-learn基礎(chǔ)

9.scikit-learn基礎(chǔ).png
keras基礎(chǔ)

10.keras基礎(chǔ).png
Jupyter基礎(chǔ)

11.Jupyter基礎(chǔ).png
數(shù)據(jù)IO

12.數(shù)據(jù)IO.png
SQL基礎(chǔ)

13.SQL基礎(chǔ).png
Dask基礎(chǔ)

14.Dask基礎(chǔ).png
Dask進(jìn)階

15.Dask進(jìn)階.png
PySpark基礎(chǔ)

16.PySpark基礎(chǔ).png
PySpark進(jìn)階

17.PySpark進(jìn)階.png
可視化基礎(chǔ)

18.可視化基礎(chǔ).jpg
