一、常用數(shù)據(jù)分析庫(kù)
安裝命令:pip install / conda install *(如果安裝了 Anaconda 可使用后面那個(gè)命令,但是缺點(diǎn)就是 conda install 會(huì)安裝或更新庫(kù)所以來(lái)的各種庫(kù),而 pip install 不會(huì)更新) *
- pip install numpy (建議:https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 在這里下載對(duì)應(yīng)版本的 whl文件,安裝下載之后我們以后就沒(méi)必要去安裝 mkl 了,本地安裝格式:pip install 路徑\文件名.whl)
- pip install scipy
- pip install pandas
- pip install matplotlib
簡(jiǎn)介:
Nuympy : 提供常用的數(shù)值數(shù)組、矩陣等函數(shù)
優(yōu)點(diǎn):1.是基于向量化的運(yùn)算 2.進(jìn)行數(shù)值運(yùn)算時(shí) Numpy 數(shù)組彼 list 效率高
Scipy: 是一種使用 NumPy 來(lái)做高等數(shù)學(xué)、信號(hào)處理、優(yōu)化、統(tǒng)計(jì)的擴(kuò)展包(https://docs.scipy.org/doc/)
Pandas: 是一種構(gòu)建于 Numpy 的高級(jí)數(shù)據(jù)結(jié)構(gòu)和精巧工具,快速簡(jiǎn)單的處理數(shù)據(jù)。
數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame
Matplotlib: 繪圖庫(kù)
二、常用高級(jí)數(shù)據(jù)分析庫(kù)
自然語(yǔ)言處理工具包
安裝:pip install -U nltk
應(yīng)用:文本提取、詞匯切分、詞頻分析、詞袋模型、情感分析-
圖計(jì)算和社交網(wǎng)絡(luò)分析
安裝:pip install -U python-igraph (直接這樣安裝可能會(huì)出現(xiàn)問(wèn)題)
解決辦法:
1- 打開(kāi)網(wǎng)址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
2- 下載對(duì)應(yīng) python 版本的 whl (筆者是 wind7x64位 py 是 3.6):
1522148091(1).jpg
3- 下載完之后,使用命令窗口指定到該目錄下,并以 pip install 文件名 進(jìn)行執(zhí)行:
1522148244(1).jpg 基于 Scipy 之上的一個(gè)用于機(jī)器學(xué)習(xí)的 Py 模塊
安裝:pip install -U scikit-learn-
統(tǒng)計(jì)分析模塊
安裝:pip install statsmodels
如果安裝失敗則可以去這個(gè)網(wǎng)址:
https://www.lfd.uci.edu/~gohlke/pythonlibs/ 搜索該模塊并下載對(duì)應(yīng)的版本,然后安裝:
QQ截圖20180507160217.png
三、常用挖掘模塊
- 文本挖掘模塊
安裝:pip install gensim
到此就基本 Over 啦~


