環(huán)境介紹
- IDE是PyCharm專業(yè)版,社區(qū)版好像不支持圖形可視化(不確定)。
- 庫是matplotlib、numpy、pandas。
- 本文參考《利用python進行數(shù)據(jù)分析》一書,github地址請點這里
基本示例
簡單嘗試
#導入matplotil庫,用于畫圖
import matplotlib.pyplot as plt
#導入numpy庫,用于數(shù)據(jù)處理
import numpy as np
#畫圖
data = np.arange(10)
plt.plot(data)
#使圖像展示出來
plt.show()
上面的代碼展示了最簡單的圖片繪制??偨Y起來有一下幾個步驟:
- 導入繪圖和數(shù)據(jù)處理需要的庫
- 導入需要繪制成圖的數(shù)據(jù),處理這些數(shù)據(jù)。比如本例中執(zhí)行
data = np.arange(10)生成從0-9的整數(shù)。 - 繪圖并展示。這里需要說明,如果不執(zhí)行
plt.show(),在PyCharm中不會自動彈出繪制出來的圖形,需要在PyCharm界面的最右側點擊‘Sciview’按鈕進行查看。另在,如果是在Jupyter中繪圖,需要加入代碼matplotlib notebook,如果是在Ipython中運行,則需要加入代碼matplotlib。
上述代碼的執(zhí)行效果如下所示。
子圖
#導入matplotil庫,用于畫圖
import matplotlib.pyplot as plt
#導入numpy庫,用于數(shù)據(jù)處理
import numpy as np
#畫圖
data = np.arange(10)
#第一種生成子圖的方式
fig = plt.figure() #生成一個圖片對象
#將fig劃分成2行2列4個子圖 ,a1表示第1個子圖,對應subplot的三個參數(shù)。
a1 = fig.add_subplot(2,2,1)
#在生成兩個子圖
a2 = fig.add_subplot(2,2,2)
a3 = fig.add_subplot(2,2,3)
#繪圖
plt.plot(np.random.randn(50).cumsum(),'k--')
_ = a1.hist(np.random.randn(100),bins=20,color = 'k',alpha=0.3)
a2.scatter(np.arange(30),np.arange(30)+2*np.random.randn(30))
#第二種生成子圖的方式。
#生成2行3列的子圖,sharex表示所有子圖橫坐標范圍相同
fig,axs = plt.subplots(2,3,sharex=True)
#對在第1行第2列的子圖進行繪制
axs[0,1].hist(np.random.randn(100),bins=20,color = 'k',alpha=0.3)
#使圖像展示出來
plt.show()
常用的生成子圖的方式有兩種。
-
對于第一種,先生成一個圖片對象,然后在圖片對象中添加子圖。之后在自圖上進行繪制。這里注意,如果直接執(zhí)行
plt.plot,默認是在最后生成的一張子圖上進行繪制。比如本例中使用plt.plot(np.random.randn(50).cumsum(),'k--')繪制的圖出現(xiàn)在了第子圖中。‘k--’線條的一些屬性,在下一節(jié)具體列出。也可以通過'子圖名稱.XXX'的方法來具體指定在哪個子圖中繪制。如本例中使用a1.hist()命令在a1中繪制了柱狀圖。常見的圖片類型見下表,更豐富的指令請參見官方文檔。地址請點我!關鍵詞 圖片種類 angle_spectrum 角度光譜 bar 條形圖 barh 水平條圖 hist 直方圖 hist2d 2D直方圖 phase_spectrum 相位頻譜 pie 餅圖 ploar 極性圖 psd 功率光譜密度 scatter 散點圖 specgram 光譜圖 stackplot 堆疊區(qū)域圖 step 步驟圖 第一種的圖片效果如下所示;
image -
第二種創(chuàng)建子圖的方式與第一種類似。使用subplots創(chuàng)建一組圖,其中參數(shù)中的2,3表示2行3列,sharex參數(shù)表示所有子圖共享同樣的橫坐標范圍。subplots還有一些其他的參數(shù),具體請查看官網(wǎng)文檔。在繪制子圖時,可以使用如本例中
axs[0,1]的方式進行指定,[0,1]參數(shù)表示第一行第二列的子圖(行和列的計數(shù)從零開始)。效果如下所示。image 可以使用
plt.subplots_adjust()函數(shù)來調整子圖間距。
顏色、標記、線性
#導入matplotil庫,用于畫圖
import matplotlib.pyplot as plt
#導入numpy庫,用于數(shù)據(jù)處理
import numpy as np
from numpy.random import randn
#畫圖
data = np.random.randn(30).cumsum()
plt.plot(data,color='k', linestyle='dashed', marker='o', label='One')
plt.plot(data,'r-', drawstyle='steps-post', label='Two')
#生成圖例
plt.legend(loc='best')
plt.show()
上面的代碼中有兩個plt.plot,所以可以在同一個圖中繪制兩條不同的線。
- 在第一句plt.plot的參數(shù)中,‘color’表示顏色,在這里k表示黑色,linestyle表示線條的類型,marker表示標記的類型。它們也可以簡寫成一個參數(shù):‘ko--’,如第二句plt.plot中的參數(shù)‘r-’(代表紅色實線)就是這種寫法。需要注意的是,如果要用這種簡寫的方式指定標記的類型,該參數(shù)需要緊跟在顏色參數(shù)之后。比如‘ko--’中,o要緊跟在k之后。
- 如果不指定drawstyle參數(shù),則默認使用線性內(nèi)插的方式使圖像連續(xù),在第二條線中,這個參數(shù)被指定為steps-post,意思是折現(xiàn)法內(nèi)插,label屬性相當于給每條線一個名字,便于生成圖例。
- plt.legend表示要生成圖例,loc參數(shù)是指圖例出現(xiàn)的位置,best是指自動選擇位置。
- 更多關于顏色、線條、標記的屬性請參見官網(wǎng)文檔。請點這里!
效果如下所示:
刻度,坐標軸,注釋
# 導入matplotil庫,用于畫圖
import matplotlib.pyplot as plt
# 導入numpy庫,用于數(shù)據(jù)處理
import numpy as np
from numpy.random import randn
# 畫圖
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.plot(np.random.randn(1000).cumsum())
# 設置x軸上,哪些坐標處需要加刻度
ticks = ax.set_xticks([0, 250, 500, 750, 1000])
# 設置刻度的內(nèi)容
labels = ax.set_xticklabels(['one', 'two', 'three', 'four', 'five'], rotation=45, fontsize='small')
# 設置橫坐標的名稱
ax.set_xlabel('Stages')
plt.show()
- ax.set_xticks可以設置在哪些坐標處需要加刻度。
- set_xticklabels可以設置刻度的內(nèi)容,rotation參數(shù)可以用來設置旋轉的角度,fontsize可以用來設置刻度的大小。
- set_xlabel可以用來設置x軸的名稱。
效果如下所示。
# 導入matplotil庫,用于畫圖
import matplotlib.pyplot as plt
# 導入numpy庫,用于數(shù)據(jù)處理
import numpy as np
from numpy.random import randn
from datetime import datetime
import pandas as pd
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
data = pd.read_csv('C:/Users/Nighthink/Downloads/pydata-book/examples/spx.csv', index_col=0, parse_dates=True)
spx = data['SPX']
spx.plot(ax=ax, style='k-')
crisis_data = [
(datetime(2007, 10, 11), 'Peak of bull market'),
(datetime(2008, 3, 12), 'Bear Stearns Fails'),
(datetime(2008, 9, 15), 'Lehman Bankruptcy')
]
for date, label in crisis_data:
ax.annotate(label, xy=(date, spx.asof(date) + 75),
xytext=(date, spx.asof(date) + 225),
arrowprops=dict(facecolor='black', headwidth=4, width=2,
headlength=4),
horizontalalignment='left', verticalalignment='top')
# Zoom in on 2007-2010
ax.set_xlim(['1/1/2007', '1/1/2011'])
ax.set_ylim([600, 1800])
ax.set_title('Important dates in the 2008-2009 financial crisis')
- 可以使用set_xlim函數(shù)來設置橫坐標的顯示范圍,同理將x換成y可以設置縱坐標的顯示范圍。
- set_title函數(shù)可以給圖片添加一個標題
- 可以使用ax.annotate方法來在指定的x和y坐標上繪制標簽。
效果如下所示:
圖片的保存
執(zhí)行代碼plt.savegif('fig.png',dpi=400,bbox_inches='tight')可以將圖保存成png格式,文件名是fig,dpi參數(shù)表示每英寸點數(shù)的分辨率,bbox_inches參數(shù)可以用來控制實際圖像四周的空白。