為什么選擇NumPy?
NumPy提供了對(duì)多維數(shù)組(矩陣)的高效支持,同時(shí)還有以下優(yōu)點(diǎn):
- ndarray,核心數(shù)據(jù)結(jié)構(gòu),支持矢量運(yùn)算的多維數(shù)組,在內(nèi)存中進(jìn)行連續(xù)存儲(chǔ);
- 各種操作多維數(shù)組的函數(shù);
- 用于集成其他編程語(yǔ)言的各種接口;
多維的創(chuàng)建
In [1]: import numpy as np
In [2]: a1 = np.array([1, 2, 3, 4])
In [3]: a1.shape
Out[3]: (4,)
In [4]: a1.size
Out[4]: 4
In [5]: a1.dtype
Out[5]: dtype('int32')
In [6]: a2 = np.array([[1.0, 2.5, 3], [0.5, 4, 9]])
In [7]: a2.shape
Out[7]: (2, 3)
In [8]: a2.size
Out[8]: 6
In [9]: a2.min()
Out[9]: 0.5
In [10]: a2.dtype
Out[10]: dtype('float64')
In [11]: a1
Out[11]: array([1, 2, 3, 4])
In [12]: a2
Out[12]:
array([[ 1. , 2.5, 3. ],
[ 0.5, 4. , 9. ]])
In [13]: type(a1)
Out[13]: numpy.ndarray
以上代碼中,首先通過(guò)import關(guān)鍵字導(dǎo)入了NumPy軟件包,接著分別創(chuàng)建了a1和a2兩個(gè)數(shù)組,其中a1為一維數(shù)組,a2為二維數(shù)組。二維數(shù)組有行列之分,可以用ndarray.shape得到。
還可以通過(guò)ndarray.size屬性得到數(shù)組的元素個(gè)數(shù),ndarray.dtype屬性則記錄了數(shù)組內(nèi)部存儲(chǔ)的元素是什么類型,ndarray還有其他各種方法,比如min返回所有元素中的最小值,更多方法在ipython中通過(guò)輸入ndarray對(duì)象后,輸入.,再按下tab鍵查看。
除了用np.array創(chuàng)建數(shù)組外,NumPy還有多種方法可以創(chuàng)建多維數(shù)組:
- np.arange類似于Python內(nèi)置的range,創(chuàng)建一維數(shù)組;
- np.ones創(chuàng)建元素值全部為1的數(shù)組;
- np.zeros創(chuàng)建元素值全為0的數(shù)組;
- np.empty創(chuàng)建空值多維數(shù)組,只分配內(nèi)存,不填充任何值;
- np.random.random創(chuàng)建元素值為隨機(jī)值的多維數(shù)組;
以上全部函數(shù)都能接收一個(gè)dtype參數(shù),用于指定多維數(shù)組元素的類型。而后四個(gè)函數(shù)需要通過(guò)元組指定創(chuàng)建的數(shù)組形狀。也可以設(shè)置多維數(shù)組,只要指定形狀的元組長(zhǎng)度為3和4即可。還可以通過(guò)ndarray.ndim屬性得到數(shù)組的維度。
In [15]: a1 = np.arange(4)
In [16]: a1
Out[16]: array([0, 1, 2, 3])
In [17]: a1.ndim
Out[17]: 1
In [18]: a2 = np.ones((4, 4), dtype=np.int64)
In [19]: a2
Out[19]:
array([[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]], dtype=int64)
In [20]: a2.dtype
Out[20]: dtype('int64')
In [21]: a2.ndim
Out[21]: 2
In [22]: a2.shape
Out[22]: (4, 4)
In [23]: a3 = np.zeros((2, 2))
In [25]: a3
Out[25]:
array([[ 0., 0.],
[ 0., 0.]])
In [26]: a3.dtype
Out[26]: dtype('float64')
In [27]: a3.ndim
Out[27]: 2
In [28]: a4 = np.empty((3, 3), dtype=np.int64)
In [29]: a4
Out[29]:
array([[ 0, 0, 0],
[ 0, 0, 1240],
[ 29555336411086848, 30399297484750848, 8247048604598075392]], dtype=int64)
In [30]: a4.dtype
Out[30]: dtype('int64')
In [31]: a4.shape
Out[31]: (3, 3)
In [32]: a4.ndim
Out[32]: 2
In [33]: a5 = np.ones((4, 3, 4))
In [34]: a5
Out[34]:
array([[[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.]],
[[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.]],
[[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.]],
[[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.],
[ 1., 1., 1., 1.]]])
In [35]: a5.ndim
Out[35]: 3
In [36]: a5.shape
Out[36]: (4, 3, 4)
當(dāng)沒(méi)有指定dtype類型時(shí),多維數(shù)組元素類型默認(rèn)時(shí)float64。
ndarray對(duì)象還可以通過(guò)reshape方法變形為其他維度的數(shù)組:
In [35]: a5.ndim
Out[35]: 3
In [36]: a5.shape
Out[36]: (4, 3, 4)
In [37]: a = np.arange(12)
In [38]: a
Out[38]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
In [39]: a.reshape(4, 3)
Out[39]:
array([[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8],
[ 9, 10, 11]])
reshape方法的參數(shù)為指定數(shù)組形狀的元組。
多維數(shù)組索引
在Python中列表可以非常靈活的使用 :切片選擇部分元素,在NumPy中的多維數(shù)組也可以使用類似的方法:
In [40]: a = np.arange(12)
In [41]: a
Out[41]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
In [42]: a[1:4]
Out[42]: array([1, 2, 3])
In [43]: a[1:10:2]
Out[43]: array([1, 3, 5, 7, 9])
多維數(shù)組的切片功能還要強(qiáng)大的多,可以通過(guò)切片進(jìn)行賦值操作,一次性改變數(shù)組中的多個(gè)元素:
In [44]: a
Out[44]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
In [45]: a[1:5] = -1
In [46]: a
Out[46]: array([ 0, -1, -1, -1, -1, 5, 6, 7, 8, 9, 10, 11])
In [47]: a[1:10:2] = 1
In [48]: a
Out[48]: array([ 0, 1, -1, 1, -1, 1, 6, 1, 8, 1, 10, 11])
多維數(shù)組可以通過(guò)shape知道具體形狀,也可以通過(guò)多維數(shù)組中的每個(gè)維度進(jìn)行切片選擇:
In [49]: a = np.arange(12).reshape(3, 4)
In [50]: a
Out[50]:
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
In [51]: a[0]
Out[51]: array([0, 1, 2, 3])
In [52]: a[1]
Out[52]: array([4, 5, 6, 7])
In [53]: a[:, 0]
Out[53]: array([0, 4, 8])
In [54]: a[:, 1]
Out[54]: array([1, 5, 9])
In [55]: a[:, 2]
Out[55]: array([ 2, 6, 10])
In [56]: a[0, 0]
Out[56]: 0
In [57]: a[0, 1]
Out[57]: 1
In [58]: a[1, 1]
Out[58]: 5
In [59]: a[1, 2]
Out[59]: 6
In [60]: a[0] = 1
In [61]: a
Out[61]:
array([[ 1, 1, 1, 1],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
In [62]: a[:, 1] = -1
In [63]: a
Out[63]:
array([[ 1, -1, 1, 1],
[ 4, -1, 6, 7],
[ 8, -1, 10, 11]])
二維數(shù)組可以通過(guò)a[x, y]的方式來(lái)索引,三維數(shù)組可以通過(guò)a[x, y, z]的方式來(lái)索引。
當(dāng)選擇的維度數(shù)量小于數(shù)組的維度時(shí),其實(shí)是對(duì)多維數(shù)組進(jìn)行降維選擇,對(duì)于二維數(shù)組:
In [63]: a
Out[63]:
array([[ 1, -1, 1, 1],
[ 4, -1, 6, 7],
[ 8, -1, 10, 11]])
選擇其中一個(gè)具體元素,可以使用a[x, y]的形式,如果只通過(guò)a[1]進(jìn)行選擇,選到的結(jié)果是array([ 4, -1, 6, 7]),結(jié)果變成了一維數(shù)組,也就是降維選擇。
In [65]: a = np.arange(27).reshape(3, 3, 3)
In [66]: a.ndim
Out[66]: 3
In [68]: a
Out[68]:
array([[[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8]],
[[ 9, 10, 11],
[12, 13, 14],
[15, 16, 17]],
[[18, 19, 20],
[21, 22, 23],
[24, 25, 26]]])
In [69]: a1 = a[1]
In [70]: a1
Out[70]:
array([[ 9, 10, 11],
[12, 13, 14],
[15, 16, 17]])
In [71]: a1.shape
Out[71]: (3, 3)
In [72]: a2 = a[1, 1]
In [73]: a2
Out[73]: array([12, 13, 14])
In [74]: a2.shape
Out[74]: (3,)
In [75]: a2.ndim
Out[75]: 1
In [76]: a[2, 2, 2]
Out[76]: 26
In [77]: a[:, 1] = 1
In [78]: a
Out[78]:
array([[[ 0, 1, 2],
[ 1, 1, 1],
[ 6, 7, 8]],
[[ 9, 10, 11],
[ 1, 1, 1],
[15, 16, 17]],
[[18, 19, 20],
[ 1, 1, 1],
[24, 25, 26]]])
對(duì)于多維數(shù)組,如果想根據(jù)第二維度以后的維度來(lái)選擇,可以使用a[:, 1]的形式。比如在上面演示的三維數(shù)組中,我們通過(guò)a[:, 1]選擇了第二位度上的元素。
多維數(shù)組的基礎(chǔ)運(yùn)算
在Numpy中基礎(chǔ)運(yùn)算向普通語(yǔ)法一樣簡(jiǎn)潔:
In [79]: a = np.arange(12).reshape(3, 4)
In [80]: a
Out[80]:
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
In [81]: a += 1
In [82]: a
Out[82]:
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
In [83]: a *= 2
In [84]: a
Out[84]:
array([[ 2, 4, 6, 8],
[10, 12, 14, 16],
[18, 20, 22, 24]])
在執(zhí)行a += 1后,a多維數(shù)組中所有元素都被加1了。
多維數(shù)組之間的運(yùn)算:
In [85]: a = np.arange(4).reshape(2, 2)
In [86]: b = np.arange(4, 8).reshape(2, 2)
In [87]: a
Out[87]:
array([[0, 1],
[2, 3]])
In [88]: b
Out[88]:
array([[4, 5],
[6, 7]])
In [89]: b - a
Out[89]:
array([[4, 4],
[4, 4]])
In [90]: a + b
Out[90]:
array([[ 4, 6],
[ 8, 10]])
In [91]: a * b
Out[91]:
array([[ 0, 5],
[12, 21]])
多維數(shù)組間的運(yùn)算規(guī)則是相同位置(坐標(biāo))上的值進(jìn)行運(yùn)算得到最終的結(jié)果。多維數(shù)組的組織方式和矩陣相同,但乘法的運(yùn)算規(guī)則卻和矩陣的運(yùn)算規(guī)則不同,想對(duì)ndarray對(duì)象使用矩陣的乘法運(yùn)算,可以使用ndarray.dot方法:
In [92]: a.dot(b)
Out[92]:
array([[ 6, 7],
[26, 31]])
多維數(shù)組還支持邏輯比較運(yùn)算:
In [93]: a = np.arange(12).reshape(4, 3)
In [94]: b = a > 5
In [95]: b
Out[95]:
array([[False, False, False],
[False, False, False],
[ True, True, True],
[ True, True, True]], dtype=bool)
In [96]: a[b]
Out[96]: array([ 6, 7, 8, 9, 10, 11])
首先通過(guò)a > 5生成一個(gè)形狀和a一致的多維數(shù)組,所有為True的元素的位置在a中的值都大于5。然后就可以使用a[b]這種形式列出a中所有大于5的元素。
Numpy的多維數(shù)組還有一些方法,用于統(tǒng)計(jì)數(shù)組中的一些統(tǒng)計(jì)量,假如a為一個(gè)多維數(shù)組,則:
- a.sum計(jì)算多維數(shù)組的所有元素的和;
- a.max最大值計(jì)算;
- a.min最小值計(jì)算;
- a.mean平均值計(jì)算;
- a.std標(biāo)準(zhǔn)差計(jì)算;
- a.var方差計(jì)算;
以上所有方法,都可以接受一個(gè)axis參數(shù),用于指定具體統(tǒng)計(jì)哪根軸上的數(shù)據(jù)。比如二維數(shù)組,可以理解為有x, y兩根軸,分別代表行和列,指定axis=0時(shí)代表分別統(tǒng)計(jì)每列上的數(shù)據(jù),axis=1時(shí),代表分別統(tǒng)計(jì)每一行上的數(shù)據(jù)。沒(méi)有指定axis參數(shù)時(shí),代表統(tǒng)計(jì)所有元素。
In [97]: a
Out[97]:
array([[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8],
[ 9, 10, 11]])
In [98]: a.sum()
Out[98]: 66
In [99]: a.sum(axis=0)
Out[99]: array([18, 22, 26])
In [100]: a.sum(axis=1)
Out[100]: array([ 3, 12, 21, 30])
除了ndarray多維數(shù)組對(duì)象自己的方法外,NumPy還自帶一些通用的函數(shù),可以進(jìn)行各種計(jì)算:
- np.sqrt開(kāi)放運(yùn)算;
- np.dot矩陣乘法;
- np.sort排序;
- np.linalg模塊中包含了一些基本的線性代數(shù)計(jì)算函數(shù);
NumPy總結(jié)
NumPy主要掌握以下幾點(diǎn):
- ndarray多維數(shù)組的創(chuàng)建;
- 多維數(shù)組的索引方式;
- 多維數(shù)組的運(yùn)算規(guī)則;