轉(zhuǎn)載自:
https://mp.weixin.qq.com/s/TT0xR4tmhIsRQgBM501zsw
https://github.com/juliangaal/python-cheat-sheet/tree/master/NumPy
Numpy是一個用python實現(xiàn)的科學計算的擴展程序庫,包括:
- 一個強大的N維數(shù)組對象Array
- 比較成熟的(廣播)函數(shù)庫
- 用于整合C/C++和Fortran代碼的工具包
- 實用的線性代數(shù)、傅里葉變換和隨機數(shù)生成函數(shù)。numpy和稀疏矩陣運算包scipy配合使用更加方便。
NumPy(Numeric Python)提供了許多高級的數(shù)值編程工具,如:矩陣數(shù)據(jù)類型、矢量處理,以及精密的運算庫。專為進行嚴格的數(shù)字處理而產(chǎn)生。多為很多大型金融公司使用,以及核心的科學計算組織如:Lawrence Livermore,NASA用其處理一些本來使用C++,F(xiàn)ortran或Matlab等所做的任務(wù)。
1. 安裝numpy
$ pip install numpy
或
$ conda install numpy
2. 基礎(chǔ)
NumPy最常用的功能之一就是NumPy數(shù)組:列表和NumPy數(shù)組的最主要區(qū)別在于功能性和速度。
列表提供基本操作,但NumPy添加了FTTs、卷積、快速搜索、基本統(tǒng)計、線性代數(shù)、直方圖等。
兩者數(shù)據(jù)科學最重要的區(qū)別是能夠用NumPy數(shù)組進行元素級計算。
2.1 占位符
| 操作 | 描述 | 文檔 |
|---|---|---|
| np.linspace(0, 2, 9) | 數(shù)組中創(chuàng)建等差的值 | |
| np.zeros((1, 2)) | 創(chuàng)建全0數(shù)組 | |
| np.ones((1, 2)) | 創(chuàng)建全1數(shù)組 | |
| np.random.random((5, 5)) | 創(chuàng)建隨機數(shù)的數(shù)組 | |
| np.empty((2, 2)) | 創(chuàng)建空數(shù)組 |
舉例:
import numpy as np
# 1 dimensional
x = np.array([1,2,3])
# 2 dimensional
y = np.array([(1,2,3),(4,5,6)])
x = np.arange(3)
>>> array([0, 1, 2])
y = np.arange(3.0)
>>> array([ 0., 1., 2.])
x = np.arange(3,7)
>>> array([3, 4, 5, 6])
y = np.arange(3,7,2)
>>> array([3, 5])
2.2 數(shù)組屬性
| 語法 | 描述 | 文檔 |
|---|---|---|
| array.shape | 維度(行, 列) | |
| len(array) | 數(shù)組長度 | |
| array.ndim | 數(shù)組的維度數(shù) | |
| array.size | 數(shù)組的元素數(shù) | |
| array.dtype | 數(shù)據(jù)類型 | |
| type(array) | 顯示數(shù)組類型 |
3. 拷貝/排序
| 操作 | 描述 | 文檔 |
|---|---|---|
| np.copy(array) | 創(chuàng)建數(shù)組拷貝 | |
| other = array.copy() | 創(chuàng)建數(shù)組深拷貝 | |
| array.sort() | 排序一個數(shù)組 | |
| array.sort(axis=0) | 按照指定軸排序一個數(shù)組 |
舉例
import numpy as np
# Sort sorts in ascending order
y = np.array([10, 9, 8, 7, 6, 5, 4, 3, 2, 1])
y.sort()
print(y)
>>> [ 1 2 3 4 5 6 7 8 9 10]
4. 數(shù)組操作例程
- 增加或減少元素
| 操作 | 描述 | 文檔 |
|---|---|---|
| np.append(a, b) | 增加數(shù)據(jù)項到數(shù)組 | |
| np.insert(array, 1, 2, axis) | 沿著數(shù)組0軸或1軸插入數(shù)據(jù)項 | |
| np.resize((2, 4)) | 將數(shù)組調(diào)整為形狀(2, 4) | |
| np.delete(array, 1, axis) | 從數(shù)組里刪除數(shù)據(jù)項 |
舉例
import numpy as np
# Append items to array
a = np.array([(1, 2, 3),(4, 5, 6)])
b = np.append(a, [(7, 8, 9)])
print(b)
>>> [1 2 3 4 5 6 7 8 9]
# Remove index 2 from previous array
print(np.delete(b, 2))
>>> [1 2 4 5 6 7 8 9]
- 組合數(shù)組
| 操作 | 描述 | 文檔 |
|---|---|---|
| np.concatenate((a, b), axis=0) | 連接2個數(shù)組,添加到末尾 | |
| np.vstack((a, b)) | 按照行堆疊數(shù)組 | |
| np.hstack((a, b)) | 按照列堆疊數(shù)組 |
舉例
import numpy as np
a = np.array([1, 3, 5])
b = np.array([2, 4, 6])
# Stack two arrays row-wise
print(np.vstack((a,b)))
>>> [[1 3 5]
[2 4 6]]
# Stack two arrays column-wise
print(np.hstack((a,b)))
>>> [1 3 5 2 4 6]
- 分割數(shù)組
| 操作 | 描述 | 文檔 |
|---|---|---|
| numpy.split() | 分割數(shù)組 | |
| np.array_split(array, 3) | 將數(shù)組拆分為大?。◣缀酰┫嗤淖訑?shù)組 | |
| numpy.hsplit(array, 3) | 在第3個索引出水平拆分數(shù)組 |
# Split array into groups of ~3
a = np.array([1, 2, 3, 4, 5, 6, 7, 8])
print(np.array_split(a, 3))
>>> [array([1, 2, 3]), array([4, 5, 6]), array([7, 8])]
- 數(shù)組形狀變化
| 操作 | 描述 | 文檔 |
|---|---|---|
| other = ndarray.flatten() | 平鋪一個二維數(shù)組到一維數(shù)組 | |
| numpy.flip() | 翻轉(zhuǎn)一維數(shù)組中元素的順序 | |
| np.ndarray[::-1] | 翻轉(zhuǎn)一維數(shù)組中元素的順序 | |
| reshape | 改變數(shù)組的維數(shù) | |
| squeeze | 從數(shù)組的形狀中刪除單維度條目 | |
| expand_dims | 擴展數(shù)組維度 |
- 其他
| 操作 | 描述 | 文檔 |
|---|---|---|
| array = np.transpose(other) / array.T | 數(shù)組轉(zhuǎn)置 | |
| inverse = np.linalg.inv(matrix) | 求矩陣的逆矩陣 |
舉例
# Split array into groups of ~3
a = np.array([1, 2, 3, 4, 5, 6, 7, 8])
print(np.array_split(a, 3))
>>> [array([1, 2, 3]), array([4, 5, 6]), array([7, 8])]
- 比較
| 操作 | 描述 | 文檔 |
|---|---|---|
| == | 等于 | |
| != | 不等于 | |
| < | 小于 | |
| > | 大于 | |
| <= | 小于等于 | |
| >= | 大于等于 | |
| np.array_eaqual(x, y) | 數(shù)組比較 |
舉例
# Using comparison operators will create boolean NumPy arrays
z = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
c = z < 6
print(c)
>>> [ True True True True True False False False False False]
- 基本的統(tǒng)計
| 操作 | 描述 | 文檔 |
|---|---|---|
| np.mean(array) | MEAN | |
| np.median | MEDIAN | |
| np.corrcoef | CORRELATION COEFFICIENT | |
| np.std(array) | STANDARD DEVIATION |
舉例
# Statistics of an array
a = np.array([1, 1, 2, 5, 8, 10, 11, 12])
# Standard deviation
print(np.std(a))
>>> 4.2938910093294167
# Median
print(np.median(a))
>>> 6.5
- 更多
| 操作 | 描述 | 文檔 |
|---|---|---|
| array.sum() | 數(shù)組求和 | |
| array.min() | 數(shù)組求最小值 | |
| array.max(axis=0) | 數(shù)組求最大值(沿這0軸) | |
| array.cumsum(axis=0) | 指定軸求累積和 |
6. 切片和子集
| 操作 | 描述 | 文檔 |
|---|---|---|
| array[i] | 索引i處的一位數(shù)組 | |
| array[i, j] | 索引在[i][j]處的二維數(shù)組 | |
| array[i<4] | 布爾索引 | |
| array[0:3] | 選擇索引為0, 1, 2 | |
| array[0:2, 1] | 選擇第0,1行,第1列 | |
| array[:1] | 選擇第0行數(shù)據(jù)項(與[0:1 , :]相同) | |
| array[1:2, :] | 選擇第1行 | |
| array[::-1] | 反轉(zhuǎn)數(shù)組 |
舉例:
b = np.array([(1, 2, 3), (4, 5, 6)])
# The index *before* the comma refers to *rows*,
# the index *after* the comma refers to *columns*
print(b[0:1, 2])
>>> [3]
print(b[:len(b), 2])
>>> [3 6]
print(b[0, :])
>>> [1 2 3]
print(b[0, 2:])
>>> [3]
print(b[:, 0])
>>> [1 4]
c = np.array([(1, 2, 3), (4, 5, 6)])
d = c[1:2, 0:2]
print(d)
>>> [[4 5]]
切片舉例
import numpy as np
a1 = np.arange(0, 6)
a2 = np.arange(10, 16)
a3 = np.arange(20, 26)
a4 = np.arange(30, 36)
a5 = np.arange(40, 46)
a6 = np.arange(50, 56)
a = np.vstack((a1, a2, a3, a4, a5, a6))

image.png
7.小技巧
- 布爾索引
# Index trick when working with two np-arrays
a = np.array([1,2,3,6,1,4,1])
b = np.array([5,6,7,8,3,1,2])
# Only saves a at index where b == 1
other_a = a[b == 1]
#Saves every spot in a except at index where b != 1
other_other_a = a[b != 1]
import numpy as np
x = np.array([4,6,8,1,2,6,9])
y = x > 5
print(x[y])
>>> [6 8 6 9]
# Even shorter
x = np.array([1, 2, 3, 4, 4, 35, 212, 5, 5, 6])
print(x[x < 5])
>>> [1 2 3 4 4]