$$\mathrm{《Python科學計算》學習筆記}$$
[TOC]
Numpy
數(shù)組入門
數(shù)組創(chuàng)建
-
np.array:數(shù)組 -
a.shape =:原地變換. -
b = a.reshape((...)):變換后,內(nèi)容共享! a.dtypenp.arange(始,末不含,步長)-
np.linspace(),[endpoint=False] logspace([base = x])a = np.fromstring(s,dtype = int)a = np.fromfunction(func,(10,))- 對于
array的切片賦值,內(nèi)容共享(這和list列表不同)
下標方法
- 切片賦值,內(nèi)容共享(這和list列表不同)
- 整數(shù)列表存取,不共享
- bool數(shù)組,不共享
- 不能用bool列表,否則等同于0,1的整數(shù)列表存取
多維數(shù)組
- 二維數(shù)組:
a = b(列數(shù)組) + c(行數(shù)組) - 數(shù)組下標是一個元組?。ú皇莝lice)
多維數(shù)組存取
- 特例:
整數(shù),整數(shù):返回得到內(nèi)容數(shù)字,不是array! - 整數(shù)看成切片,只有整數(shù)/切片,內(nèi)容共享(返回
array)-
slice(a,b,c)返回切片 -
np.s_[::2,2:]生成切片
-
- 只要有元組/列表,bool數(shù)組任何一個,內(nèi)容不共享
- 如果元組/列表只有一個數(shù)字,當作數(shù)字->切片處理,但依然不共享
- 元組/列表非單個數(shù)字部分必須所有維數(shù)長度一致,用于一一對應(不同于切片作用)
- 剩余維數(shù)對應下標
:
結(jié)構(gòu)數(shù)組
-
persontype = np.dtype({'names':['name1','name2',...], 'formats':['S32','i']}, [align = True])←內(nèi)存對齊 np.dtype([('name1','|S32'),('name2','i'),...])np.dtype({'name1':(類型,地址偏移),...})
-
a = np.array([("HKK",3),("KHH",4)],dtype = persontype)-
|忽視順序;<低位字節(jié)在前;>高位字節(jié)在前
-
a[0]['name1']-
a.tofile('test.dat')寫入二進制文件 -
b = a['name1']內(nèi)容共享 - 元素為一個數(shù)組的定義方法2:
('name','type',(維度長度))
數(shù)組的存儲細節(jié)
-
stride各維地址偏移量,dimensions各維長度,dim count維數(shù) -
np.array([order="F"]):數(shù)組按Fortan方式存儲,即列優(yōu)先 as_strided(a,shape = , strides = )- 查詢
-
a.flags的OWNDATA,C_CONTIGUOUS,F_CONTIGUOUS id(b.base) == id(a)
-
函數(shù)
ufunc
np.sin(x,[out = x])-
math.sin()(單獨運算快)和np.sin()(整個數(shù)組一起運算快) -
a.item(*,*) ~ a[*,*]但返回標準Python類型
數(shù)學運算
-
y = x1 + x2->np.add(x1,x2[,y]) -
subtract,multiply -
divide(/),true_divide(/返回精確),floor_divide(//返回取整)-
_future_.division?
-
-
negative(-),power(**) -
remainder或mod - 表達式不能太復雜:自動的中間變量
關(guān)系運算
-
equal,not_equal,less,less_equal,greater,greater_equal - 均已重載
布爾運算
- 無法重載原符號
-
np.logical_and(a==b , a>b)相當于a>=b -
np.logical_or,np.logical_not,np.logical_xor
其它
- 位運算:
np.bitwise_and, ...相當于&,|,~,^- 對布爾數(shù)組 位運算=關(guān)系運算!(但注意優(yōu)先級變了)
-
any(),all()
自定義ufunc函數(shù)
- 一般函數(shù):
somefun(x,c1) - 可對數(shù)組操作函數(shù):
ufunc = np.frompyfun(somefun,2,1)(輸入個數(shù),輸出個數(shù)) -
y = ufunc(x,c1)(x可以是數(shù)組) -
y = y.astype(np.float)(必須改類型)(astype產(chǎn)生新數(shù)組)
廣播
- 維度數(shù)目不同,少的在低維添長為1的維
- 對應維運算,某維長為1的運算當作復制為需要長度;長度不為1的,如果長度不同,報錯
- 新產(chǎn)生廣播(結(jié)果有用維1維):
x,y = np.ogrid[:5,:5]-
np.ogrid[:1:4j,:1:3j]表示0-1中4個值/3個值(相當linspace)
-
- (結(jié)果有用維多維):
x,y = np.mgrid[:5,:5] - 已有數(shù)組產(chǎn)生廣播(結(jié)果有用維1維):
gy,gx = np.ix_(y,x)
ufunc函數(shù)方法
-
<operation>.reduce(array [,axis = 0, dtype = None])- 數(shù)組元素連續(xù)運算,只給最后結(jié)果
-
<op>.accumulate(...):類似reduce但是,結(jié)果與輸入維數(shù)相同,給中間結(jié)果 -
<op>.reduceat(array, indices = [...]):結(jié)果和indices長度相同- 前小后大連續(xù)算;前大后小給那個值;最后一個連續(xù)算到
[-1]
- 前小后大連續(xù)算;前大后小給那個值;最后一個連續(xù)算到
-
<op>.out(array1, array2):產(chǎn)生二維數(shù)組,是一個組合運算結(jié)果表
多維數(shù)組下標存取
- 下標是元組,應盡量顯式使用元組表示下標
- 下標:整數(shù);切片;整數(shù)數(shù)組(列表/元組則轉(zhuǎn));布爾數(shù)組
- 只有整數(shù)數(shù)組:
- 各維數(shù)組廣播,取對應維的值,結(jié)果與廣播后維度、長度相同
-
ind0, ind1, ind2 = np.broadcast_arrays(i0,i1,i2)與b = a[i0,i1,i2]
- 整數(shù)數(shù)組+切片
- 切片的那一維造成的維度全部往后放,廣播造成的維度靠前
- 整數(shù)、單個元素的整數(shù)數(shù)組造成的效果與切片
[..., 2:3,...]效果不同,不產(chǎn)生任何結(jié)果維度上的影響,只是該維下標釘死
- 布爾數(shù)組下標
- 相當于使用
np.nonzero(b)(b有幾維,結(jié)果有幾個數(shù)組組成的元組,表示True元素下標的對應維的值)
- 相當于使用
函數(shù)庫
基本函數(shù)
- 求和:
np.sum(a [,axis = None, dtype = ***, out = ])-
axis不填則為整個求和,dtype數(shù)據(jù)較多時要用精度高的
-
- 平均值:
np.mean(a [,axis = None, dtype = ***, out = ])- 整數(shù)默認用雙精度浮點數(shù)算
-
std():標準差;var():方差
最值與排序
- 產(chǎn)生隨機數(shù)組:
a = np.random.randint(0,10,size=(4,5)) -
min()max()ptp()(極差)-
axisout參數(shù)
-
-
np.argmax()np.argmin()第一次出現(xiàn)的位置- 不指定
axis參數(shù),給平坦化后位置 - 平坦化:
a.ravel()(不改變a) - 從平坦化位置轉(zhuǎn)成多維下標:
idx = np.unravel_index(num, a.shape)
- 不指定
- 從小到大排序:
np.sort(a [, axis = -1])- 返回新數(shù)組
- 平坦化排序:
axis = None
- 排序下標:
idx = np.argsort(a [, axis = -1])- 返回值表示:原來在該值為下標的那個數(shù)字放到現(xiàn)在這個值的位置上,見下
a[idx] == np.sort(a)
- 中位數(shù):
np.median(a [,axis = -1])
多項式
- 一元多項式:
p = np.poly1d(a),a是數(shù)組,高次項在左邊-
p()像函數(shù)一樣用
-
-
p + [1,2]p*pp/[1,1](返回商式和余式) - 求導:
p.deriv();積分:p.integ() - 求根:
r = np.roots(p):返回多個根放在一個數(shù)組里,p(r) == array([0,0,0,...]) - 從根轉(zhuǎn)回多項式系數(shù):
np.poly(r),返回系數(shù)數(shù)組 - 擬合:
a = np.polyfit(x,y,deg)(deg最高次指數(shù)),返回系數(shù)數(shù)組- 通過系數(shù)數(shù)組計算多項式值:
np.polyval(a,x)
- 通過系數(shù)數(shù)組計算多項式值:
分段函數(shù)
-
x = where(condition, y, z)-
xconditionyz是同樣維數(shù)數(shù)組 - C語言級別,比
frompyfunc()快
-
-
select(condlist, choicelist, default = 0)- 找
condlist中最先滿足的 np.select([x>=c, x<c0], [0, x/c0*hc], default = (c-x)/(c-c0)*hc)- 內(nèi)存開銷很大
- 找
-
piecewise(x, condlist, funclist)-
funclist比condlist長1,最后表示其它情況
-
-
lambda x : x**x:創(chuàng)建簡單小函數(shù)
統(tǒng)計函數(shù)
- 找出數(shù)組中不同值,從小到大排:
x = np.unique(a)-
return_index = True:多返回idx,a[idx] == x -
return_inverse = True:返回a中元素在x中的下標
-
-
np.bincount(a [, weights = w])非負整數(shù)數(shù)組,元素出現(xiàn)次數(shù)統(tǒng)計-
w權(quán)重,和a長度相同
-
- 直方圖統(tǒng)計:
hist, bin_edges = np.histogram(a, bins = , range = None, normed = False, weights = None)-
bins區(qū)間數(shù),或給定的每個區(qū)間邊界列表(長度區(qū)間數(shù)+1) -
range數(shù)據(jù)范圍,默認(最小,最大) -
normed:False統(tǒng)計個數(shù),否則概率化 -
hist:統(tǒng)計結(jié)果數(shù)組;bin_edges:區(qū)間邊界數(shù)組(長度區(qū)間數(shù)+1)
-
線性代數(shù)
Matrix對象
a = np.matrix([[...],[...],[...]])- 直接計算:
a* a**-1 - 后面不再用Matrix對象
dot乘積運算
dot(x,y)- 一維乘一維:相當于行列相乘
- 請不要用一維乘二維:
x一維,y二維行向量不行;x二維列,y一維不行;x二維行向量,y一維居然可以 - 多維乘多維
x[i1,i2,l,m], y[j1,j2,j3,m,n],結(jié)果z[i1,i2,l,j1,j2,j3,n]
inner乘積inner(x,y)
- 多維數(shù)組最后一維相乘求和(本質(zhì)就是一維乘一維,其它維不過相當于列表)
-
x[i1,i2,m], y[j1,j2,j3,m],結(jié)果z[i1,i2,j1,j2,j3]
outer乘積outer(x,y)
- 列向量乘行向量!展成二維
- 輸入多維,先展平為一維
多元一次方程組
-
x = np.linalg.solve(a,b),a是N*N二維數(shù)組,b是N長一維數(shù)組,輸出N的一維數(shù)組 -
x = np.linalg.lstsq(a,b),a是X*N數(shù)組,得最小二乘解 - 正態(tài)隨機數(shù):
np.random.standard_normal(len)
文件存取
底層二進制存取
a.tofile("name.bin")b = np.fromfile("name.bin",dtype = np.int32)- 需要指定
dtype,讀入后b.shape = (*,*) - 指定
sep參數(shù),文本輸出/輸入,sep是分隔符
高級二進制存取
-
np.save("a.npy", a)(單)- C語言格式
-
c = np.load("a.npy")(單) -
np.savez("result.npz", a, b, newname = c)(多)- 關(guān)鍵字參數(shù)給參數(shù)起名,非關(guān)鍵字默認:
arr_0,arr_1,...
- 關(guān)鍵字參數(shù)給參數(shù)起名,非關(guān)鍵字默認:
-
r = np.load("result.npz")(多)-
r["arr_0"] =r["newname"] =
-
高級文本存取
np.savetxt("a.txt", a [, fmt = '%.18e', delimiter = " "])np.loadtxt("b.csv", delimiter = ",", dtype = np.***)- 結(jié)構(gòu)存取
dtype = persontype
簡單的底層文本存取
f = file("test.csv")f.readline()data = np.loadtxt(f, delimiter = ",")-
f = file("result.npy", "wb")f = file("result.npy", "rb") -
np.save(f,a)np.load(f)-
saveload可連續(xù)使用,在文件中存取多個變量
-
內(nèi)存映射數(shù)組
- 從文件讀取的變量和文件內(nèi)容掛鉤,改變量也可以改文件
-
a = np.memmap(filename, deype = uint8, mode = "**", offset = 0, shape = None, order = "C")-
dtpyeNumpy類型;offset讀文件起始位置偏移,字節(jié)單位;orderC/Fortran -
mode:r只讀;c修改但不寫入文件;r+數(shù)組可讀寫,結(jié)果寫入文件;w+創(chuàng)建或覆蓋已有文件(可以缺省filename)
-
-
a.flush()把a的值按mode規(guī)定的規(guī)則寫入(有的就不能寫入)
[TOC]