Python氣象數(shù)據(jù)處理進(jìn)階之Xarray(6):數(shù)據(jù)重組與換形

這一部分涉及到了常用的操作,比如調(diào)換維度的位置,給數(shù)據(jù)重新reshape換形等等,建議大家可以認(rèn)真閱讀這部分。
老樣子,先新建一個(gè)數(shù)組

ds = xr.Dataset({'wind': (('time', 'lat', 'lon'), [[[42]]]), 'temperature': (('lat', 'lon'), [[24]])})
print(ds)
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (time, lat, lon) int64 42
#    temperature  (lat, lon) int64 24

ex1調(diào)換維度順序

比如說在求某個(gè)東西時(shí)需要將時(shí)間維放在最后一維,但是數(shù)據(jù)本身的時(shí)間在第一維,那么便可以用到這個(gè)操作。
第一種是精準(zhǔn)換位,指定每個(gè)維度的位置

print(ds.transpose('lat', 'lon', 'time'))
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (lat, lon, time) int64 42
#    temperature  (lat, lon) int64 24

第二種是單獨(dú)換位,只對(duì)指定維度換位,將time放在最后,其余不變

print(ds.transpose(..., 'time'))

第三種為全部換位,相當(dāng)于數(shù)組轉(zhuǎn)置

print(ds.transpose())

ex2數(shù)組擴(kuò)展與壓縮

擴(kuò)展指增加一個(gè)維度,壓縮指將一個(gè)維度擠壓掉

expanded  = ds.expand_dims('level')
print(expanded)
#<xarray.Dataset>
#Dimensions:      (lat: 1, level: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, level, lon, time
#Data variables:
#    wind         (level, time, lat, lon) int64 42
#    temperature  (level, lat, lon) int64 24

print(expanded.squeeze('level'))
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (time, lat, lon) int64 42
#    temperature  (lat, lon) int64 24

官方文檔中接下來有一段是關(guān)于DataArray向DataSet轉(zhuǎn)換的,個(gè)人感覺放在這一章節(jié)并不合理,我后邊會(huì)整理放進(jìn)Python氣象數(shù)據(jù)處理進(jìn)階之Xarray(1)中(我覺得兩種基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)以及互相轉(zhuǎn)換應(yīng)該最開始介紹的)。所以接下來跳過這部分。

ex3堆疊與拆分

個(gè)人感覺可能處理站點(diǎn)數(shù)據(jù)會(huì)用到這個(gè)方法
換一個(gè)數(shù)組演示

dr = xr.DataArray(np.random.randn(2, 3),coords=[('country', ['a', 'b']), ('lat', [10, 20, 30])])
print(dr)
#<xarray.DataArray (country: 2, lat: 3)>
#array([[ 0.29837508,  0.27556996,  0.51204495],
#       [-0.15700884,  0.72290308, -1.63887609]])
#Coordinates:
#  * country  (country) <U1 'a' 'b'
#  * lat      (lat) int64 10 20 30

現(xiàn)在將這個(gè)2維數(shù)組堆疊成1維

print(dr.stack(z=('country', 'lat')))
#<xarray.DataArray (z: 6)>
#array([ 0.29837508,  0.27556996,  0.51204495, -0.15700884,  0.72290308,
#       -1.63887609])
#Coordinates:
#  * z        (z) MultiIndex
#  - country  (z) object 'a' 'a' 'a' 'b' 'b' 'b'
#  - lat      (z) int64 10 20 30 10 20 30

也可以拆分,其實(shí)就是反堆疊

stacked = dr.stack(z=('country', 'lat'))
print(stacked.unstack('z'))
#<xarray.DataArray (country: 2, lat: 3)>
#array([[ 0.29837508,  0.27556996,  0.51204495],
#       [-0.15700884,  0.72290308, -1.63887609]])
#Coordinates:
#  * country  (country) object 'a' 'b'
#  * lat      (lat) int64 10 20 30

最重要的是不同于Pandas,Xarray的stack不缺自動(dòng)丟失缺測值!?。?br> Xarray還提供了將不同變量stack的例子,有興趣的可以去看看。這個(gè)用法感覺比較雞肋

ex4 設(shè)置與重設(shè)索引

da = xr.DataArray(np.random.rand(4),
                  coords={'band': ('x', ['a', 'a', 'b', 'b']), 'wavenumber': ('x', np.linspace(200, 300, 4))},dims='x')
print(da)
#<xarray.DataArray (x: 4)>
#array([0.37036232, 0.34338772, 0.49457694, 0.50916783])
#Coordinates:
#    band        (x) <U1 'a' 'a' 'b' 'b'
#    wavenumber  (x) float64 200.0 233.3 266.7 300.0
#Dimensions without coordinates: x
mda = da.set_index(x=['band', 'wavenumber'])
print(mda)
#<xarray.DataArray (x: 4)>
#array([0.15970166, 0.89733114, 0.25545876, 0.27371103])
#Coordinates:
#  * x           (x) MultiIndex
#  - band        (x) object 'a' 'a' 'b' 'b'
#  - wavenumber  (x) float64 200.0 233.3 266.7 300.0

這塊比較難理解,建議還是先讀第一篇文章,弄清數(shù)據(jù)結(jié)構(gòu),da數(shù)組顯示Dimensions without coordinates: x,而通過da.set_index函數(shù),將X設(shè)置為混合索引號(hào)。
之后便可以實(shí)線自由索引:

print(mda.sel(band='a'))
#<xarray.DataArray (wavenumber: 2)>
#array([0.15970166, 0.89733114])
#Coordinates:
#  * wavenumber  (wavenumber) float64 200.0 233.3

通過mda.reset_index('x')重置。
reorder_levels()函數(shù)允許調(diào)換索引順序(個(gè)人感覺比較雞肋)

mda.reorder_levels(x=['wavenumber', 'band'])

ex5數(shù)組滑動(dòng)

這小節(jié)應(yīng)該是這篇文章和數(shù)組換形換維同等重要的。

array = xr.DataArray([1, 2, 3, 4], dims='x')
print(array)
#<xarray.DataArray (x: 4)>
#array([1, 2, 3, 4])
#Dimensions without coordinates: x
print(array.shift(x=2))
#<xarray.DataArray (x: 4)>
#array([nan, nan,  1.,  2.])
#Dimensions without coordinates: x
print(array.roll(x=2, roll_coords=True))
#<xarray.DataArray (x: 4)>
#array([3, 4, 1, 2])
#Dimensions without coordinates: x

這就是對(duì)數(shù)組進(jìn)行滾動(dòng)。這個(gè)的作用主要在于做差分計(jì)算。雖然前邊講過Xarray提供了中央差計(jì)算函數(shù),但是仍需要更靈活的操作,滾動(dòng)函數(shù)就實(shí)現(xiàn)了這個(gè)目的。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容