Python 中的容器 collections

Python 中的容器 collections

寫(xiě)在之前

我們都知道 Python 中內(nèi)置了許多標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu),比如列表,元組,字典等。與此同時(shí)標(biāo)準(zhǔn)庫(kù)還提供了一些額外的數(shù)據(jù)結(jié)構(gòu),我們可以基于它們創(chuàng)建所需的新數(shù)據(jù)結(jié)構(gòu)。

Python 附帶了一個(gè)「容器」模塊 collections,它包含了很多的容器數(shù)據(jù)類(lèi)型,今天我們來(lái)討論其中幾個(gè)常用的容器數(shù)據(jù)類(lèi)型,掌握了這幾個(gè)可以減少我們重復(fù)造輪子所帶來(lái)的煩擾。

namedtuple

相信你已經(jīng)熟悉了元組,一個(gè)元組相當(dāng)于一個(gè)不可變的列表,你可以存儲(chǔ)一個(gè)數(shù)據(jù)的序列。這里要說(shuō)的 namedtuple(命名元組)和元組非常像,它們都不能修改自己的數(shù)據(jù)。說(shuō)完了像,那么它們有哪些地方不像呢?

作為元組,為了獲取其中的數(shù)據(jù),我們需要使用整數(shù)作為索引:

>>> people = ('Rocky', 'python')
>>> print(people[0])
Rocky

而 namedtuple 把元組變成了一個(gè)針對(duì)簡(jiǎn)單任務(wù)的容器,我們不必使用整數(shù)索引來(lái)訪(fǎng)問(wèn) namedtuple 的數(shù)據(jù),反而可以像用字典一樣訪(fǎng)問(wèn) namedtuple。

>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky)
people(name='rocky', age=23, like='python')
>>> print(Rocky.name)
rocky

一個(gè) namedtuple 有兩個(gè)必須的參數(shù):元組名稱(chēng)和字段名稱(chēng)。在上面的代碼中,我們的元組名稱(chēng)是 people,字段名稱(chēng)是 name,age,like。nametuple 讓元組變的更加易讀,很容易理解代碼是做什么的,同樣我們也不用使用整數(shù)索引來(lái)訪(fǎng)問(wèn)一個(gè)命名元組(上面代碼我們用 name 訪(fǎng)問(wèn)了 namedtuple 中的數(shù)據(jù)),這讓我們的代碼更加容易維護(hù)。

但是你一定要記住的是,雖然它的用法很爽,但它還是一個(gè)元組!所以屬性值在 namedtuple 中是不可變的。

我們?cè)谏厦嬲f(shuō)過(guò)可以像用字典一樣訪(fǎng)問(wèn) namedtuple,那么當(dāng)然也可以把它轉(zhuǎn)為字典,具體操作如下所示:

>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky._asdict())
OrderedDict([('name', 'rocky'), ('age', 23), ('like', 'python')])

defaultdict

我之前在使用字典的時(shí)候相當(dāng)隨意,只是隨便 dict 一下就好了,然而這樣使用存在一個(gè)問(wèn)題:當(dāng)使用的 key 不存在的時(shí)候會(huì)報(bào) KeyError,而 defaultdict 就比較厲害了,我們完全不需要檢查 key 是否存在,所以我們能像下面這樣做的隨心所欲:

from collections import defaultdict
languages = (
 ('rocky', 'python'),
 ('snow', 'c'),
 ('leey', 'java'),
 ('rocky', 'c++'),
 ('leey', 'c#')
)
favourite = defaultdict(list)
for name, language in languages:
 favourite[name].append(language)
print(favourite)

輸出如下所示:

defaultdict(<type 'list'>, {'leey': ['java', 'c#'], 'rocky': ['python', 'c++'], 'snow': ['c']})

然后我們?cè)倩氐健版I不存在,會(huì)觸發(fā) KeyError 異?!边@個(gè)問(wèn)題上來(lái),我們先來(lái)看 dict 觸發(fā) KeyError 的例子:

my_dict = {}
my_dict['name']['like'] = 'python'

輸出如下:

KeyError: 'name'

defaultdict 則用了一個(gè)非常巧妙的方式繞過(guò)了這個(gè)問(wèn)題,請(qǐng)看下面的操作:

import collections
language = lambda : collections.defaultdict(language)
my_dict = language()
my_dict['name']['like'] = 'python'

運(yùn)行一下顯示正常,我們可以用 json.dumps 打印出 my_dict 的內(nèi)容:

import json
print(json.dumps(my_dict))

運(yùn)行結(jié)果如下:

{"name": {"like": "python"}}

Counter

Counter 是一個(gè)計(jì)數(shù)器,它可以幫助我們針對(duì)某項(xiàng)數(shù)據(jù)進(jìn)行計(jì)數(shù),比如可以用它來(lái)統(tǒng)計(jì)每個(gè)人擅長(zhǎng)的編程語(yǔ)言:

from collections import Counter
languages = (
 ('rocky', 'python'),
 ('snow', 'c'),
 ('leey', 'java'),
 ('rocky', 'c++'),
 ('leey', 'c#')
)
cnt = Counter(name for name, language in languages)
print(cnt)

運(yùn)行結(jié)果如下所示:

Counter({'leey': 2, 'rocky': 2, 'snow': 1})

當(dāng)然我們也可以用它來(lái)統(tǒng)計(jì)一個(gè)文件,比如:

from collections import Counter
with open('test.txt', 'rb') as f:
 line_cnt = Counter(f)
print(line_cnt)

deque

deque 提供了一個(gè)雙端隊(duì)列,我們可以在首尾兩端添加或者刪除元素,在前面的文章中(Python 標(biāo)準(zhǔn)庫(kù)之雙端隊(duì)列)寫(xiě)過(guò),沒(méi)看過(guò)的可以看看。

想要使用 deque,首先我們要從 collections 中導(dǎo)入 deque 模塊,然后創(chuàng)建一個(gè) deque 對(duì)象,它的用法就像我們前面學(xué)過(guò)的 list 一樣,并且提供了類(lèi)似的方法,具體如下所示:

from collections import deque
deq = deque()
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
print(len(deq))
print(deq[0])
print(deq[-1])

輸出結(jié)果如下:

deque([1, 2, 3])
3
1
3

我們可以從兩端取出數(shù)據(jù):

from collections import deque
deq = deque(range(5))
print('len(deq) == {}'.format(len(deq)))
deq.popleft()
deq.pop()
print(deq)

輸出的結(jié)果如下所示:

len(deq) == 5
deq == deque([1, 2, 3])

我們也可以對(duì)這個(gè)列表的大小進(jìn)行限制,當(dāng)超出我們的限制的時(shí)候,數(shù)據(jù)會(huì)從另一端被 pop 出去,具體我們來(lái)看下面的操作:

from collections import deque
deq = deque(maxlen=3)
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
deq.append(4)
print (deq)

輸出的結(jié)果如下:

deque([1, 2, 3], maxlen=3)
deque([2, 3, 4], maxlen=3)

當(dāng)超出 maxlen 的值時(shí),最左邊的數(shù)據(jù)將從隊(duì)列中刪除。

當(dāng)然我們還可以從任意一端擴(kuò)展這個(gè)雙端隊(duì)列中的數(shù)據(jù):

from collections import deque
deq = deque([1,2,3])
deq.extendleft([0])
deq.extend([4,5,6])
print(deq)

輸出的結(jié)果如下所示:

deque([0, 1, 2, 3, 4, 5, 6])

如果有那些不足的地方,歡迎大家補(bǔ)充!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容