set是一組無序集合,集合中的每個(gè)元素都是獨(dú)一無二的,集合本身可以添加、刪除元素,下面我們來了解一下集合(set)的特性
定義一個(gè)集合
a={1,True,'Hello world',(1,2,3)}
print(type(a))
# 輸出 set
元組使用小括號(hào)( ),列表使用中括號(hào)[ ],而集合則使用了大括號(hào){ }來定義
集合的特性
- 無序
之前分享字符串、列表、元組的時(shí)候他們都有一個(gè)相同的特點(diǎn):有序,所以我們可以通過索引和切片的方式訪問每個(gè)元素。但是集合是無序的,這就意味著我們不能使用索引或切片
a={1,2,3,4,5}
print(a[1])
print(a[1:3])
# 以上情況都會(huì)報(bào)錯(cuò)
- 每個(gè)元素都是獨(dú)一無二的
對比列表、元組你會(huì)發(fā)現(xiàn)集合中的每個(gè)元素都是唯一的,因?yàn)榧系倪@種特性,我們往往可以使用集合去重
a={1,2,3,4,4,3,2}
print(a)
# 輸出 {1,2,3,4}
添加元素
add( )或者update( )都可以給集合添加元素,不同的是添加單個(gè)元素的時(shí)候使用add( ),如果被添加的對象是tuple( )、list( )、set( )等類型時(shí)可以使用update( ),下面通過代碼演示一下兩者的區(qū)別
- add( )的使用方法
a = {1,2,3,4,5}
a.add(6)
print(a)
# 輸出 {1,2,3,4,5,6}
- update( )的使用方法
a = {1,2,3,4,5}
a.update((5,6,7))
print(a)
# 輸出 {1,2,3,4,5,6,7}
刪除元素
discard( )和remove( )都可以刪除集合中的元素,兩種方法之間唯一的區(qū)別在于,如果元素不存在于集合中,使用discard( )刪除元素集合保持不變,而remove( )則會(huì)報(bào)錯(cuò)
a={1,2,3,4}
a.discard(5)
print(a)
# 輸出 {1,2,3,4}
a.remove(5)
# 報(bào)錯(cuò)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 5
pop( )和clear( )也可以刪除集合中元素
a={1,2,3,4,5}
print(a.pop())
# 輸出1
print(a)
# 輸出{2,3,4,5}
a.clear()
print(a)
# 輸出 set()
小結(jié) discard( )、remove( )、pop( )、clear( )之間的區(qū)別
- discard( )刪除不存在的集合元素不會(huì)報(bào)錯(cuò)
- remove( )刪除元素不存在的集合元素會(huì)報(bào)錯(cuò)
- pop( ) 會(huì)返回被刪除的元素
- clear( )清空元素
集合的數(shù)學(xué)運(yùn)算
求兩個(gè)集合的差集
- 需求: {1,2,3,4}、{2,3,5}.從第一個(gè)集合中剔除第二個(gè)集合也存在的元素
a={1,2,3,4}
b={2,3,5}
a-b
# 輸出{1,4}
或
a.difference(b)
# 輸出{1,4}
求兩個(gè)集合的交集
- 需求: 求{1,2,3,4}、{2,3}這兩個(gè)集合的相同元素
a={1,2,3,4}
b={2,3,5}
a&b
# 輸出{2,3}
或
a.intersection(b)
# 輸出{2,3}
求兩個(gè)集合的并集
- 需求:把{1,2,3,4}、{3,4,5}這兩個(gè)集合合并成一個(gè),并且不能有重復(fù)元素
a={1,2,3,4}
b={2,3,5}
a|b
# 輸出{1,2,3,4,5}
或
a.union(b)
# 輸出{1,2,3,4,5}
上面的三種方法已經(jīng)能滿足大部分需求,但是你可能還有一種需求,剔除兩個(gè)集合中相同的元素,并且讓不同的元素組成一個(gè)新的集合,如下面的代碼所示:
a={1,2,3,4}
b={3,4,5,6}
# 組成{1,2,5,6}
a^b
或
a.symmetric_difference(b)
# 輸出{1,2,5,6}
集合中的更多內(nèi)置方法
拷貝一個(gè)集合
a={1,2,3,4}
b=a.copy()
print(b)
# 輸出{1,2,3,4}
判斷兩個(gè)集合是否存在共同元素
a={1,2,3,4}
b={100,200,300}
c={1,100,4}
print(a.isdisjoint(b))
# 沒有共同元素 返回True
print(a.isdisjoint(c))
# 有共同元素 返回 False
判斷一個(gè)集合是否包含另外一個(gè)集合
a={1,2,3,4}
b={1,2,3,4,5}
# 判斷a是否是b的子集
print(a.issubset(b))
# 輸出 True
# 判斷b是否是a的子集
print(b.issubset(a))
# 輸出 False
判斷集合中的元素是否都是true
print(all({1,2,3,'Test'}))
# 輸出 True
# 如果集合為空也會(huì)返回True
print(all({}))
# 輸出 True
print(all({False,3,4,5}))
# 輸出 False
計(jì)算集合的長度
a={1,2,3,4,5}
print(len(a))
# 輸出 5
print(len({}))
# 輸出 0
計(jì)算集合中最大值
a={1,2,3,4,5}
print(max(a))
# 輸出 5
計(jì)算集合中的最小值
a={1,2,3,4,5}
print(min(a))
# 輸出 1
計(jì)算集合元素的和
a={1,2,3,4,5}
print(sum(a))
# 輸出 15
判斷一個(gè)元素是否存在于集合
a={1,2,3,4,5}
print(1 in a)
# 輸出 True
print(10 in a)
# 輸出 False
list和set的相互轉(zhuǎn)化
a=[1,2,3,4,5]
print(set(a))
# 輸出{1,2,3,4,5}
a={1,2,3,4,5}
print(list(a))
# 輸出[1,2,3,4,5]
list和set的相互轉(zhuǎn)化可以去除list中的重復(fù)元素,主要就是借助了集合元素必須獨(dú)一無二的特性
總結(jié):集合是python中一種重要的數(shù)據(jù)類型,要重點(diǎn)掌握集合的基本特性,熟練運(yùn)用差集、交集、并集,一些內(nèi)置方法可以先了解一下,方便日后寫代碼的時(shí)候查閱資料