僅供學習參考,轉載請注明出處
迭代器
迭代是訪問集合元素的一種方式。迭代器是一個可以記住遍歷的位置的對象。迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會后退。
1. 可迭代對象
我們已經(jīng)知道可以對list、tuple、str等類型的數(shù)據(jù)使用for...in...的循環(huán)語法從其中依次拿到數(shù)據(jù)進行使用,我們把這樣的過程稱為遍歷,也叫迭代。
但是,是否所有的數(shù)據(jù)類型都可以放到for...in...的語句中,然后讓for...in...每次從中取出一條數(shù)據(jù)供我們使用,即供我們迭代嗎?
例如:整型int的數(shù)據(jù)就無法迭代。
In [1]: for i in 100:
...: print(i)
...:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-1-86150fa0c47d> in <module>()
----> 1 for i in 100:
2 print(i)
3
TypeError: 'int' object is not iterable
In [2]:
從上面可以看到錯誤提示TypeError: 'int' object is not iterable,提示int并不是迭代類型。
那么類是否是一種迭代類型呢?
In [2]: class MyList(object):
...: def __init__(self):
...: self.list = []
...: def add(self,item):
...: self.list.append(item)
...:
In [3]: mylist = MyList()
In [4]: mylist.add(1)
In [5]: mylist.add(2)
In [6]: mylist.add(3)
In [8]: for num in mylist:
...: print(num)
...:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-8-1e13316c02cd> in <module>()
----> 1 for num in mylist:
2 print(num)
3
TypeError: 'MyList' object is not iterable
In [9]: for num in mylist.list:
...: print(num)
...:
1
2
3
In [10]:
從上面可以看出,就算定義一個類的一個值為list這種迭代類型,自身類也并不是迭代類型。其實在寫的過程就肯定覺得有問題的。
那么如果改寫一下,讓類變成可迭代的類型呢?
2. 如何判斷一個對象是否可以迭代
可以使用 isinstance() 判斷一個對象是否是 Iterable 對象:
In [10]: from collections import Iterable
In [11]: isinstance([],Iterable)
Out[11]: True
In [12]: isinstance({},Iterable)
Out[12]: True
In [13]: isinstance('hello',Iterable)
Out[13]: True
In [14]: isinstance(mylist,Iterable)
Out[14]: False
In [15]: isinstance(100,Iterable)
Out[15]: False
In [16]:
從上面的執(zhí)行來看,list、dict、string等都是Iterable對象類型,而mylist實例、100都不是。
3. 可迭代對象的本質
我們分析對可迭代對象進行迭代使用的過程,發(fā)現(xiàn)每迭代一次(即在
for...in...中每循環(huán)一次)都會返回對象中的下一條數(shù)據(jù),一直向后讀取數(shù)據(jù)直到迭代了所有數(shù)據(jù)后結束。那么,在這個過程中就應該有一個
“人”去記錄每次訪問到了第幾條數(shù)據(jù),以便每次迭代都可以返回下一條數(shù)據(jù)。我們把這個能幫助我們進行數(shù)據(jù)迭代的“人”稱為迭代器(Iterator)。可迭代對象的本質就是可以向我們提供一個這樣的中間
“人”即迭代器幫助我們對其進行迭代遍歷使用。可迭代對象通過
__iter__方法向我們提供一個迭代器,我們在迭代一個可迭代對象的時候,實際上就是先獲取該對象提供的一個迭代器,然后通過這個迭代器來依次獲取對象中的每一個數(shù)據(jù).那么也就是說,一個具備了
__iter__方法的對象,就是一個可迭代對象。
給前面的
Mylist類新增一個__iter__方法,再查看對象是否為可迭代對象
In [16]: class MyList(object):
...: def __init__(self):
...: self.list = []
...: def add(self,item):
...: self.list.append(item)
...: def __iter__(self):
...: pass
...:
In [18]: mylist = MyList()
In [19]: isinstance(mylist,Iterable)
Out[19]: True
In [20]:
這回測試發(fā)現(xiàn)添加了__iter__方法的mylist對象已經(jīng)是一個可迭代對象了。
4. iter()函數(shù)與next()函數(shù)
-
list、tuple等都是可迭代對象,我們可以通過iter()函數(shù)獲取這些可迭代對象的迭代器。 - 然后我們可以對獲取到的迭代器不斷使用
next()函數(shù)來獲取下一條數(shù)據(jù)。 -
iter()函數(shù)實際上就是調用了可迭代對象的__iter__方法。
# 創(chuàng)建list
In [20]: li = [1,2,3,4,5]
# 將list放入迭代器中
In [21]: li_iter = iter(li)
# 調用next方法,打印迭代器的內(nèi)容
In [22]: next(li_iter)
Out[22]: 1
In [23]: next(li_iter)
Out[23]: 2
In [24]: next(li_iter)
Out[24]: 3
In [25]: next(li_iter)
Out[25]: 4
In [26]: next(li_iter)
Out[26]: 5
# 迭代器next已經(jīng)沒有數(shù)據(jù)了,這個異??梢灶愃谱鳛閣hile方法的break條件
In [27]: next(li_iter)
---------------------------------------------------------------------------
StopIteration Traceback (most recent call last)
<ipython-input-27-ab6a83f394a1> in <module>()
----> 1 next(li_iter)
StopIteration:
In [28]:
注意,當我們已經(jīng)迭代完最后一個數(shù)據(jù)之后,再次調用next()函數(shù)會拋出StopIteration的異常,來告訴我們所有數(shù)據(jù)都已迭代完成,不用再執(zhí)行next()函數(shù)了。
5. 迭代器Iterator
- 通過上面的分析,我們已經(jīng)知道,迭代器是用來幫助我們記錄每次迭代訪問到的位置,當我們對迭代器使用
next()函數(shù)的時候,迭代器會向我們返回它所記錄位置的下一個位置的數(shù)據(jù)。 - 實際上,在使用
next()函數(shù)的時候,調用的就是迭代器對象的__next__方法(Python3中是對象的__next__方法,Python2中是對象的next()方法)。 - 所以,我們要想構造一個迭代器,就要實現(xiàn)它的
__next__方法。 - 但這還不夠,
python要求迭代器本身也是可迭代的,所以我們還要為迭代器實現(xiàn)__iter__方法,而__iter__方法要返回一個迭代器,迭代器自身正是一個迭代器,所以迭代器的__iter__方法返回自身即可。 - 一個實現(xiàn)了
__iter__方法和next()方法的對象,就是迭代器。
In [21]: class MyList(object):
...: def __init__(self):
...: self.list = []
...: self.current = 0
...:
...: def add(self,var):
...: self.list.append(var)
...:
...: def next(self):
...: if self.current < len(self.list):
...: item = self.list[self.current]
...: self.current += 1
...: return item
...: else:
...: raise StopIteration
...:
...: def __iter__(self):
...: return self
...:
In [22]:
In [22]: mylist = MyList()
In [23]: isinstance(mylist,Iterable)
Out[23]: True
In [24]: mylist.add(1)
In [25]: mylist.add(2)
In [26]: mylist.add(3)
In [27]: mylist.next()
Out[27]: 1
In [28]: mylist.next()
Out[28]: 2
In [29]: mylist.next()
Out[29]: 3
In [30]: mylist.next()
---------------------------------------------------------------------------
StopIteration Traceback (most recent call last)
<ipython-input-30-1897446021c8> in <module>()
----> 1 mylist.next()
<ipython-input-21-110aa633e856> in next(self)
13 return item
14 else:
---> 15 raise StopIteration
16
17 def __iter__(self):
StopIteration:
In [31]:
In [31]:
In [31]: mylist = MyList()
In [32]: mylist.add(1)
In [33]: mylist.add(2)
In [34]: mylist.add(3)
In [35]: for num in mylist:
...: print(num)
...:
1
2
3
In [36]:
從上面的代碼可以看出,在python2使用了next方法之后,就可以正常迭代調用next以及使用for循環(huán)進行打印。
6. for...in...循環(huán)的本質
for item in Iterable 循環(huán)的本質就是先通過iter()函數(shù)獲取可迭代對象Iterable的迭代器,然后對獲取到的迭代器不斷調用next()方法來獲取下一個值并將其賦值給item,當遇到StopIteration的異常后循環(huán)結束。
7. 迭代器的應用場景
我們發(fā)現(xiàn)迭代器最核心的功能就是可以通過next()函數(shù)的調用來返回下一個數(shù)據(jù)值。如果每次返回的數(shù)據(jù)值不是在一個已有的數(shù)據(jù)集合中讀取的,而是通過程序按照一定的規(guī)律計算生成的,那么也就意味著可以不用再依賴一個已有的數(shù)據(jù)集合,也就是說不用再將所有要迭代的數(shù)據(jù)都一次性緩存下來供后續(xù)依次讀取,這樣可以節(jié)省大量的存儲(內(nèi)存)空間。
舉個例子,比如,數(shù)學中有個著名的斐波拉契數(shù)列(Fibonacci),數(shù)列中第一個數(shù)為0,第二個數(shù)為1,其后的每一個數(shù)都可由前兩個數(shù)相加得到:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, ...
現(xiàn)在我們想要通過for...in...循環(huán)來遍歷迭代斐波那契數(shù)列中的前n個數(shù)。那么這個斐波那契數(shù)列我們就可以用迭代器來實現(xiàn),每次迭代都通過數(shù)學計算來生成下一個數(shù)。
#coding=utf-8
class FibIterator(object):
"""斐波那契數(shù)列迭代器"""
def __init__(self, n):
"""
:param n: int, 指明生成數(shù)列的前n個數(shù)
"""
self.n = n
# current用來保存當前生成到數(shù)列中的第幾個數(shù)了
self.current = 0
# num1用來保存前前一個數(shù),初始值為數(shù)列中的第一個數(shù)0
self.num1 = 0
# num2用來保存前一個數(shù),初始值為數(shù)列中的第二個數(shù)1
self.num2 = 1
def next(self):
"""被next()函數(shù)調用來獲取下一個數(shù)"""
if self.current < self.n:
num = self.num1
self.num1, self.num2 = self.num2, self.num1+self.num2
self.current += 1
return num
else:
raise StopIteration
def __iter__(self):
"""迭代器的__iter__返回自身即可"""
return self
if __name__ == '__main__':
fib = FibIterator(10)
for num in fib:
print(num)
執(zhí)行如下:
G:\Python27\python.exe F:/pythonProject/Iter/iter.py
0
1
1
2
3
5
8
13
21
34
8. 并不是只有for循環(huán)能接收可迭代對象
除了for循環(huán)能接收可迭代對象,list、tuple等也能接收。
if __name__ == '__main__':
fib = FibIterator(10)
for num in fib:
print(num)
# 使用list接收
li = list(FibIterator(15))
print(li)
# 使用tunple接收
tp = tuple(FibIterator(6))
print(tp)
執(zhí)行如下:
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377]
(0, 1, 1, 2, 3, 5)

關注微信公眾號,回復【資料】、Python、PHP、JAVA、web,則可獲得Python、PHP、JAVA、前端等視頻資料。