本篇將開始介紹python高階函數(shù)map/reduce/filter的用法,更多內(nèi)容請參考:Python學(xué)習(xí)指南
map/reduce
Python內(nèi)建了map()和reduce()函數(shù)。
如果你讀過Google的那篇大名鼎鼎的論文"MapReduce: Simplified Data Processing on Large Clusters",你就能大概明白map/reduce的概念。
我們先看map。map()函數(shù)接收兩個參數(shù),一個是函數(shù),一個是序列,map將傳入的函數(shù)依次作用到序列的每個元素,并把結(jié)果作為新的list返回。
舉例說明,比如我們有一個函數(shù)f(x) = x的二次方,要把這個函數(shù)作用在一個list[1,2,3,4,5,6,7,8,9]上,就可以用map()實現(xiàn)如下:

現(xiàn)在,我們用python代碼實現(xiàn):
def f(x):
return x * x
>>>map(f, [1,2,3,4,5,6,7,8,9])
[1,4,9,16,25,36,49,64,81]
map()傳入的第一個蠶食是f,即函數(shù)對象本身。
你可能會想,不需要map()函數(shù),寫一個循環(huán),也可以計算結(jié)果:
L = []
for n in [1,2,3,4,5,6,7,8,9]:
L.append(f(n))
print L
的確可以,但是,從上面的循環(huán)代碼,能一眼看明白"把f(x)作用在list的每一個元素并把結(jié)果生成一個新的list"嗎?
所以,map()作為高階函數(shù),事實上它把運算規(guī)則抽象了,因此,我們不但可以計算簡單的f(x) = x的二次方,還可以計算呢任意復(fù)雜的函數(shù),比如,把這個list所有數(shù)字轉(zhuǎn)化為字符串:
>>>map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9])
['1', '2', '3', '4', '5', '6', '7', '8', '9']
只需要一行代碼。
再看reduce的用法。reduce把一個函數(shù)作用在一個序列[x1, x2, x3...]上,這個函數(shù)必須接收兩個參數(shù),reduce把結(jié)果繼續(xù)和序列的下一個元素做累積計算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
比如說對一個序列求和,就可以用reduce實現(xiàn):
def add(x, y):
return x + y
>>>reduce(add, [1, 3, 5, 7, 9])
25
當(dāng)然求和運算可以直接用Python內(nèi)建函數(shù)sum(),沒必要動用reduce。
但是如果要把序列[1, 3, 5, 7, 9]變成整數(shù)13579,reduce就可以派上用場:
def fn(x, y):
return x * 10 + y
>>>reduce(fn, [1, 3, 5, 7, 9])
13579
這個例子本身沒多大用處,但是,如果考慮到字符串str也是一個序列,對上面的例子稍加改動,配合map()函數(shù),我們就可以寫出把str轉(zhuǎn)換為int的函數(shù):
def fn(x, y):
return x * 10 + y
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
>>>reduce(fn, map(char2num, '13579'))
13579
整理成一個str2int的函數(shù)就是:
def str2int(s):
def fn(x, y):
return x * 10 + y
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
return reduce(fn, map(char2num, s))
還可以用lambda函數(shù)進一步簡化成:
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
def str2int(s):
return reduce(lambda x,y: x*10+y, map(char2num, s))
也就是說,假設(shè)Python沒有提供int()函數(shù),你完全可以自己寫一個把字符串轉(zhuǎn)化為整數(shù)的函數(shù),而且只需要幾行代碼!
filter
Python內(nèi)建的filter()函數(shù)用于過濾序列。
和map()類似,filter()也接收一個函數(shù)和一個序列。和map()不同的是,filter()把傳入的函數(shù)依次作用與每個元素,然后根據(jù)返回值是True還是False決定保留還是丟棄該元素。
例如,在一個list中,刪掉偶數(shù),只保留奇數(shù),可以這么寫:
def is_odd(n):
return n % 2 == 1
filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15])
# 結(jié)果: [1, 5, 9, 15]
把一個序列中的空字符串刪掉,可以這么寫:
def not_empty(s):
return s and s.strip()
filter(not_empty, ['A', '', 'B', None, 'C', ' '])
# 結(jié)果: ['A', 'B', 'C']
可見用filter()這個高階函數(shù),關(guān)鍵在于正確實現(xiàn)一個“篩選”函數(shù)。