問題
在字符串中匹配指定的文本模式并替換
解決方案
對于簡單的字面模式,直接使用 str.replace() 方法即可,比如:
text = 'yeah, but no, but yeah, but no, but yeah'
print(text.replace('yeah', 'yep'))
yep, but no, but yep, but no, but yep
對于復(fù)雜的匹配,需要使用 re 模塊中的 sub() 函數(shù)。 比如: 將11/27/2012 的日期字符串改成 2012-11-27 。示例如下:
import re
text = 'Today is 11/27/2018. PyCon starts 3/13/2018.'
print(re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text))
Today is 2018-11-27. PyCon starts 2018-3-13.
sub() 函數(shù)中的第一個參數(shù)是匹配模式,第二個參數(shù)是替換模式。反斜杠數(shù)字指向匹配模式中的分組號。
討論
如果除了替換后的結(jié)果外,還想知道替換了多少次,可以使用 re.subn() 來代替。比如:
new_text, n = re.subn(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)
print(new_text)
print(n)
Today is 2018-11-27. PyCon starts 2018-3-13.
2