Python中,u表示unicode string,表示使用unicode進(jìn)行編碼,沒有u表示byte string,類型是str,在沒有聲明編碼方式時(shí),默認(rèn)ASCI編碼。如果要指定編碼方式,可在文件頂部加入類似如下代碼:
# -*- coding: utf-8 -*-
utf-8是一種支持中文的編碼格式。
字母前加r表示raw string,也叫原始字符串常量。一般用在一下兩個(gè)方面:
- 正則表達(dá)式
用于處理正則表達(dá)式時(shí),規(guī)避反斜杠的轉(zhuǎn)義
search = re.compile(r'\s*')
- 系統(tǒng)路徑
如下面的路徑,使用r就防止了\t的轉(zhuǎn)義
path = r'e:\text'