Python字符串及正則表達式

1、len()函數(shù)


Len()函數(shù)的基本用法如下:

len(string)

其中,string 用于指定要進行長度統(tǒng)計的字符串。


2、切片法截取字符串


切片法截取字符串的語法格式如下:

string[start : end : step]

參數(shù)說明:

string:表示要截取的字符串。

start:表示要截取的第一個字符的索引(包括該字符),如果不指定,則默認為0。

end:表示要截取的最后一個字符的索引(不包括該字符),如果不指定則默認為字符串

的長度。

step:表示切片的步長,如果省略,則默認為1,當省略該步長時,最后一個冒號也可

以省略。


3、分割字符串


split()方法的語法格式如下:

str.split(sep, maxsplit)

參數(shù)說明:

str:表示要進行分割的字符串。

sep:用于指定分隔符,可以包含多個字符,默認為None,即所有空字符(包括空格、

換行“\n”、制表符“\t”等)。

maxsplit:可選參數(shù),用于指定分割的次數(shù),如果不指定或者為-1,則分割次數(shù)沒有限

制,否則返回結(jié)果列表的元素個數(shù),個數(shù)最多為maxsplit+1。

返回值:分隔后的字符串列表。


4、合并字符串


join()方法的語法格式如下:

strnew = string.join(iterable)

參數(shù)說明:

strnew:表示合并后生成的新字符串。

零基礎(chǔ)學(xué)Python

string:字符串類型,用于指定合并時的分隔符。

iterable:可迭代對象,該迭代對象中的所有元素(字符串表示)將被合并為一個新的字

符串。string 作為邊界點分割出來。


5、常用的格式化字符


格式化字符說明

%s 字符串(采用str()顯示)

%c 單個字符

%d 或者%i 十進制整數(shù)

%x 十六進制整數(shù)

%f 或者%F 浮點數(shù)

%r 字符串(采用repr()顯示)

%o 八進制整數(shù)

%e 指數(shù)(基底寫為e)

%E 指數(shù)(基底寫為E)

%% 字符%


6、format()方法中常用的格式化字符


格式化字符說明

s 對字符串類型格式化

d 十進制整數(shù)

c 將十進制整數(shù)自動轉(zhuǎn)換成對應(yīng)的Unicode 字符

e 或者E 轉(zhuǎn)換為科學(xué)計數(shù)法表示再格式化

g 或者G 自動在e 和f 或者E 和F 中切換

b 將十進制整數(shù)自動轉(zhuǎn)換成二進制表示再格式化

o 將十進制整數(shù)自動轉(zhuǎn)換成八進制表示再格式化

x 或者X 將十進制整數(shù)自動轉(zhuǎn)換成十六進制表示再格式化

f 或者F 轉(zhuǎn)換為浮點數(shù)(默認小數(shù)點后保留6 位)再格式化

% 顯示百分比(默認顯示小數(shù)點后6 位)


7、使用encode()方法編碼


encode()方法的語法格式如下:

str.encode([encoding="utf-8"][,errors="strict"])

參數(shù)說明:

str:表示要進行轉(zhuǎn)換的字符串。

encoding="utf-8":可選參數(shù),用于指定進行轉(zhuǎn)碼時采用的字符編碼,默認為UTF-8,如

果想使用簡體中文,也可以設(shè)置為gb2312。當只有這一個參數(shù)時,也可以省略前面的“enc

oding=”,直接寫編碼。

errors="strict":可選參數(shù),用于指定錯誤處理方式,其可選擇值可以是strict(遇到非法

字符就拋出異常)、ignore(忽略非法字符)、replace(用“?”替換非法字符)或xmlcharref

replace(使用XML 的字符引用)等,默認值為strict。


8、使用decode()方法解碼


decode()方法的語法格式如下:

bytes.decode([encoding="utf-8"][,errors="strict"])

參數(shù)說明:

bytes:表示要進行轉(zhuǎn)換的二進制數(shù)據(jù),通常是encode()方法轉(zhuǎn)換的結(jié)果。

encoding="utf-8":可選參數(shù),用于指定進行解碼時采用的字符編碼,默認為UTF-8,如

果想使用簡體中文,也可以設(shè)置為gb2312。當只有這一個參數(shù)時,也可以省略前面的

“encoding=”,直接寫編碼。


9、常用元字符


代碼說明

. 匹配除換行符以外的任意字符

\w 匹配字母或數(shù)字或下劃線或漢字

\s 匹配任意的空白符

\d 匹配數(shù)字

\b 匹配單詞的開始或結(jié)束

^ 匹配字符串的開始

$ 匹配字符串的結(jié)束


10、常用限定符


限定符說明舉例

? 匹配前面的字符零次或一次colou?r,該表達式可以匹配colour 和color

+ 匹配前面的字符一次或多次go+gle,該表達式可以匹配的范圍從gogle 到goo…gle

* 匹配前面的字符零次或多次go*gle,該表達式可以匹配的范圍從ggle 到goo…gle

{n} 匹配前面的字符n 次go{2}gle,該表達式只匹配google

{n,} 匹配前面的字符最少n 次go{2,}gle,該表達式可以匹配的范圍從google 到goo…gle

{n,m} 匹配前面的字符最少n 次,最

多m 次

employe{0,2},該表達式可以匹配employ、employe 和

employee 3 種情況

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容