可能大多數(shù)人在學(xué)習(xí)C語言的時(shí)候,最先接觸的數(shù)據(jù)類型就是字符串,因?yàn)榇蠖嘟坛潭际?br>
以"Hello world"這個(gè)程序作為入門程序,這個(gè)程序中要打印的"Hello
world"就是字符串。如果你做過自然語言處理方面的研究,并且用Python去做過相關(guān)實(shí)驗(yàn),你肯定會體會到Python在字符串處理方面相對于其他
語言的明顯優(yōu)勢之處。今天我們來了解一下Python中的字符串,看看它的用法。
一.Python中如何聲明字符串
在Python中聲明一個(gè)字符串通常有三種方法:在它的兩邊加上那個(gè)單引號、雙引號或者三引號。
如:

從上面可以看出三種聲明方法的效果是完全一樣的,在Python中用這三種聲明方法來聲明字符串意義完全等同的,即'hello
world'和"hello world"以及'''hello
world'''是沒有任何區(qū)別的。但是會有人問:既然是完全等同的,為什么要弄出三種聲明方式呢?下面看一下這幾個(gè)例子:

在Python中提供了這幾種方法,使得使用起來更加方便靈活(當(dāng)然也可以使用轉(zhuǎn)義字符去解決上面報(bào)錯(cuò)的地方)。
在這里要注意的是,
1)在Python中沒有類似C語言中char這種類型的字符串,也就是說即使是單個(gè)字符也是字符串。
2)Python中的字符串一旦聲明,是不能進(jìn)行更改的,即不能通過對某一位置重新賦值改變內(nèi)容。

二.Python中的字符串類型
Python中的字符串有兩種數(shù)據(jù)類型:str類型和unicode類型。str類型采用的ASCII編碼,也就是說它無法表示中文。unicode類型采用unicode編碼,能夠表示任意的字符,包括中文、日文、韓文等。
在python中字符串默認(rèn)采用的ASCII編碼,如果要顯示聲明為unicode類型的話,需要在字符串前面加上'u'或者'U'。
下面看一段代碼
print'我'printu'我'print'python'printu'python'
這段代碼的運(yùn)行結(jié)果為:

從運(yùn)行結(jié)果可以看出,如果是中文的話,不采用unicode類型,輸出的會是亂碼。
三.轉(zhuǎn)義字符和原始字符串
同C語言中一樣,Python中也有轉(zhuǎn)義字符,用反斜杠'\'來表示對后面字符進(jìn)行轉(zhuǎn)義。
比如上面例子中的問題就可以用轉(zhuǎn)義來解決:

如果你編寫過Java程序,并且使用過Java中的正則表達(dá)式,你可能會對Java正則表達(dá)式深惡痛絕(我自己就是),因?yàn)樯圆蛔⒁饩蜁鲥e(cuò),
里面有太多的轉(zhuǎn)義,而且看起來也很繁瑣雜亂。在Python中,你不必再為這個(gè)問題煩惱了,因?yàn)镻ython提供了原始字符串,顧名思義,就是保留原始字
符的意思,不對反斜杠及反斜杠后面的字符進(jìn)行轉(zhuǎn)義,聲明原始字符串的方法是在字符串前面加上'r'或者'R'。

在這里要注意:在Python中行尾結(jié)束符始終為'\n',不論P(yáng)ython程序在哪個(gè)操作系統(tǒng)下運(yùn)行。在Linux環(huán)境下編寫C語言時(shí),換行符為'\n',而在windows下為'\r\n'。編寫Python程序不用擔(dān)心這種因運(yùn)行環(huán)境不同引起的不兼容問題。
四.用戶輸入以及格式化輸出字符串
在Python中最常用的從鍵盤獲取輸入的函數(shù)是raw_input()和input()。但是這兩個(gè)函數(shù)有很大的區(qū)別:
raw_input()以字符串的形式返回用戶輸入的一切內(nèi)容;
而input()卻不是這樣,它會根據(jù)輸入內(nèi)容的形式確定返回的形式(可能有點(diǎn)拗口)。下面看個(gè)例子就明白了:

從這個(gè)例子顯而易見可以看出兩者的區(qū)別,同樣輸入123,raw_input()返回的是字符串123,而input()返回的是整數(shù)123。個(gè)人建議一般情況下使用raw_input()獲取輸入,這樣能避免程序中出現(xiàn)一些不必要的麻煩。
同C語言一樣,Python中也提供了格式化輸出。
Python中的格式化輸出和C語言類似,基本格式如下:
print '....%formmat..' %(var...)
當(dāng)var只有一個(gè)時(shí),括號可以省略。

關(guān)于Python的字符串今天就討論這么多了,在這里只是討論了基本的概念和知識點(diǎn),相關(guān)字符串函數(shù)的使用請查閱API文檔。
作者:海子
出處:http://www.cnblogs.com/dolphin0520/
。