字符與字符串
在C語言中,字符char和字符串分別使用單引號(hào)和雙引號(hào)表示。其中,單引號(hào)表示字符字面量,是一個(gè)數(shù)值;雙引號(hào)表示的字符串字面量,是一個(gè)指針。相應(yīng)的,字符字面量在編譯過程中被編譯成對(duì)應(yīng)的ASCII碼,字符串字面量被編譯成對(duì)應(yīng)的內(nèi)存地址。
'a'表示字符字面量(97),在內(nèi)存中占用一個(gè)字節(jié),'a'+1 表示 'a' 的ASCII碼加1,即'b'
"a"表示字符串字面量(是一個(gè)指針),在內(nèi)存中占用2個(gè)字節(jié),"a"+1表示指針運(yùn)算,指向"a"字符串的結(jié)束'\0'
| char | 1 個(gè)字節(jié) | -128 到 127 或者 0 到 255 |
|---|---|---|
| unsigned char | 1 個(gè)字節(jié) | 0 到 255 |
| signed char | 1 個(gè)字節(jié) | -128 到 127 |
要表示8位無符號(hào)數(shù)值的時(shí)候, 用 unsigned char
表示8位有符號(hào)數(shù)值或者ASCII字符的時(shí)候,用 char
字符串、字符數(shù)組、字符指針
- 在C中字符串是有序字符的集合,C中是沒字符串類型的,需要通過字符數(shù)組加'\0'來模擬字符串,基于此可以確定出字符串和字符數(shù)組之間的區(qū)別。
- C中定義字符串常常是直接使用雙引號(hào)引用一個(gè)或多個(gè)特殊的字面量,被存儲(chǔ)在程序的全局只讀存儲(chǔ)區(qū),在本質(zhì)上是一個(gè)字符串?dāng)?shù)組,編譯器默認(rèn)自動(dòng)在末尾加上'\0'字符
- 字符串字面量的本質(zhì)是一個(gè)數(shù)組,如 "Hello World!" 是一個(gè)無名的字符數(shù)組
- 字符串字面量可以看作常量指針
- 字符串字面量中的字符不可改變
- 字符串字面量至少包含一個(gè)字符,即'\0'
- 字符串、字符數(shù)組、字符指針是不同的3個(gè)概念。這個(gè)一定要有一個(gè)清楚的認(rèn)知。
字符串相等的比較
- 字符串之間的相等比較需要用strcmp完成
- 不可直接用==進(jìn)行字符串直接的比較
字符串長(zhǎng)度
- 字符串的長(zhǎng)度就是字符串所包含字符的個(gè)數(shù)
- 字符串長(zhǎng)度指的是第一個(gè)'\0'字符前出現(xiàn)的字符個(gè)數(shù),通過'\0'結(jié)束符來確定字符串的長(zhǎng)度。
- 函數(shù)strlen用于返回字符串的長(zhǎng)度(不含'\0')。
- 字符串相關(guān)的函數(shù)均以第一個(gè)出現(xiàn)的'\0'作為結(jié)束符
- 編譯器總是會(huì)在字符串字面量的末尾添加'\0'。
- 字符串字面量的本質(zhì)為數(shù)組
C++字符串類string
- string 是定義一個(gè)字符串,存儲(chǔ)的是一段如“abc”的數(shù)據(jù),而且最后還有一個(gè)結(jié)束符'\0'。
- string str = "abc" 是C++ 封裝好的string,當(dāng)用到了"string"這個(gè)關(guān)鍵詞,就不是普通的字符串(C字符串),而是用到了封裝后的類。
- 在C++中,char仍然是一個(gè)基本數(shù)據(jù)類型,而string已經(jīng)經(jīng)過封裝,成為了一個(gè)class(類)用到它時(shí),我們需要 #include <string>,它是C++ Standard Library (C++標(biāo)準(zhǔn)庫)的一部分。
- 可以用 char* 類型的變量、常量,以及 char 類型的變量、常量對(duì) string 對(duì)象進(jìn)行賦值
string s1;
s1 = "Hello"; //s1 = "Hello"
string s2 = 'K'; // s2 = "K"
string對(duì)象中字符串的連接
除了可以使用+和+=運(yùn)算符對(duì) string 對(duì)象執(zhí)行字符串的連接操作外,string 類還有 append 成員函數(shù),可以用來向字符串后面添加內(nèi)容。append成員函數(shù)返回對(duì)象自身的引用
string對(duì)象的比較
除了可以用 <、<=、==、!=、>=、> 運(yùn)算符比較 string 對(duì)象外,string 類還有 compare 成員函數(shù),可用于比較字符串。compare 成員函數(shù)有以下返回值:小于 0 表示當(dāng)前的字符串??;等于 0 表示兩個(gè)字符串相等;大于 0 表示另一個(gè)字符串小。
求 string 對(duì)象的子串
substr 成員函數(shù)可以用于求子串 (n, m),原型如下:string substr(int n = 0, int m = string::npos) const。調(diào)用時(shí),如果省略 m 或 m 超過了字符串的長(zhǎng)度,則求出來的子串就是從下標(biāo) n 開始一直到字符串結(jié)束的部分。例
string s1 = "this is ok";
string s2 = s1.substr(2, 4); // s2 = "is i"
s2 = s1.substr(2); // s2 = "is is ok"
交換兩個(gè)string對(duì)象的內(nèi)容
swap 成員函數(shù)可以交換兩個(gè) string 對(duì)象的內(nèi)容。例如:
string s1("West”), s2("East");
s1.swap(s2); // s1 = "East",s2 = "West"
string 對(duì)象查找子串和字符
string 類有一些查找子串和字符的成員函數(shù),它們的返回值都是子串或字符在 string 對(duì)象字符串中的位置(即下標(biāo))。如果查不到,則返回 string::npos。string: :npos 是在 string 類中定義的一個(gè)靜態(tài)常量
find:從前往后查找子串或字符出現(xiàn)的位置
rfind:從后往前查找子串或字符出現(xiàn)的位置
find_first_of:從前往后查找何處出現(xiàn)另一個(gè)字符串中包含的字符。例如:s1.find_first_of("abc"); //查找s1中第一次出現(xiàn)"abc"中任一字符的位置
find_last_of:從后往前查找何處出現(xiàn)另一個(gè)字符串中包含的字符
find_first_not_of:從前往后查找何處出現(xiàn)另一個(gè)字符串中沒有包含的字符
find_last_not_of:從后往前查找何處出現(xiàn)另一個(gè)字符串中沒有包含的字符
string 對(duì)象替換子串
replace 成員函數(shù)可以對(duì) string 對(duì)象中的子串進(jìn)行替換,返回值為對(duì)象自身的引用。例如:
string s1("Real Steel");
s1.replace(1, 3, "123456", 2, 4); //用 "123456" 的子串(2,4) 替換 s1 的子串(1,3)
cout << s1 << endl; //輸出 R3456 Steel
string s2("Harry Potter");
s2.replace(2, 3, 5, '0'); //用 5 個(gè) '0' 替換子串(2,3)
cout << s2 << endl; //輸出 HaOOOOO Potter
int n = s2.find("OOOOO"); //查找子串 "00000" 的位置,n=2
s2.replace(n, 5, "XXX"); //將子串(n,5)替換為"XXX"
cout << s2 < < endl; //輸出 HaXXX Potter
string 對(duì)象刪除子串
erase 成員函數(shù)可以刪除 string 對(duì)象中的子串,返回值為對(duì)象自身的引用。例如:
string s1("Real Steel");
s1.erase(1, 3); //刪除子串(1, 3),此后 s1 = "R Steel"
s1.erase(5); //刪除下標(biāo)5及其后面的所有字符,此后 s1 = "R Ste"
string 對(duì)象插入字符串
insert 成員函數(shù)可以在 string 對(duì)象中插入另一個(gè)字符串,返回值為對(duì)象自身的引用。例如:
string s1("Limitless"), s2("00");
s1.insert(2, "123"); //在下標(biāo) 2 處插入字符串"123",s1 = "Li123mitless"
s1.insert(3, s2); //在下標(biāo) 2 處插入 s2 , s1 = "Li10023mitless"
s1.insert(3, 5, 'X'); //在下標(biāo) 3 處插入 5 個(gè) 'X',s1 = "Li1XXXXX0023mitless"
字符串?dāng)?shù)組char[]、指針char*和字符串string之間的轉(zhuǎn)換
char s3[] = "i am s3";
const char *s4 = s3; //數(shù)組轉(zhuǎn)指針
LOGI("S4 %s", s4);
char s5[strlen(s4) + 1];
strncpy(s5, s4, strlen(s4) + 1); //指針轉(zhuǎn)數(shù)組,不能直接賦值
LOGI("S5 %s", s5);
string s6 = s3; //數(shù)組轉(zhuǎn)string,直接賦值
LOGI("S6 %s", s6.c_str());
string s7 = s4; //指針轉(zhuǎn)string
LOGI("S7 %s", s7.c_str());
char *s8 = const_cast<char *>(s6.c_str()); //string 轉(zhuǎn)指針
LOGI("S8 %s", s8);
char s9[s6.size() + 1];
strncpy(s9,s6.c_str(),s6.size() +1); //指針轉(zhuǎn)數(shù)組
LOGI("S9 %s", s9);