Go語言 字符串(string)


什么是字符串
一個Go語言字符串是一個任意字節(jié)的常量序列。

Go語言字符串與其他語言(Java,C++,Python)字符串的不同點
Go語言中字符串的字節(jié)使用UTF-8編碼表示Unicode文本,因此Go語言字符串是變寬字符序列,每一個字符都用一個或者多個字符表示,這跟其他的(C++,Java,Python 3)的字符串類型有著本質(zhì)上的不同,后者為定寬字符序列。

其他語言的字符串中的單個字符可以被字節(jié)索引,而Go語言中只有在字符串只包含7位的ASCII字符(因為它們都是用一個單一的UTF-8字節(jié)表示)時才可以被字節(jié)索引。那么這是不是表示Go語言在字符串處理能力上就比其他語言弱呢?答案時否定的,應為Go語言支持一個字符一個字符的迭代,而且標準庫中存在大量的字符串操作函數(shù),最后我們還可以將Go語言的字符串轉(zhuǎn)化為Unicode碼點切片(類型為 [ ]rune),切片是支持直接索引的。

對于英文文本,Go使用8位來表示每一個字節(jié),而Java或Python則需要16位或更多。采用UTF-8編碼,使得Go語言無需關系機器碼的排列順序,也無需編碼解碼來使用其他語言。

注:每一個Unicode字符都有一個唯一的叫做“碼點”的標識數(shù)字。在Go語言中,一個單一的碼點在內(nèi)存中以 rune 的形式表示,rune表示int32類型的別名

字面量,操作符和轉(zhuǎn)義
在Go語言中,字符串字面量使用雙引號 "" 或者反引號 ' 來創(chuàng)建。雙引號用來創(chuàng)建可解析的字符串,支持轉(zhuǎn)義,但不能用來引用多行;反引號用來創(chuàng)建原生的字符串字面量,可能由多行組成,但不支持轉(zhuǎn)義,并且可以包含除了反引號外其他所有字符。雙引號創(chuàng)建可解析的字符串應用最廣泛,反引號用來創(chuàng)建原生的字符串則多用于書寫多行消息,HTML以及正則表達式。
比如下面的這些例子,輸出結(jié)果完全一致

text1 := "\"Hello GoLang\",I said"
text2 :=`"Hello GoLang",I said`  //這個在Java中就無法編譯成功

雖然Go語言中的字符串是不可變的,但是字符串支持 + 級聯(lián)操作和+=追加操作,比如下面這個例子

text1 := "Hello" + " GoLang"
text1 += " Java"
fmt.Println(text1) // 輸出 Hello GoLang Java

如果底層的字符串容量不夠大,不能適應添加的字符串,級聯(lián)追加操作將導致底層的字符串被替換。

下面是有關字符串的一些操作符描述

text1 := "abcdefg"
fmt.Println(text1[n]) //獲取字符串索引位置為n的原始字節(jié),比如a為97
fmt.Println(text1[n:m]) //截取得字符串索引位置為 n 到 m-1 的字符串
fmt.Println(text1[n:]) //截取得字符串索引位置為 n 到 len(s)-1 的字符串
fmt.Println(text1[:m]) //截取得字符串索引位置為 0 到 m-1 的字符串
fmt.Println(len(text1)) //獲取字符串的字節(jié)數(shù)
fmt.Println(utf8.RuneCountInString(text1)) //獲取字符串字符的個數(shù)
fmt.Println([]rune(text1)) // 將字符串的每一個字節(jié)轉(zhuǎn)換為碼點值,比如這里會輸出[97 98 99 100 101 102 103]
fmt.Println(string(text1[n])) // 獲取字符串索引位置為n的字符值

比較字符串
Go語言中的字符串是支持常規(guī)的比較操作(<,>,==,!=,<=,>=),這些操作符會在內(nèi)存中一個字節(jié)一個字節(jié)的比較,但是在執(zhí)行比較操作時,常會出現(xiàn)以下三種問題:
①有些 Unicode 編碼的字符可以用兩個或者多個不同的字節(jié)序列來表示。
如果我們只關心ASCII字符,這個問題將不會存在,若是非ASCII字符,那么我們可以通過自定義標準化函數(shù)來隔離接受這些字符串。

②用戶希望將不同的字符看作是相同的。
比如字符二,2,Ⅱ,②都可以看作相同的意思,那么用戶輸入2時,就得匹配這些相同意思的其他字符。這個也可以通過自定義標準化函數(shù)來解決。

③字符的排序跟語言的類型有關。

字符與字符串
在Go語言中,可以用rune或者int32來表示一個字符。

字符可以通過+=操作符在一個循環(huán)中往字符串末尾追加字符,但這并不是最有效的方式,我們可以使用類似Java中的StringBuilder 來實現(xiàn)。

var buffer bytes.Buffer  //創(chuàng)建一個空的 bytes.Buffer
for   {
   if piece,ok = getNextValidString();ok {
      buffer.WriteString(piece)  //通過 WriteString 方法將我們需要串聯(lián)的字符串寫入到 buffer 中
   }else {
      break
   }
}
fmt.Println(buffer.String())  //最后用于取回整個級聯(lián)的字符串

使用 bytes.Buffer 進行字符串的累加比起+=要高效的多,尤其是在面對大數(shù)量的字符串時。

將字符串一個字符一個字符的迭代出來,可以通過 for range 循環(huán)

text1 := "abcdefg"
for index,char := range text1 {
   fmt.Printf("%d %U %c \n",index,char,char)
}

字符串索引與切片
在所有的7位ASCII字符中,通過索引提取其字符是可以的,比如下面的例子

func main() {
   text1 := "abcdefg"
   fmt.Println(string(text1[0])) //獲取索引為0的字符(核心就是通過字節(jié)來轉(zhuǎn)為字符,這里字節(jié)只能為一個)
}

但是對于任意字符串來講,上面并不一定可靠,因為有些字符可能有多個字節(jié)。為了解決這個問題,我們就需要使用字符串切片,這樣返回的將是一個字符而不是一個字節(jié)。

text1 := "abcdefg"
chars := []rune(text1) //先把字符串轉(zhuǎn)為rune切片
for _,char := range chars { 
   fmt.Println(string(char))
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 前言 最先接觸編程的知識是在大學里面,大學里面學了一些基礎的知識,c語言,java語言,單片機的匯編語言等;大學畢...
    oceanfive閱讀 3,395評論 0 7
  • 本文翻譯自Rob Pike的文章《Strings, bytes, runes and characters in ...
    大蟒傳奇閱讀 9,951評論 0 12
  • 生成MD5字符串 生成UUID 方法一、自己寫 方法二、 方法三、 方法四、 若使用的是linux系統(tǒng),可以直接使...
    吃貓的魚0閱讀 3,578評論 0 1
  • 寫在前面的話:從2014年起,每看完一本書,都會在本子上寫下自己的讀后感之類的,所看過的書,針對目前情況來說,...
    翔子大人閱讀 545評論 0 0
  • 魏老漢退休后辦了兩件讓所有人震驚的大事情。 2004年的伏天,酷暑難耐,太陽火辣辣的烤著大地萬物,樹葉蔫里巴嘰、無...
    鮮桃姐姐閱讀 947評論 0 1

友情鏈接更多精彩內(nèi)容