1.不同字符與獲取字符串長度
獲取字符串長度,是字符串操作的重要方法。理論來說,獲取字符串長度,只要從頭到尾查找一遍就可以了。但遺憾的是,不同字符具有不同的編碼格式。拉丁字母一個字符只要一個字節(jié)就行,而中文則可能需要兩道三個字節(jié);UNICODE把所有字符設(shè)置為2個字節(jié),UTF-8格式則把所有字符設(shè)置為1--3個字節(jié)。
因此,字符串長度的獲得,不等于按字節(jié)數(shù)查找,而要根據(jù)不同字符編碼查找。
2.golang中獲取字符串長度的方法
對于中文開發(fā)者來說,經(jīng)常需要對字符串進行長度判斷。golang有自己的默認(rèn)判斷長度函數(shù)len();但遺憾的是,len()函數(shù)判斷字符串長度的時候,是判斷字符的字節(jié)數(shù)而不是字符長度。因此,在中文字符下,應(yīng)該采用如下方法:
1)使用 bytes.Count() 統(tǒng)計
2)使用 strings.Count() 統(tǒng)計
3)將字符串轉(zhuǎn)換為 []rune 后調(diào)用 len 函數(shù)進行統(tǒng)計
4)使用 utf8.RuneCountInString() 統(tǒng)計
3.樣例展示
s := "歡迎學(xué)習(xí)Go的len()函數(shù)"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))
補充:Go語言獲取中英文混和字符串的長度以及子字符串的方法
1. 純英文字符串
使用len()函數(shù)。
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字符串的長度是:%d", length1)
長度是6。
2. 中英文混合字符串
2.1 先使用len()函數(shù)。
testString2 := "我愛你中國,我愛你China!"
length2 := len(testString2)
fmt.Printf("字符串的長度是:%d", length2)
fmt.Printf("testString2字符串的長度是:%d\n", length2)
fmt.Printf("testString2中的最后一個字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后一個字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:16])
這種方法的到的是字節(jié)數(shù)。Go語言中,中文字符按utf-8編碼,占3字節(jié),故長度是31。故此方法不適用統(tǒng)計中英文混合或者中文字符串長度。
2.2 使用utf8.RuneCountInString()方法。
testString2 := "我愛你中國,我愛你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法統(tǒng)計的字符串長度是:%d\n", length3)
此方法可統(tǒng)計字符數(shù),輸出結(jié)果是15。
2.3 轉(zhuǎn)成[]rune類型,再對此類型進行操作
testString2 := "我愛你中國,我愛你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使用rune統(tǒng)計的字符串的長度是:%d\n", length4)
//獲取字符串中最后一個字符
lastChar := string(temp[length4-1])
//獲取下標(biāo)從0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最后一個字符是:%s\n", lastChar)
fmt.Printf("testString2中的下標(biāo)0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下標(biāo)6-8的子字符串是:%s\n",string(subString2))
此方法也可輸出字符個數(shù)15。但是此方法能獲取指定下標(biāo)范圍的子字符串,也能獲取指定下標(biāo)位置的字符。比第二種方法方便。
3.示例代碼
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
//純英文
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1字符串的長度是:%d\n", length1)
lastCharA := testString1[length1-1]
//此處用%s格式輸出最后一個字符會出錯,只能用%c
fmt.Printf("testString1字符串中最后一個字符是:%s\n", lastCharA)
fmt.Printf("testString1字符串中最后一個字符是:%c\n", lastCharA)
fmt.Printf("testString1中的下標(biāo)0-2的子字符串是:%s\n",testString1[0:3])
fmt.Printf("testString1中的下標(biāo)3-末尾的子字符串是:%s\n",testString1[3:])
fmt.Println()
//中英文加一起15個字符
testString2 := "我愛你中國,我愛你China!"
//此處長度是輸出字節(jié)數(shù),Go語言中文字符是UTF-8編碼,長度3字節(jié),故此處應(yīng)該是15+1+9+6=31
length2 := len(testString2)
fmt.Printf("testString2字符串的長度是:%d\n", length2)
fmt.Printf("testString2中的最后一個字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后一個字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:16])
fmt.Println()
//此處就是統(tǒng)計字符數(shù)
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法統(tǒng)計的字符串長度是:%d\n", length3)
fmt.Println()
//轉(zhuǎn)成rune類型,再統(tǒng)計字符數(shù)
temp := []rune(testString2)
//獲取中英文混合字符串長度
length4 := len(temp)
fmt.Printf("使用rune統(tǒng)計的字符串的長度是:%d\n", length4)
//獲取字符串中最后一個字符
lastCharB := string(temp[length4-1])
//獲取下標(biāo)從0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:]
fmt.Printf("testString2中的最后一個字符是:%s\n", lastCharB)
fmt.Printf("testString2中的下標(biāo)0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",string(subString2))
}
4. 示例結(jié)果
總結(jié)
如果是對中英文進行操作,建議用第三種方式。先轉(zhuǎn)成rune[]型,再進行操作。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- 用golang如何替換某個文件中的字符串
- 解決golang時間字符串轉(zhuǎn)time.Time的坑
- Golang 語言高效使用字符串的方法
- golang中json小談之字符串轉(zhuǎn)浮點數(shù)的操作
- golang 如何替換掉字符串里面的換行符\n
- golang 字符串比較是否相等的方法示例
- 解決Golang json序列化字符串時多了\的情況
- golang如何去除多余空白字符(含制表符)