整形轉(zhuǎn)字符串經(jīng)常會(huì)用到,本文討論一下 Golang 提供的這幾種方法?;?go1.10.1
fmt.Sprintf
fmt 包應(yīng)該是最常見的了,從剛開始學(xué)習(xí) Golang 就接觸到了,寫 ‘hello, world' 就得用它。它還支持格式化變量轉(zhuǎn)為字符串。
func Sprintf(format string, a ...interface{}) string
Sprintf formats according to a format specifier and returns the resulting string.
fmt.Sprintf("%d", a)
%d 代表十進(jìn)制整數(shù)。
strconv.Itoa
func Itoa(i int) string
Itoa is shorthand for FormatInt(int64(i), 10).
strconv.Itoa(a)
strconv.FormatInt
func FormatInt(i int64, base int) string
FormatInt returns the string representation of i in the given base, for 2 = base = 36. The result uses the lower-case letters ‘a(chǎn)' to ‘z' for digit values >= 10.
參數(shù) i 是要被轉(zhuǎn)換的整數(shù), base 是進(jìn)制,例如2進(jìn)制,支持2到36進(jìn)制。
strconv.Format(int64(a), 10)
Format 的實(shí)現(xiàn)
[0, 99)的兩位整數(shù)
對(duì)于小的(小于等于100)十進(jìn)制正整數(shù)有加速優(yōu)化算法:
if fastSmalls 0 = i i nSmalls base == 10 {
return small(int(i))
}
加速的原理是提前算好100以內(nèi)非負(fù)整數(shù)轉(zhuǎn)換后的字符串。
const smallsString = "00010203040506070809" +
"10111213141516171819" +
"20212223242526272829" +
"30313233343536373839" +
"40414243444546474849" +
"50515253545556575859" +
"60616263646566676869" +
"70717273747576777879" +
"80818283848586878889" +
"90919293949596979899"
可以看出來(lái),轉(zhuǎn)換后的結(jié)果是從1到99都有,而且每個(gè)結(jié)果只占兩位。當(dāng)然個(gè)人數(shù)的情況還得特殊處理,個(gè)位數(shù)結(jié)果只有一位。
func small(i int) string {
off := 0
if i 10 {
off = 1
}
return smallsString[i*2+off : i*2+2]
}
如果被轉(zhuǎn)換的數(shù)字是個(gè)位數(shù),那么偏移量變成了1,默認(rèn)情況是0。
只支持2到36進(jìn)制的轉(zhuǎn)換。36進(jìn)制是10個(gè)數(shù)字加26個(gè)小寫字母,超過這個(gè)范圍無(wú)法計(jì)算。
整形最大64位,加一位是因?yàn)橛袀€(gè)符號(hào)。轉(zhuǎn)換計(jì)算時(shí),要分10進(jìn)制和非10進(jìn)制的情況。
10進(jìn)制轉(zhuǎn)換
10進(jìn)制里,兩位兩位轉(zhuǎn)換,為什么這么干??jī)晌粩?shù)字時(shí)100以內(nèi)非負(fù)整數(shù)轉(zhuǎn)換可以用上面的特殊情況加速。很有意思。
us := uint(u)
for us >= 100 {
is := us % 100 * 2
us /= 100
i -= 2
a[i+1] = smallsString[is+1]
a[i+0] = smallsString[is+0]
}
2、4、8、16、32進(jìn)制的轉(zhuǎn)換。
const digits = "0123456789abcdefghijklmnopqrstuvwxyz"
var shifts = [len(digits) + 1]uint{
1 1: 1,
1 2: 2,
1 3: 3,
1 4: 4,
1 5: 5,
}
if s := shifts[base]; s > 0 {
// base is power of 2: use shifts and masks instead of / and %
b := uint64(base)
m := uint(base) - 1 // == 1s - 1
for u >= b {
i--
a[i] = digits[uint(u)m]
u >>= s
}
// u base
i--
a[i] = digits[uint(u)]
}
通過循環(huán)求余實(shí)現(xiàn)。進(jìn)制的轉(zhuǎn)換也是這種方式。
for u >= b {
i--
a[i] = uint(u)m
u >>= s
}
上面的代碼實(shí)現(xiàn)了進(jìn)制的轉(zhuǎn)換。而 digits[uint(u)m] 實(shí)現(xiàn)了轉(zhuǎn)換后的結(jié)果再轉(zhuǎn)成字符。
常規(guī)情況
b := uint64(base)
for u >= b {
i--
q := u / b
a[i] = digits[uint(u-q*b)]
u = q
}
// u base
i--
a[i] = digits[uint(u)]
依然是循環(huán)求余來(lái)實(shí)現(xiàn)。這段代碼更像是給人看的。和上面2的倍數(shù)的進(jìn)制轉(zhuǎn)換的區(qū)別在于,上面的代碼把除法 / 換成了右移( >> ) s 位,把求余 % 換成了邏輯與 操作。
Sprintf 的實(shí)現(xiàn)
switch f := arg.(type) {
case bool:
p.fmtBool(f, verb)
case float32:
p.fmtFloat(float64(f), 32, verb)
case float64:
p.fmtFloat(f, 64, verb)
case complex64:
p.fmtComplex(complex128(f), 64, verb)
case complex128:
p.fmtComplex(f, 128, verb)
case int:
p.fmtInteger(uint64(f), signed, verb)
...
}
判斷類型,如果是整數(shù) int 類型,不需要反射,直接計(jì)算。支持的都是基礎(chǔ)類型,其它類型只能通過反射實(shí)現(xiàn)。
Sprintf 支持的進(jìn)制只有10 %d 、16 x 、8 o 、2 b 這四種,其它的會(huì)包 fmt: unknown base; can't happen 異常。
switch base {
case 10:
for u >= 10 {
i--
next := u / 10
buf[i] = byte('0' + u - next*10)
u = next
}
case 16:
for u >= 16 {
i--
buf[i] = digits[u0xF]
u >>= 4
}
case 8:
for u >= 8 {
i--
buf[i] = byte('0' + u7)
u >>= 3
}
case 2:
for u >= 2 {
i--
buf[i] = byte('0' + u1)
u >>= 1
}
default:
panic("fmt: unknown base; can't happen")
}
2、8、16進(jìn)制和之前 FormatInt 差不多,而10進(jìn)制的性能差一些,每次只能處理一位數(shù)字,而不像 FormatInt 一次處理兩位。
性能對(duì)比
var smallInt = 35
var bigInt = 999999999999999
func BenchmarkItoa(b *testing.B) {
for i := 0; i b.N; i++ {
val := strconv.Itoa(smallInt)
_ = val
}
}
func BenchmarkItoaFormatInt(b *testing.B) {
for i := 0; i b.N; i++ {
val := strconv.FormatInt(int64(smallInt), 10)
_ = val
}
}
func BenchmarkItoaSprintf(b *testing.B) {
for i := 0; i b.N; i++ {
val := fmt.Sprintf("%d", smallInt)
_ = val
}
}
func BenchmarkItoaBase2Sprintf(b *testing.B) {
for i := 0; i b.N; i++ {
val := fmt.Sprintf("%b", smallInt)
_ = val
}
}
func BenchmarkItoaBase2FormatInt(b *testing.B) {
for i := 0; i b.N; i++ {
val := strconv.FormatInt(int64(smallInt), 2)
_ = val
}
}
func BenchmarkItoaBig(b *testing.B) {
for i := 0; i b.N; i++ {
val := strconv.Itoa(bigInt)
_ = val
}
}
func BenchmarkItoaFormatIntBig(b *testing.B) {
for i := 0; i b.N; i++ {
val := strconv.FormatInt(int64(bigInt), 10)
_ = val
}
}
func BenchmarkItoaSprintfBig(b *testing.B) {
for i := 0; i b.N; i++ {
val := fmt.Sprintf("%d", bigInt)
_ = val
}
}
壓測(cè)有三組對(duì)比,小于100的情況,大數(shù)字的情況,還有二進(jìn)制的情況。
BenchmarkItoa-8 300000000 4.58 ns/op 0 B/op 0 allocs/op
BenchmarkItoaFormatInt-8 500000000 3.07 ns/op 0 B/op 0 allocs/op
BenchmarkItoaBase2Sprintf-8 20000000 86.4 ns/op 16 B/op 2 allocs/op
BenchmarkItoaBase2FormatInt-8 50000000 30.2 ns/op 8 B/op 1 allocs/op
BenchmarkItoaSprintf-8 20000000 83.5 ns/op 16 B/op 2 allocs/op
BenchmarkItoaBig-8 30000000 44.6 ns/op 16 B/op 1 allocs/op
BenchmarkItoaFormatIntBig-8 30000000 43.9 ns/op 16 B/op 1 allocs/op
BenchmarkItoaSprintfBig-8 20000000 108 ns/op 24 B/op 2 allocs/op
- Sprintf 在所有情況中都是最差的,還是別用這個(gè)包了。
- 小于100的情況會(huì)有加速,不光是性能上的加速,因?yàn)榻Y(jié)果是提前算好的,也不需要申請(qǐng)內(nèi)存。
- FormatInt 10進(jìn)制性能最好,其它的情況差一個(gè)數(shù)量級(jí)。
- Itoa 雖然只是封裝了 FormatInt ,對(duì)于性能還是有一些影響的。
本文涉及的代碼可以從 這里 下載。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- golang 中獲取字符串個(gè)數(shù)的方法
- 簡(jiǎn)單談?wù)凣olang中的字符串與字節(jié)數(shù)組
- Golang 統(tǒng)計(jì)字符串字?jǐn)?shù)的方法示例
- Golang中文字符串截取函數(shù)實(shí)現(xiàn)原理
- Golang實(shí)現(xiàn)字符串倒序的幾種解決方案
- Golang 語(yǔ)言高效使用字符串的方法