目录
- 1、使用 rune
- 2、使用utf包
- 3、使用range遍历
1、使用 rune
func BenchmarkSubstr1(b *testing.B) { s := "bench基准测试,1212" for i := 0; i < b.N; i++ { s1 := []rune(s) s2 := s1[1:6] _ = string(s2) } }
2、使用utf包
在中英文混合字符串中,如果能知道每个字符占几个字节,我们也可以实现截取,于是我们可以从 utf8 编码的格式入手,实际上计算机能够识别出这些字节也是基于既定的编码格式,utf8.DecodeRuneInString()
方法也是依据这个原理,此方法会从输入的字符串开头处逐个字节读取,直到满足一个 utf8 字符。
func DecodeRuneInString(s string) (r rune, size int)
返回一个 rune 类型,以及此字符占用几个字节。
func BenchmarkSubstr2(b *testing.B) { s := "bench基准测试,1212" st := 1 en := 6 for i := 0; i < b.N; i++ { var start, end int v编程客栈ar c int for i := 0; i <= en && c < len(s); i++ { _, size := utf8.DecodeRuneInString(s[c:]) if i == st { start = c } if i == en { end = c } c += size } _ = s[start:end] } }
3、使用range遍历
range
遍历字符串时,默认使用 字符
迭代,也就是 ASCII
和 中文
都算作一个 字符
,比如
func TestSubstr(t *testing.T)python { s := "bench基准测试,1212" for k, v := range s { fmt.Println(k, string(v)) } }
打印输出
0 b
1 e2 n3 c4 h5 基8 准11 测14 试17 ,20 121 222 123 2
可见 range 默认就支持 unicode,因此变量 k 不是连续的,找到 k 即可。
func TestSubstr(t *testing.T) { s := "bench基准测试,1212" var start, end int var c int for k := range s { if c == 1 { start = k } if c == 6 { end = k } c++ } fmt.Println(s[start:end]) // ench基 }
func BenchmarkSubstr3(b *testing.B) { s := "bench基准测试,1212" for i := 0; i < b.N; i++ { var start, end int var c int for k := range s { if c == 1 { start = k } if c == 6 { end = k } c++ } _ = s[start:end] } }
> go test -bench=BenchmarkSubstr -benchtime=100000x -benchmem
goos: Windowsgoarch: amd64pkg: testcpu: Intel(R) Core(TM) i7-4790 CPU @ 3.60GHzBenchmarkSubstr1-8 100000 107.5 ns/op 0 dAhTseFgTB/op 0 allocs/opBenchmarkSubstr2-8 100000 37.74 ns/op 0 B/op 0 allocs/opBenchmarkSubstr3-8 100000 &nb编程s编程客栈p; 37.72 ns/op 0 B/op 0 allocs/op
到此这篇关于golang截取字符串方法示例讲解及对比的文章就介绍到这了,更多相关Go截取字符串内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
精彩评论