go语言切片源码讲解 go切片操作( 四 )


读出缓冲器
Read
ReadByte
返回缓冲器头部的第一个byte
ReadRun
ReadRune方法 , 返回缓冲器头部的第一个rune
为什么n==3,而n1==1呢?我们看下ReadRune 的源码
ReadBytes
ReadBytes方法,需要一个byte作为分隔符,读的时候从缓冲器里找出第一个出现的分隔符,缓冲器头部开始到分隔符之间的byte返回 。
相当于有一个分隔符
ReadString
和readBytes方法类似
读入缓冲器
ReadFrom方法,从一个实现io.Reader接口的r,把r的内容读到缓冲器里,n返回读的数量
从缓冲器取出
Next方法,返回前n个byte(slice),原缓冲器变
缓冲区原理介绍
go字节缓冲区底层以字节切片做存储,切片存在长度len与容量cap, 缓冲区写从长度len的位置开始写 , 当lencap时 , 会自动扩容 。缓冲区读会从内置标记off位置开始读(off始终记录读的起始位置),当off==len时,表明缓冲区已全部读完
并重置缓冲区(len=off=0),此外当将要内容长度+已写的长度(即len) = cap/2时,缓冲区前移覆盖掉已读的内容(off=0 , len-=off),从避免缓冲区不断扩容
GoLang中的切片扩容机制[5]int是数组 , 而[]int是切片 。二者看起来相似 , 实则是根本上不同的数据结构 。
切片的数据结构中,包含一个指向数组的指针array , 当前长度len,以及最大容量cap。在使用make([]int, len)创建切片时,实际上还有第三个可选参数cap , 也即make([]int, len, cap)。在不声明cap的情况下,默认cap=len。当切片长度没有超过容量时,对切片新增数据,不会改变array指针的值 。
当对切片进行append操作,导致长度超出容量时,就会创建新的数组 , 这会导致和原有切片的分离 。在下例中
由于a的长度超出了容量,所以切片a指向了一个增长后的新数组 , 而b仍然指向原来的老数组 。所以之后对a进行的操作,对b不会产生影响 。
试比较
本例中 , a的容量为6,因此在append后并未超出容量 , 所以array指针没有改变 。因此,对a进行的操作,对b同样产生了影响 。
下面看看用a := []int{}这种方式来创建切片会是什么情况 。
可以看到,空切片的容量为0,但后面向切片中添加元素时 , 并不是每次切片的容量都发生了变化 。这是因为,如果增大容量,也即需要创建新数组,这时还需要将原数组中的所有元素复制到新数组中,开销很大,所以GoLang设计了一套扩容机制,以减少需要创建新数组的次数 。但这导致无法很直接地判断append时是否创建了新数组 。
如果一次添加多个元素,容量又会怎样变化呢?试比较下面两个例子:
那么,是不是说,当向一个空切片中插入2n-1个元素时 , 容量就会被设置为2n呢?我们来试试其他的数据类型 。
可以看到,根据切片对应数据类型的不同 , 容量增长的方式也有很大的区别 。相关的源码包括: src/runtime/msize.go , src/runtime/mksizeclasses.go 等 。
我们再看看切片初始非空的情形 。
可以看到,与刚刚向空切片添加5个int的情况一致,向有3个int的切片中添加2个int,容量增长为6 。
需要注意的是,append对切片扩容时,如果容量超过了一定范围,处理策略又会有所不同 。可以看看下面这个例子 。
具体为什么会是这样的变化过程,还需要从 源码 中寻找答案 。下面是src/runtime/slice.go中的growslice函数中的核心部分 。
GoLang中的切片扩容机制,与切片的数据类型、原本切片的容量、所需要的容量都有关系,比较复杂 。对于常见数据类型,在元素数量较少时,大致可以认为扩容是按照翻倍进行的 。但具体情况需要具体分析 。

推荐阅读