Go语言使用 map 时尽量不要在 big map 中保存指针 不知道你有没有听过这么一句:在使用 map 时尽量不要在 big map 中保存指针 。好吧,你现在已经听过了:)为什么呢?原因在于 Go 语言的垃圾回收器会扫描标记 map 中的所有元素,GC 开销相当大,直接GG 。
这两天在《Mastering Go》中看到 GC 这一章节里面对比 map 和 slice 在垃圾回收中的效率对比,书中只给出结论没有说明理由,这我是不能忍的,于是有了这篇学习笔记 。扯那么多,Show Your Code
这是一个简单的测试程序,保存字符串的 map 和 保存整形的 map GC 的效率相差几十倍,是不是有同学会说明明保存的是 string 哪有指针?这个要说到 Go 语言中 string 的底层实现了,源码在 src/runtime/string.go里 , 可以看到 string 其实包含一个指向数据的指针和一个长度字段 。注意这里的是否包含指针,包括底层的实现 。
Go 语言的 GC 会递归遍历并标记所有可触达的对象,标记完成之后将所有没有引用的对象进行清理 。扫描到指针就会往下接着寻找,一直到结束 。
Go 语言中 map 是基于 数组和链表 的数据结构实现的,通过 优化的拉链法 解决哈希冲突,每个 bucket 可以保存8对键值,在8个键值对数据后面有一个 overflow 指针 , 因为桶中最多只能装8个键值对,如果有多余的键值对落到了当前桶,那么就需要再构建一个桶(称为溢出桶),通过 overflow 指针链接起来 。
因为 overflow 指针的缘故 , 所以无论 map 保存的是什么,GC 的时候就会把所有的 bmap 扫描一遍,带来巨大的 GC 开销 。官方 issues 就有关于这个问题的讨论,runtime: Large maps cause significant GC pauses #9477
无脑机翻如下:
【go语言里面指针 go语言里面指针怎么输入】如果我们有一个map [k] v , 其中k和v都不包含指针,并且我们想提高扫描性能,则可以执行以下操作 。
将“ allOverflow [] unsafe.Pointer”添加到 hmap 并将所有溢出存储桶存储在其中 。然后将 bmap 标记为noScan 。这将使扫描非常快 , 因为我们不会扫描任何用户数据 。
实际上,它将有些复杂,因为我们需要从allOverflow中删除旧的溢出桶 。而且它还会增加 hmap 的大?。虼艘部赡苄枰匦抡硎?。
最终官方在 hmap 中增加了overflow相关字段完成了上面的优化,这是具体的commit地址 。
下面看下具体是如何实现的,源码基于 go1.15,src/cmd/compile/internal/gc/reflect.go 中
通过注释可以看出,如果 map 中保存的键值都不包含指针(通过 Haspointers 判断),就使用一个 uintptr 类型代替 bucket 的指针用于溢出桶 overflow 字段,uintptr 类型在 GO 语言中就是个大小可以保存得下指针的整数,不是指针,就相当于实现了 将 bmap 标记为 noScan,GC 的时候就不会遍历完整个 map 了 。随着不断的学习,愈发感慨 GO 语言中很多模块设计得太精妙了 。
差不多说清楚了,能力有限 , 有不对的地方欢迎留言讨论,源码位置还是问的群里大佬 _
golang-指针类型 tips: *号,可以指向指针类型内存地址上的值 , 号,可以获取值类型的内存地址
每一个变量都有内存地址,可以通过变量来操作内存地址中的值,即内存的大小
go语言中获取变量的内存地址方法:通过符号可以获取变量的地址
定义:普通变量存储的是对应类型的值,这些类型就叫值类型
变量b , 在内存中的地址为:0x1040a124,在这个内存地址上存储的值为:156
定义:指针类型的变量存储的是?个地址,所以?叫指针类型或引?类型
b 是值类型,它指向的是内存地址上的值
a是指针类型,它指向的是b的内存地址
指针类型定义 , 语法: var 变量名 *类型
指针类型在定义完成后,默认为空地址,即空指针(nil)
在定义好指针变量后,可以通过***** 符号可以获取指针变量指向的变量
在这里的 *a 等价于 b,通过修改 *a , 最终修改的是值类型b的值
这里a,d是值类型 , b,c是指针类型
d就相当于把a内存地址上值,在内存中从新开辟了一块空间存储,d和a互不影响
b,c相当于指向了a的内存地址,当使用*号引用出内存地址上的变量上 , 修改值得,a的值也会跟着改变
go语言中的指针和c的指针的区别?Go语言里面的指针和C指针一样,都是指向某块内存的地址值,可以解引用,不同只是在于C里可以直接对指针做算术运算而Go里面不行 。
GO 一文搞懂指针和地址值的区别 go语言中的指针和地址值,在使用上常常具有迷惑性 , 主要是其特殊的*、符号的使用,可能会让你摸不透,本文希望能讲清楚go语言的指针(pointer)和值(value) 。
这里先简单的对指针和地址值概念做一个定义:
这是因为go方法传递参数的方式导致的,go方法函数传递参数传递的是一个拷贝,看看下面的程序会输出什么?
答案是8,而不是9 , 因为AddAge函数修改的是学生的一个备份,而不是原始的学生对象
如果你想正确的给学生年龄增加的话,函数传递的需要是这个值的指针,如下所示:
需要注意的是,这里我们的指针传递的仍然是一个拷贝,比如 , 如果你将s赋值给另外一个指针地址,不会影响原有的指针,这点可以自行实践下 。
那在使用go语言开发的时候 , 何时该用指针何时改用地址值呢?比如考虑以下场景:
简单原则: 当你不确定该使用哪种的时候,优先使用指针
如果考虑在数组、切片、map等复合对象中使用指针和值,比如:
很多开发者会认为b会更高效,但是被传递的都是一个切片的拷贝,切片本身就是一个引用,所以这里被传递的其实没有什么区别 。
对于指针和地址值的使用,大家需要牢记的一点就是go数据传递的不可变性 , 活学活用此特点,在无状态函数中此特性非常有用 。
go语言中指针的使用场景?如果该函数会修改receiver,此时一定要用指针
如果receiver是 struct 并且包含互斥类型 sync.Mutex , 或者是类似的同步变量,receiver必须是指针,这样可以避免对象拷贝
如果receiver是较大的 struct 或者 array ,使用指针则更加高效 。多大才算大?假设struct内所有成员都要作为函数变量传进去,如果觉得这时数据太多 , 就是struct太大
如果receiver是 struct,array 或者 slice ,并且其中某个element指向了某个可变量 , 则这个时候receiver选指针会使代码的意图更加明显
如果receiver使较小的 struct 或者 array,并且其变量都是些不变量、常量,例如 time.Time ,value receiver更加适合,因为value receiver可以减少需要回收的垃圾量 。
go语言里面指针的介绍就聊到这里吧,感谢你花时间阅读本站内容 , 更多关于go语言里面指针怎么输入、go语言里面指针的信息别忘了在本站进行查找喔 。
推荐阅读
- 模拟经营西方游戏,外国模拟经营手游
- 如何做ios英雄台词,怎么把英雄台词添加到视频
- 什么电视自带视频多,哪个视频软件电视剧多
- 微信直播现在乱了,微信直播怎么回事
- vb.net签名出错 vb标签名称
- wordpress贝宝,贝宝下载
- ios即时战略类的游戏,ios即时战略类的游戏
- 怎么查电脑哪个型号呢,怎么查电脑是那个型号
- php空间怎么进入数据库 php怎么访问数据库