go语言机制和逃逸 go语言内存逃逸

Go 语言内存管理(三):逃逸分析Go 语言较之 C 语言一个很大的优势就是自带 GC 功能,可 GC 并不是没有代价的 。写 C 语言的时候,在一个函数内声明的变量 , 在函数退出后会自动释放掉,因为这些变量分配在栈上 。如果你期望变量的数据可以在函数退出后仍然能被访问,就需要调用malloc方法在堆上申请内存,如果程序不再需要这块内存了,再调用free方法释放掉 。Go 语言不需要你主动调用malloc来分配堆空间,编译器会自动分析,找出需要malloc的变量,使用堆内存 。编译器的这个分析过程就叫做逃逸分析 。
所以你在一个函数中通过dict := make(map[string]int)创建一个 map 变量,其背后的数据是放在栈空间上还是堆空间上,是不一定的 。这要看编译器分析的结果 。
可逃逸分析并不是百分百准确的,它有缺陷 。有的时候你会发现有些变量其实在栈空间上分配完全没问题的,但编译后程序还是把这些数据放在了堆上 。如果你了解 Go 语言编译器逃逸分析的机制,在写代码的时候就可以有意识地绕开这些缺陷,使你的程序更高效 。
Go 语言虽然在内存管理方面降低了编程门槛 , 即使你不了解堆栈也能正常开发,但如果你要在性能上较真的话,还是要掌握这些基础知识 。
这里不对堆内存和栈内存的区别做太多阐述 。简单来说就是,栈分配廉价,堆分配昂贵 。栈空间会随着一个函数的结束自动释放 , 堆空间需要时间 GC 模块不断地跟踪扫描回收 。如果对这两个概念有些迷糊,建议阅读下面 2 个文章:
这里举一个小例子,来对比下堆栈的差别:
stack函数中的变量i在函数退出会自动释放;而heap函数返回的是对变量i的引用 , 也就是说heap()退出后,表示变量i还要能被访问,它会自动被分配到堆空间上 。
他们编译出来的代码如下:
逻辑的复杂度不言而喻 , 从上面的汇编中可看到,heap()函数调用了runtime.newobject()方法 , 它会调用mallocgc方法从mcache上申请内存,申请的内部逻辑前面文章已经讲述过 。堆内存分配不仅分配上逻辑比栈空间分配复杂,它最致命的是会带来很大的管理成本,Go 语言要消耗很多的计算资源对其进行标记回收(也就是 GC 成本) 。
Go 编辑器会自动帮我们找出需要进行动态分配的变量,它是在编译时追踪一个变量的生命周期,如果能确认一个数据只在函数空间内访问,不会被外部使用 , 则使用栈空间,否则就要使用堆空间 。
我们在go build编译代码时,可使用-gcflags '-m'参数来查看逃逸分析日志 。
以上面的两个函数为例,编译的日志输出是:
日志中的i escapes to heap表示该变量数据逃逸到了堆上 。
需要使用堆空间,所以逃逸,这没什么可争议的 。但编译器有时会将不需要使用堆空间的变量,也逃逸掉 。这里是容易出现性能问题的大坑 。网上有很多相关文章,列举了一些导致逃逸情况,其实总结起来就一句话:
多级间接赋值容易导致逃逸。
这里的多级间接指的是,对某个引用类对象中的引用类成员进行赋值 。Go 语言中的引用类数据类型有func,interface,slice,map,chan,*Type(指针)。
记住公式Data.Field = Value,如果Data,Field都是引用类的数据类型,则会导致Value逃逸 。这里的等号=不单单只赋值,也表示参数传递 。
根据公式,我们假设一个变量data是以下几种类型,相应的可以得出结论:
下面给出一些实际的例子:
如果变量值是一个函数,函数的参数又是引用类型,则传递给它的参数都会逃逸 。
上例中te的类型是func(*int) , 属于引用类型,参数*int也是引用类型,则调用te(j)形成了为te的参数(成员)*int赋值的现象 , 即te.i = j会导致逃逸 。代码中其他几种调用都没有形成 多级间接赋值 情况 。

推荐阅读