go语言的内存管理机制 go语言的内存管理机制有哪些( 三 )


他们编译出来的代码如下:
逻辑的复杂度不言而喻,从上面的汇编中可看到 , heap()函数调用了runtime.newobject()方法,它会调用mallocgc方法从mcache上申请内存,申请的内部逻辑前面文章已经讲述过 。堆内存分配不仅分配上逻辑比栈空间分配复杂 , 它最致命的是会带来很大的管理成本 , Go 语言要消耗很多的计算资源对其进行标记回收(也就是 GC 成本) 。
Go 编辑器会自动帮我们找出需要进行动态分配的变量,它是在编译时追踪一个变量的生命周期,如果能确认一个数据只在函数空间内访问,不会被外部使用,则使用栈空间 , 否则就要使用堆空间 。
我们在go build编译代码时,可使用-gcflags '-m'参数来查看逃逸分析日志 。
以上面的两个函数为例,编译的日志输出是:
日志中的i escapes to heap表示该变量数据逃逸到了堆上 。
需要使用堆空间,所以逃逸,这没什么可争议的 。但编译器有时会将不需要使用堆空间的变量,也逃逸掉 。这里是容易出现性能问题的大坑 。网上有很多相关文章 , 列举了一些导致逃逸情况,其实总结起来就一句话:
多级间接赋值容易导致逃逸。
这里的多级间接指的是,对某个引用类对象中的引用类成员进行赋值 。Go 语言中的引用类数据类型有func,interface,slice,map,chan,*Type(指针)。
记住公式Data.Field = Value,如果Data,Field都是引用类的数据类型,则会导致Value逃逸 。这里的等号=不单单只赋值,也表示参数传递 。
根据公式 , 我们假设一个变量data是以下几种类型,相应的可以得出结论:
下面给出一些实际的例子:
如果变量值是一个函数,函数的参数又是引用类型,则传递给它的参数都会逃逸 。
上例中te的类型是func(*int),属于引用类型,参数*int也是引用类型,则调用te(j)形成了为te的参数(成员)*int赋值的现象,即te.i = j会导致逃逸 。代码中其他几种调用都没有形成 多级间接赋值 情况 。
【go语言的内存管理机制 go语言的内存管理机制有哪些】同理,如果函数的参数类型是slice,map或interface{}都会导致参数逃逸 。
匿名函数的调用也是一样的,它本质上也是一个函数变量 。有兴趣的可以自己测试一下 。
只要使用了Interface类型(不是interafce{}),那么赋值给它的变量一定会逃逸 。因为interfaceVariable.Method()先是间接的定位到它的实际值,再调用实际值的同名方法,执行时实际值作为参数传递给方法 。相当于interfaceVariable.Method.this = realValue
向 channel 中发送数据,本质上就是为 channel 内部的成员赋值,就像给一个 slice 中的某一项赋值一样 。所以chan *Type,chan map[Type]Type,chan []Type,chan interface{}类型都会导致发送到 channel 中的数据逃逸 。
这本来也是情理之中的,发送给 channel 的数据是要与其他函数分享的 , 为了保证发送过去的指针依然可用,只能使用堆分配 。
可变参数如func(arg ...string)实际与func(arg []string)是一样的,会增加一层访问路径 。这也是fmt.Sprintf总是会使参数逃逸的原因 。
例子非常多,这里不能一一列举,我们只需要记住分析方法就好,即,2 级或更多级的访问赋值会容易导致数据逃逸 。这里加上容易二字是因为随着语言的发展,相信这些问题会被慢慢解决,但现阶段,这个可以作为我们分析逃逸现象的依据 。
下面代码中包含 2 种很常规的写法 , 但他们却有着很大的性能差距,建议自己想下为什么 。
Benchmark 和 pprof 给出的结果:
熟悉堆栈概念可以让我们更容易看透 Go 程序的性能问题,并进行优化 。

推荐阅读