gol内存逃逸

总结

  • 逃逸的指针变量本身也是分配在堆空间,故函数可以返回局部变量的地址。此时的局部变量相当于局部指针变量,逃逸时,指针变量本身也是分配在堆空间,所以能返回它的地址。
  • 栈空间的内存由编译器管理,分配释放速度很快。堆空间,由gc管理,频繁的gc会占用系统较大的开销,stop the world
  • 逃逸分析是编译器在静态编译时完成的。
  • 切片变量本身逃逸了,那它底层的data区域也会逃逸。即使切片长度很小。
  • 切片变量本身没逃逸,那一般情况它的data区域也在栈上,若长度太长,则data区域会分配到堆上,但切片变量本身还是在栈上。
如何确定内存逃逸?
go run -gcflags '-m -l' main.go

注意:上述命令只在编译器接入判断是否逃逸处有输出。
有时候栈空间比堆空间地址还小,不知道为啥。
内存逃逸的例子
func main(){ a := 1 _ = a }// 无输出

func main(){ a := 1 fmt.Printf("%p\n", &a) fmt.Println(a)b := 2 fmt.Printf("%p\n", &b) fmt.Println(b)c := 3 fmt.Printf("%p\n", &c) fmt.Println(c)d := 4 fmt.Printf("%p\n", &d) fmt.Println(d) }// 输出 ./main.go:10:2: moved to heap: a ./main.go:14:2: moved to heap: b ./main.go:18:2: moved to heap: c ./main.go:22:2: moved to heap: d ./main.go:11:12: ... argument does not escape ./main.go:12:13: ... argument does not escape ./main.go:12:13: a escapes to heap ./main.go:15:12: ... argument does not escape ./main.go:16:13: ... argument does not escape ./main.go:16:13: b escapes to heap ./main.go:19:12: ... argument does not escape ./main.go:20:13: ... argument does not escape ./main.go:20:13: c escapes to heap ./main.go:23:12: ... argument does not escape ./main.go:24:13: ... argument does not escape ./main.go:24:13: d escapes to heap 0xc000012080 1 0xc000012088 2 0xc0000120a0 3 0xc0000120a8 4

fmt.Printf函数abc赋值给interface{},造成逃逸,abc地址在堆空间,如图正增长,印证了在堆上。对比下面:
func main(){ a := 1 println(&a) println(a)b := 2 println(&b) println(b)c := 3 println(&c) println(c)d := 4 println(&d) println(d) }// 输出 0xc00002e768 1 0xc00002e760 2 0xc00002e758 3 0xc00002e750 4

println不会触发内存逃逸,abc分配在栈空间,地址从高到低增长印证了这点。
四个指针没逃逸的情况:
func main(){ a := new(int) println(&a) println(a)println("======") b := new(int) println(&b) println(b)println("======") c := new(int) println(&c) println(c)println("======") d := new(int) println(&d) println(d) }// 输出 ./main.go:32:10: new(int) does not escape ./main.go:39:10: new(int) does not escape ./main.go:46:10: new(int) does not escape ./main.go:53:10: new(int) does not escape 0xc00002e768 0xc00002e740 ====== 0xc00002e760 0xc00002e738 ====== 0xc00002e758 0xc00002e730 ====== 0xc00002e750 0xc00002e748

abcd指针变量本身和其所指的内存区域,没有逃逸,都是分配在栈空间,打印的地址从大到小为连续区域印证了这点。
内存分配如图:
gol内存逃逸
文章图片

四个指针有逃逸的情况
func main() { a := new(int) fmt.Printf("%p\n", &a) fmt.Println(a) println("======")b := new(int) fmt.Printf("%p\n", &b) fmt.Println(b)println("======") c := new(int) fmt.Printf("%p\n", &c) fmt.Println(c) println("======")d := new(int) fmt.Printf("%p\n", &d) fmt.Println(d)println("======") f := new(int) println(&f) println(f) }//输出 0xc00000e028 0xc000012080 ====== 0xc00000e038 0xc000012088 ====== 0xc00000e040 0xc0000120a0 ====== 0xc00000e048 0xc0000120a8 ====== 0xc000058f38 0xc000058f30

逃逸情况下,abcd指针变量本身和其所指的内存区域,都是分配在堆空间,打印的地址从小到大为连续区域印证了这点。f指针变量和其所指的内存区域分配在栈空间,其地址高于堆区域地址印证了这点。
逃逸的指针变量本身也是分配在堆空间,故函数可以返回局部指针变量
内存分配图如下:
gol内存逃逸
文章图片

func main(){ a := new(int) _ = a }// 输出 ./main.go:8:10: main new(int) does not escape

即使是new的变量,没逃逸时,也是分配在栈
  • println函数不会触发逃逸,而fmt.Printf会,因为它的函数参数是interface{}类型
  • 注意: 上面例子,a是指针变量分配在栈空间,指向的int存储单元在下一个字节(也是在栈空间)。
  • 栈空间在高地址为,从高往低分配。
这要是在C++中这么写,是个很典型的错误:返回局部变量的地址,该地址的内容在函数退出后会被自动释放,因为是在栈上的。
那么go语言的局部变量到底是在栈上还是堆上呢?go语言编译器会做逃逸分析(escape analysis),分析局部变量的作用域是否逃出函数的作用域,要是没有,那么就放在栈上;要是变量的作用域超出了函数的作用域,那么就自动放在堆上。
测试观察g的地址变化
func main { var g *int println(&g) println(g) g = new(int) println(&g) println(g) g = new(int) println(&g) println(g) g = new(int) fmt.Println(&g) fmt.Println(g) }

没有最后两行的话,没逃逸,g与g指向的内存都在栈区,加了则都在堆区。
出现逃逸的场景
package maintype Student struct { Name interface{} }func main(){ stu := new(Student) stu.Name = "tom"}

interface{} 赋值,会发生逃逸,优化方案是将类型设置为固定类型,例如:string
package maintype Student struct { Name string }func GetStudent() *Student { stu := new(Student) stu.Name = "tom" return stu }func main() { GetStudent() }

返回(局部变量的地址)指针类型,会发生逃逸,优化方案视情况而定。
函数传递指针和传值哪个效率高吗?我们知道传递指针可以减少底层值的拷贝,可以提高效率,但是如果拷贝的数据量小,由于指针传递会产生逃逸,可能会使用堆,也可能会增加 GC 的负担,所以传递指针不一定是高效的。
不要盲目使用变量指针作为参数,虽然减少了复制,但变量逃逸的开销可能更大。
func main(){ nums := make([]int, 5, 5) nums2 := make([]int, 5, 5) println(&nums) println(nums) println(&nums2) println(nums2) for i := range nums { nums[i] = i println(&nums[i]) } println("======2") for i := range nums2 { nums2[i] = i println(&nums2[i]) }println("======3") nums3 := make([]int, 10000, 10000) println(&nums3) println(nums3) for i := range nums3 { if i == 5 { break } nums3[i] = i println(&nums3[i]) } //fmt.Println(&nums3)}// 输出 ./main.go:8:14: make([]int, 5, 5) does not escape ./main.go:9:15: make([]int, 5, 5) does not escape ./main.go:25:15: make([]int, 10000, 10000) escapes to heap 0xc00002e758 [5/5]0xc00002e6f8 0xc00002e740 [5/5]0xc00002e6d0 0xc00002e6f8 0xc00002e700 0xc00002e708 0xc00002e710 0xc00002e718 ======2 0xc00002e6d0 0xc00002e6d8 0xc00002e6e0 0xc00002e6e8 0xc00002e6f0 ======3 0xc00002e728 [10000/10000]0xc000054000 0xc000054000 0xc000054008 0xc000054010 0xc000054018 0xc000054020

如上:第1、2个slice变量及其底层的data指针区域,都是分配在栈上。
第3个超大切片,slice变量本身分配在栈上,底层数据在堆上。
如果注释掉最后的fmt.Printf则第3个slice变量本身也会逃逸分配在堆上。
注意:切片data区域第1到第n个元素的地址空间都是从0往上增的,不管是在栈还是在堆上。
func main(){ var slice1 []int println(&slice1) println(slice1) fmt.Printf("%p\n", &slice1) println(&slice1) println(slice1) slice1 = make([]int,5,5) println(&slice1) println(slice1) }// 输出 ./main.go:11:6: moved to heap: slice1 ./main.go:14:12: ... argument does not escape ./main.go:17:15: make([]int, 5, 5) escapes to heap 0xc0000a4018 [0/0]0x0 0xc0000a4018 0xc0000a4018 [0/0]0x0 0xc0000a4018 [5/5]0xc0000aa030

切片变量本身逃逸了,那它底层的data区域也会逃逸。即使切片长度很小。
切片变量本身没逃逸,那一般情况它的data区域也在栈上,若长度太长,则data区域会分配到堆上,但切片变量本身还是在栈上。
package mainfunc main() { nums := make([]int, 10000, 10000) for i := range nums { nums[i] = i } }

切片太大,会发生逃逸,优化方案尽量设置容量,如果容量实在过大那就没办法了。
map里的元素是不能取地址的。 【gol内存逃逸】map没逃逸时,也是分配在栈上的,变量本身及底层的数据区。

    推荐阅读