【golang详解】go语言GMP(GPM)原理和调度Goroutine调度是一个很复杂的机制,下面尝试用简单的语言描述一下Goroutine调度机制,想要对其有更深入的了解可以去研读一下源码 。
首先介绍一下GMP什么意思go语言栈引用:
G ----------- goroutine: 即Go协程,每个go关键字都会创建一个协程 。
M ---------- thread内核级线程,所有的G都要放在M上才能运行 。
P ----------- processor处理器,调度G到M上,其维护了一个队列 , 存储了所有需要它来调度的G 。
Goroutine 调度器P和 OS 调度器是通过 M 结合起来的,每个 M 都代表了 1 个内核线程,OS 调度器负责把内核线程分配到 CPU 的核上执行
模型图:
避免频繁的创建、销毁线程,而是对线程的复用 。
1)work stealing机制
当本线程无可运行的G时,尝试从其go语言栈引用他线程绑定的P偷取G,而不是销毁线程 。
2)hand off机制
当本线程M0因为G0进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行 。进而某个空闲的M1获取P,继续执行P队列中剩下的G 。而M0由于陷入系统调用而进被阻塞,M1接替M0的工作 , 只要P不空闲,就可以保证充分利用CPU 。M1的来源有可能是M的缓存池,也可能是新建的 。当G0系统调用结束后,根据M0是否能获取到P,将会将G0做不同的处理:
如果有空闲的P,则获取一个P,继续执行G0 。
如果没有空闲的P,则将G0放入全局队列,等待被其他的P调度 。然后M0将进入缓存池睡眠 。
如下图
GOMAXPROCS设置P的数量,最多有GOMAXPROCS个线程分布在多个CPU上同时运行
在Go中一个goroutine最多占用CPU 10ms,防止其他goroutine被饿死 。
具体可以去看另一篇文章
【Golang详解】go语言调度机制 抢占式调度
当创建一个新的G之后优先加入本地队列,如果本地队列满了,会将本地队列的G移动到全局队列里面,当M执行work stealing从其他P偷不到G时,它可以从全局G队列获取G 。
协程经历过程
我们创建一个协程 go func()经历过程如下图:
说明:
这里有两个存储G的队列,一个是局部调度器P的本地队列、一个是全局G队列 。新创建的G会先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中go语言栈引用;处理器本地队列是一个使用数组构成的环形链表,它最多可以存储 256 个待执行任务 。
G只能运行在M中,一个M必须持有一个P,M与P是1:1的关系 。M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会想其他的MP组合偷取一个可执行的G来执行;
一个M调度G执行的过程是一个循环机制;会一直从本地队列或全局队列中获取G
上面说到P的个数默认等于CPU核数,每个M必须持有一个P才可以执行G,一般情况下M的个数会略大于P的个数,这多出来的M将会在G产生系统调用时发挥作用 。类似线程池,Go也提供一个M的池子,需要时从池子中获取,用完放回池子,不够用时就再创建一个 。
work-stealing调度算法:当M执行完了当前P的本地队列队列里的所有G后,P也不会就这么在那躺尸啥都不干,它会先尝试从全局队列队列寻找G来执行,如果全局队列为空,它会随机挑选另外一个P,从它的队列里中拿走一半的G到自己的队列中执行 。
如果一切正常,调度器会以上述的那种方式顺畅地运行,但这个世界没这么美好,总有意外发生,以下分析goroutine在两种例外情况下的行为 。
Go runtime会在下面的goroutine被阻塞的情况下运行另外一个goroutine:
用户态阻塞/唤醒
当goroutine因为channel操作或者network I/O而阻塞时(实际上golang已经用netpoller实现了goroutine网络I/O阻塞不会导致M被阻塞,仅阻塞G,这里仅仅是举个栗子),对应的G会被放置到某个wait队列(如channel的waitq),该G的状态由_Gruning变为_Gwaitting,而M会跳过该G尝试获取并执行下一个G,如果此时没有可运行的G供M运行,那么M将解绑P,并进入sleep状态;当阻塞的G被另一端的G2唤醒时(比如channel的可读/写通知),G被标记为,尝试加入G2所在P的runnext(runnext是线程下一个需要执行的 Goroutine 。),然后再是P的本地队列和全局队列 。
系统调用阻塞
当M执行某一个G时候如果发生了阻塞操作,M会阻塞,如果当前有一些G在执行,调度器会把这个线程M从P中摘除,然后再创建一个新的操作系统的线程(如果有空闲的线程可用就复用空闲线程)来服务于这个P 。当M系统调用结束时候,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列 。如果获取不到P , 那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入全局队列中 。
队列轮转
可见每个P维护着一个包含G的队列,不考虑G进入系统调用或IO操作的情况下 , P周期性的将G调度到M中执行,执行一小段时间 , 将上下文保存下来 , 然后将G放到队列尾部,然后从队列中重新取出一个G进行调度 。
除了每个P维护的G队列以外,还有一个全局的队列,每个P会周期性地查看全局队列中是否有G待运行并将其调度到M中执行,全局队列中G的来源,主要有从系统调用中恢复的G 。之所以P会周期性地查看全局队列,也是为了防止全局队列中的G被饿死 。
除了每个P维护的G队列以外,还有一个全局的队列 , 每个P会周期性地查看全局队列中是否有G待运行并将其调度到M中执行 , 全局队列中G的来源 , 主要有从系统调用中恢复的G 。之所以P会周期性地查看全局队列,也是为了防止全局队列中的G被饿死 。
M0
M0是启动程序后的编号为0的主线程,这个M对应的实例会在全局变量rutime.m0中,不需要在heap上分配 , M0负责执行初始化操作和启动第一个G,在之后M0就和其他的M一样了
G0
G0是每次启动一个M都会第一个创建的goroutine,G0仅用于负责调度G,G0不指向任何可执行的函数,每个M都会有一个自己的G0,在调度或系统调用时会使用G0的栈空间,全局变量的G0是M0的G0
一个G由于调度被中断,此后如何恢复go语言栈引用?
中断的时候将寄存器里的栈信息,保存到自己的G对象里面 。当再次轮到自己执行时,将自己保存的栈信息复制到寄存器里面 , 这样就接着上次之后运行了 。
我这里只是根据自己的理解进行了简单的介绍,想要详细了解有关GMP的底层原理可以去看Go调度器 G-P-M 模型的设计者的文档或直接看源码
参考:()
()
Go 语言内存管理(三):逃逸分析Go 语言较之 C 语言一个很大的优势就是自带 GC 功能go语言栈引用,可 GC 并不是没有代价的 。写 C 语言的时候,在一个函数内声明的变量,在函数退出后会自动释放掉,因为这些变量分配在栈上 。如果你期望变量的数据可以在函数退出后仍然能被访问,就需要调用malloc方法在堆上申请内存,如果程序不再需要这块内存了,再调用free方法释放掉 。Go 语言不需要你主动调用malloc来分配堆空间,编译器会自动分析 , 找出需要malloc的变量 , 使用堆内存 。编译器的这个分析过程就叫做逃逸分析 。
所以你在一个函数中通过dict := make(map[string]int)创建一个 map 变量 , 其背后的数据是放在栈空间上还是堆空间上,是不一定的 。这要看编译器分析的结果 。
可逃逸分析并不是百分百准确的,它有缺陷 。有的时候你会发现有些变量其实在栈空间上分配完全没问题的 , 但编译后程序还是把这些数据放在了堆上 。如果你了解 Go 语言编译器逃逸分析的机制,在写代码的时候就可以有意识地绕开这些缺陷,使你的程序更高效 。
Go 语言虽然在内存管理方面降低了编程门槛,即使你不了解堆栈也能正常开发,但如果你要在性能上较真的话,还是要掌握这些基础知识 。
这里不对堆内存和栈内存的区别做太多阐述 。简单来说就是,栈分配廉价 , 堆分配昂贵 。栈空间会随着一个函数的结束自动释放 , 堆空间需要时间 GC 模块不断地跟踪扫描回收 。如果对这两个概念有些迷糊,建议阅读下面 2 个文章go语言栈引用:
这里举一个小例子,来对比下堆栈的差别:
stack函数中的变量i在函数退出会自动释放;而heap函数返回的是对变量i的引用,也就是说heap()退出后,表示变量i还要能被访问,它会自动被分配到堆空间上 。
他们编译出来的代码如下:
逻辑的复杂度不言而喻,从上面的汇编中可看到,heap()函数调用了runtime.newobject()方法,它会调用mallocgc方法从mcache上申请内存 , 申请的内部逻辑前面文章已经讲述过 。堆内存分配不仅分配上逻辑比栈空间分配复杂,它最致命的是会带来很大的管理成本,Go 语言要消耗很多的计算资源对其进行标记回收(也就是 GC 成本) 。
Go 编辑器会自动帮我们找出需要进行动态分配的变量,它是在编译时追踪一个变量的生命周期 , 如果能确认一个数据只在函数空间内访问,不会被外部使用,则使用栈空间 , 否则就要使用堆空间 。
我们在go build编译代码时,可使用-gcflags '-m'参数来查看逃逸分析日志 。
以上面的两个函数为例,编译的日志输出是:
日志中的i escapes to heap表示该变量数据逃逸到了堆上 。
需要使用堆空间,所以逃逸 , 这没什么可争议的 。但编译器有时会将不需要使用堆空间的变量,也逃逸掉 。这里是容易出现性能问题的大坑 。网上有很多相关文章,列举了一些导致逃逸情况 , 其实总结起来就一句话:
多级间接赋值容易导致逃逸。
这里的多级间接指的是,对某个引用类对象中的引用类成员进行赋值 。Go 语言中的引用类数据类型有func,interface,slice,map,chan,*Type(指针)。
记住公式Data.Field = Value,如果Data,Field都是引用类的数据类型,则会导致Value逃逸 。这里的等号=不单单只赋值,也表示参数传递 。
根据公式,我们假设一个变量data是以下几种类型 , 相应的可以得出结论:
下面给出一些实际的例子:
如果变量值是一个函数 , 函数的参数又是引用类型,则传递给它的参数都会逃逸 。
上例中te的类型是func(*int),属于引用类型,参数*int也是引用类型,则调用te(j)形成了为te的参数(成员)*int赋值的现象,即te.i = j会导致逃逸 。代码中其他几种调用都没有形成 多级间接赋值 情况 。
同理,如果函数的参数类型是slice,map或interface{}都会导致参数逃逸 。
匿名函数的调用也是一样的 , 它本质上也是一个函数变量 。有兴趣的可以自己测试一下 。
只要使用了Interface类型(不是interafce{}),那么赋值给它的变量一定会逃逸 。因为interfaceVariable.Method()先是间接的定位到它的实际值,再调用实际值的同名方法,执行时实际值作为参数传递给方法 。相当于interfaceVariable.Method.this = realValue
向 channel 中发送数据,本质上就是为 channel 内部的成员赋值,就像给一个 slice 中的某一项赋值一样 。所以chan *Type,chan map[Type]Type,chan []Type,chan interface{}类型都会导致发送到 channel 中的数据逃逸 。
这本来也是情理之中的,发送给 channel 的数据是要与其他函数分享的 , 为了保证发送过去的指针依然可用,只能使用堆分配 。
可变参数如func(arg ...string)实际与func(arg []string)是一样的,会增加一层访问路径 。这也是fmt.Sprintf总是会使参数逃逸的原因 。
例子非常多,这里不能一一列举,我们只需要记住分析方法就好,即,2 级或更多级的访问赋值会容易导致数据逃逸 。这里加上容易二字是因为随着语言的发展,相信这些问题会被慢慢解决,但现阶段 , 这个可以作为我们分析逃逸现象的依据 。
下面代码中包含 2 种很常规的写法,但他们却有着很大的性能差距,建议自己想下为什么 。
Benchmark 和 pprof 给出的结果:
熟悉堆栈概念可以让我们更容易看透 Go 程序的性能问题,并进行优化 。
多级间接赋值会导致 Go 编译器出现不必要的逃逸,在一些情况下可能我们只需要修改一下数据结构就会使性能有大幅提升 。这也是很多人不推荐在 Go 中使用指针的原因 , 因为它会增加一级访问路径,而map,slice,interface{}等类型是不可避免要用到的,为了减少不必要的逃逸 , 只能拿指针开刀了 。
大多数情况下,性能优化都会为程序带来一定的复杂度 。建议实际项目中还是怎么方便怎么写,功能完成后通过性能分析找到瓶颈所在,再对局部进行优化 。
golang中的传值或传引用【go语言栈引用 go实现栈】 按数据类别有以下几种数据类型:
按存储方式也有两大类数据类型:
值类型:变量直接存储值 。值类型的数据存储在栈内存空间中,栈在函数调f返回后,内存会被释放 。
引用类型:变量存储的是一个地址,这个地址存储最终的值 。引用数据类型的数据存储在堆内存空间中,通过 GC 回收 。
函数调用时申明的基础类型均为值传递,如int,string,数组等,数据传入函数后会重新copy一份,函数内的修改不会影响外面的变量,外部变量的修改也不会影响函数类的变量 。
funcmain() {
myvar:=[4]string{"test0", "test1", "test3", "test4"}
goTest(myvar)
fori:=1; i
【golang】内存逃逸常见情况和避免方式因为如果变量的内存发生逃逸,它的生命周期就是不可知的 , 其会被分配到堆上,而堆上分配内存不能像栈一样会自动释放,为了解放程序员双手,专注于业务的实现,go实现了gc垃圾回收机制,但gc会影响程序运行性能,所以要尽量减少程序的gc操作 。
1、在方法内把局部变量指针返回,被外部引用 , 其生命周期大于栈,则溢出 。
2、发送指针或带有指针的值到channel,因为编译时候无法知道那个goroutine会在channel接受数据,编译器无法知道什么时候释放 。
3、在一个切片上存储指针或带指针的值 。比如[]*string,导致切片内容逃逸,其引用值一直在堆上 。
4、因为切片的append导致超出容量 , 切片重新分配地址,切片背后的存储基于运行时的数据进行扩充 , 就会在堆上分配 。
5、在interface类型上调用方法,在Interface调用方法是动态调度的,只有在运行时才知道 。
1、go语言的接口类型方法调用是动态,因此不能在编译阶段确定,所有类型结构转换成接口的过程会涉及到内存逃逸发生,在频次访问较高的函数尽量调用接口 。
2、不要盲目使用变量指针作为参数,虽然减少了复制,但变量逃逸的开销更大 。
3、预先设定好slice长度,避免频繁超出容量,重新分配 。
go语言栈引用的介绍就聊到这里吧 , 感谢你花时间阅读本站内容,更多关于go实现栈、go语言栈引用的信息别忘了在本站进行查找喔 。
推荐阅读
- 电脑怎么蓝牙连接dsp,电脑怎么蓝牙连接耳机
- 包含换个html5浏览器吧的词条
- 微信视频号是什么规格,微信视频号是什么规格的
- faker斗鱼直播,faker斗鱼直播间没了
- c语言如何在主函数传参 在c语言程序中主函数的摆放位置
- linux压缩命令补丁,linux压缩包命令
- windows7怎么用u盘安装,windows7安装教程 u盘
- 新媒体运营如何给老板提涨工资,新媒体运营涨粉方式
- JAVA动物管理员代码 java动物管理员代码怎么写