故事背景 今天后台管理系统出现cpu 200%-300%,导致总CPU使用忽高忽低,系统访问速度忽快忽慢。这个问题出现过一次,准备排查一下。
后台管理系统使用ssm框架,用户量小,所以排除高并发的情况。
java version "1.8.0_11"
处理过程
1.使用top查看进程的CPU使用情况
[root logs]# top
top - 14:34:51 up 513 days,4:42,3 users,load average: 3.27, 2.81, 2.34
Tasks: 147 total,1 running, 146 sleeping,0 stopped,0 zombie
Cpu(s): 59.8%us,0.2%sy,0.0%ni, 40.0%id,0.0%wa,0.0%hi,0.1%si,0.0%st
Mem:16270528k total, 10517928k used,5752600k free,178872k buffers
Swap:0k total,0k used,0k free,1333952k cachedPID USERPRNIVIRTRESSHR S %CPU %MEMTIME+COMMAND
15984 root200 7867m 3.9g18m S 235.5 25.0 929:15.66 java
16102 root200 7860m 3.9g14m S4.3 24.9 743:39.72 java
21631 root200 15032 1276944 R0.30.00:00.06 top
1 root200 19368 1232912 S0.00.00:01.55 init
可以看到是pid为15984的进程占用了CPU。
先用jstat -gcutil(查看GC汇总信息),看下对应的堆内存各部分的使用量
[root@ logs]# jstat -gcutil 15984
S0S1EOMCCSYGCYGCTFGCFGCTGCT
0.000.00 100.00 100.0055.4879.7072824 1046.4971339 3559.981 4606.479
显示列名 | 具体描述 |
---|---|
S0 | 年轻代中第一个survivor(幸存区)已使用的占当前容量百分比 |
S1 | 年轻代中第二个survivor(幸存区)已使用的占当前容量百分比 |
E | 年轻代中Eden(伊甸园)已使用的占当前容量百分比 |
O | old代已使用的占当前容量百分比 |
M | 元数据空间使用比例 |
CCS | 压缩使用比例 |
YGC | 从应用程序启动到采样时年轻代中gc次数 |
YGCT | 从应用程序启动到采样时年轻代中gc所用时间(s) |
FGC | 从应用程序启动到采样时old代(全gc)gc次数 |
FGCT | 从应用程序启动到采样时old代(全gc)gc所用时间(s) |
GCT | 从应用程序启动到采样时gc用的总时间(s) |
年轻代Eden区和老年代的使用容量都是100%
补充个知识点:
大多数情况下,对象在新生代Eden区分配。(大对象会直接在老年代分配,使用参数进行设置)当Eden区分配足够的空间进行分配时,就会触发MinorGc(新生代GC)。将超过GC年龄的对象移动到老年代中。
大致就能断定是对象Eden区分配内存时容量不够触发了GC,而导致的GC停顿。但是由于新生代和老年代的使用都是100%而对象又全都在被使用。所以无法回收内存。导致一直GC,一直停顿。。。
问题找到了,这没办法了。直接重启服务,毕竟没有什么是重启不能解决的,但是在重启之前先做一件事情。把堆内存的快照dump下来,找找为什么4G的内存都被用完了,还无法回收。。。
使用 jmap -dump:live 生成快照
jmap -dump:live,format=b,file=15984.hprof 15984
使用scp 远程上传文件到跳板机
下载到本地只用使用java/bin/jvisualvm.exe 工具打开。可以进行快照文件的分析…
文件 > 装入 >选择下载的堆内存快照。
内存快照大的会需要很大的内存才能打开…我的快照文件3.7G,装入之后大概使用了7G内存。
文章图片
因为堆内存太大,自己电脑的配置太小了,所以找了台内存大的电脑弄。结果堆内存太大导致看到了类信息之后想打开实例信息没成功。提示分析工具的内存不足…我太难了…
文章图片
原因分析
看了一些网上的帖子和项目组种种分析得到的结论大概率是因为tomcat间的session共享导致的session没有回收。
项目用了两个tomcat,配置了tomcat自身session共享机制,但是由于配置的是双向共享。所以session永远都不会清掉。。。导致了session占用的内存越来越多。
因为上次出现这个问题也是加入session共享之后出现的,而且出现问题时系统session存活的数量也差不多。所以有了这种猜想。。
解决方案
【JAVA进程占用CPU200%-300%的问题处理过程】就把seesion共享改成单方式的试试。
…还在弄,目前不知道怎么整单方向的共享方式…
…我太难了…