运维|docker应用,后端服务出现OOM情况排查

参考: https://qingmu.io/2018/12/17/How-to-securely-limit-JVM-resources-in-a-container/#more 默认情况下,JVM的Max Heap Size是系统内存的1/4,假如我们系统是8G,那么JVM将的默认Heap≈2G。 # docker logs compose_cwtpro-back_1 Exception in thread "http-nio-8080-Acceptor-0" java.lang.OutOfMemoryError: GC overhead limit exceeded 28-Feb-2019 08:59:19.035 SEVERE [http-nio-8080-ClientPoller-0] org.apache.tomcat.util.net.NioEndpoint$Poller.events java.lang.OutOfMemoryError: GC overhead limit exceeded Exception in thread "http-nio-8080-exec-89" java.lang.OutOfMemoryError: GC overhead limit exceeded Exception in thread "http-nio-8080-exec-58" java.lang.OutOfMemoryError: GC overhead limit exceeded Exception in thread "http-nio-8080-exec-123" java.lang.OutOfMemoryError: GC overhead limit exceeded 运维|docker应用,后端服务出现OOM情况排查
文章图片


# docker exec -it compose_cwtpro-back_1 bash # java-XshowSettings:vm-version 运维|docker应用,后端服务出现OOM情况排查
文章图片
从监控页面获取的信息是,在故障时间点,后端业务的内存使用量突然飙升到接近4.3G,因此导致OOM运维|docker应用,后端服务出现OOM情况排查
文章图片


设置参数: JAVA_OPTS="-server -Xms6g -Xmx6g -XX:PermSize=256m -XX:MaxPermSize=512m -XX:-OmitStackTraceInFastThrow"//由于compose文件里面没有声明相关jvm参数,因此采用默认。导致初始最大堆栈为系统内存的1/4(4G)。最终突然的流量上升,导致OOM。 验证设置是否有效: # docker exec -it 2f24707d7a97 bash # ps -ef | grep java # jinfo -flag MaxHeapSize 7//打印对应pid的最大堆栈 运维|docker应用,后端服务出现OOM情况排查
文章图片


对比主91.17,设置未重启及JAVA_OPTS未生效的:
运维|docker应用,后端服务出现OOM情况排查
文章图片

3.87G 基本与截图一中通过java-XshowSettings:vm-version获取的最大堆栈符合(容器启动未限制容器可使用内存,默认读取/proc/meminfo为最大可以内存,未设置docker启动限制cpu及内存情况下,默认MaxHeapSize为可用最大内存的1/4) 查看堆内存中的对象数目、大小统计直方图,如果带上live则只统计活对象,如下: # jmap -histo:live 26590 | less 用jmap把进程内存使用情况dump到文件中,再用jhat分析查看。jmap进行dump命令格式如下: # jmap -dump:format=b,file=/tmp/v2x_dump 7
【运维|docker应用,后端服务出现OOM情况排查】转载于:https://www.cnblogs.com/wplvqj/p/10537188.html

    推荐阅读