jstack日志分析

打印一个pid为16494的应用到日志 middle 1在线蜂巢任务偶尔会出现挂起的现象 。经过调查,确认是触发了Hive的一个bug , 修复在Hive10569(中),用户的直线任务跑到EndedJob之后,就再也没有结束 , 请检查纱线日志,该作业已成功运行 。在作业的hiveserver端找到日志,没有发现异常,分别Pass jstackl和jmapdump:检查特定pod以查看特定节点上使用的节点,节点无需docker容器中的jstack命令即可找到特定pod所在的节点,输入docker命令即可查看具体信息,dockerstats命令用于返回正在运行的容器的实时数据流 。默认情况下,stats使用参数A或all,该命令将每秒刷新一次输出,直到您按下CTRL C 。

CPUPerc和Memusage三列 。以下是可以在自定义格式中使用的所有占位符:有了这些信息,我们就可以完全根据自己的需要或偏好来控制dockerstats命令的输出 。JSON格式输出进入docker容器,发现没有jdk,只有jre命令无法通过设置PATH环境变量再次执行命令:发现没有权限 。这其实不是Bug,而是Docker从1.10版本开始增加的安全特性 。

1、电脑Java8update内存使用率高问题可能是由代码或其他原因引起的 。使用dstat和top检查内存使用率最高的应用程序 。发现java应用的内存使用率最高 , 用了2253M内存,但是这个服务器运行了好几个Java 。哪个进程使用top来检查资源情况?使用top,dstat可以看到Java应用程序的整体内存使用率超过70% , 其中一个pid为16494的应用程序占28.7内存,使用ps检查16494的线程情况 。命令:

Pid,tid,time,tname,cmd,看到PID 16494的应用产生了很多线程 。分析之前,17417的id需要转换成十六进制,方便查找信息12 。每个JVM线程都有一个私有的JVM线程栈 , 用于存储当前线程的JVM栈帧(包括被调用函数的参数、局部变量和返回地址等 。).如果线程的线程堆栈空间耗尽,并且没有足够的资源分配给新创建的堆栈?。?则会引发java.lang.StackOverflowError错误 。造成StackOverFlowError的常见原因有几个:无限递归循环调用(最常见) 。

方法中声明了大量的局部变量 。本机代码有分配在堆栈上的逻辑 , 需要的内存也不小 。例如,Java . net . socket inputstream . read 0将需要在堆栈上分配64KB缓存(64位Linux) 。除了程序抛出的StackOverflowError之外,还有两种定位堆栈溢出的方法:进程突然消失,但是留下了crash 日志,所以可以在crash 日志中检查当前线程的堆栈范围和RSP寄存器的值 。

2、HDFS客户端无法及时addBlock和关闭文件问题 分析在现网运行过程中,一些高负载集群的NN频繁打印以下“BlockisCommittedbutnotComplete日志”,客户端经常无法关闭文件,导致业务异常退出,如下图:这其实是一个block无法及时到达完成状态的问题 。在HDFS,一个块只有在达到最小拷贝数后才能成为完整状态 。HDFS默认的最小拷贝数是1,也就是说,在NameNode收到至少一个DataNode的报告 , 表明该块已经正式写入,其内容已经成功固化到磁盘之前 , 该块不能达到完成状态 。

3、Tomcat假死排查最近重启生产环境项目后,偶尔会出现这种情况:浏览器访问页面,一直处于加载状态,没有错误,服务器上的tomcat 日志没有访问记录输出 , 也没有异常日志 output,再次重启tomcat后才会正常运行 。后来在网上搜索了一番,才知道这是tomcat的假死 。因为当时情况紧急,没时间调查原因,忙着重启解决方案(小项目,不集群) 。在这里,我会记录下调查思路,防止下次遭遇后出现这种暴力解决方式 。
【jstack日志分析】如果有访问记录日志 print,说明从前端到nginx没有问题 。2.然后从nginx到tomcat检查情况 , 查看tomcat对日志localhost _ acess . log的访问,看是否有这个请求的记录 。如果没有记录 , 先怀疑是不是网络问题,从这个工作站Ping tomcatserver , 正常,没有发现问题 。既然网络好像没什么问题 , 我就开始怀疑是tomcat本身的问题 。

    推荐阅读