Java自动重启原因

# Java自动重启原因

今天朋友问了我一个面试题：Java服务每个一段时间就会重启是什么原因？

刚看到这个问题的时候，一下子没反应过来。

因为单从进程的角度看，除非有外部的经常来对Java进程进行一个保活，才能够实现自动重启的功能。

常见的保活手段常见的大概有两种：

一种通过Docker打包成容器利用restart策略进行保活

另一种将Java的启动命令注册成service服务，利用linux的service进行保活。

所以，自动重启的问题就转化为 Java进行在何时会被杀死？

杀死的Java也分为两大类，内部力量和外部力量。

OOM killer是Linux保障操作系统平稳运行的一个机制，不会由于用户进程把系统资源耗尽导致操作系统的崩溃。

在当物理内存和交换空间不够用时，OOM Killer 就会选择杀死进程，Linux每个进程都记录了oom_score这个值记录了每个PID（进程ID）被操作系统杀掉的先后顺序，这个文件位于/proc/<pid>/oom_score。

oom_score 的值是由很多因素共同决定的：

所以说，在Java进程不断地吃内存和CPU的时候，oom_score也随之变得越来越大，最后被杀掉。

这种情况下，可以通过dmesg命令进行查询

dmesg | grep java

也可以执行，下面这个命令到日志中查询

egrep -i 'killed process' /var/log/messages

JVM发生致命错误导致崩溃时，会生成一个hs_err_pid_xxx.log这样的文件，该文件包含了导致 JVM crash 的重要信息，我们可以通过分析该文件定位到导致 JVM Crash 的原因，从而修复保证系统稳定

-XX:ErrorFile=/var/log/hs_err_pid<pid>.log

当然这个文件巨复杂，包含JVM死掉之前的各种信息，这个文件的内容他主要有如下内容

一般情况下，也不会使用这个文件去进行分析，更多的是打印OOM的崩溃日志

-XX:+HeapDumpOnOutOfMemoryError

这个文件就比较好懂了，给丢到VisualVM中很快就能定位问题。

针对服务被干掉的问题可以先看有没有dump日志，再用dmesg命令看是不是操作系统把进程干掉了，都查不到就只能啃ErrorFile了。

👋🏻👋🏻👋🏻