【V4.5】ES节点脱离

问题版本:

es版本:5.6.13

问题现象/报错:

Es集群日志报错overhead,es节点脱离集群,如下图:

排查思路/解决方案:

原因分析:数据量较大时,在入库的过程中,经过一段时间会有部分数据节点脱离集群。

解决方案:通过增加ping_timeout的时间,和增加ping_retries的次数来防止节点错误的脱离集群,可以使节点有充足的时间进行full GC。

在es的配置文件中写入条件:

discovery.zen.fd.ping_timeout: 1000s

discovery.zen.fd.ping_retries: 10