Re: Flink job不定期就会重启,版本是1.9

2020-07-03 文章 zhisheng
我们集群一般出现这种异常大都是因为 Full GC 次数比较多,然后最后伴随着就是 TaskManager 挂掉的异常 Xintong Song 于2020年7月3日周五 上午11:06写道: > 从报错信息看是 Akka 的 RPC 调用超时,因为是 LocalFencedMessage 所以基本上可以排除网络问题。 > 建议看一下 JM 进程的 GC 压力以及线程数量,是否存在压力过大 RPC 来不及响应的情况。 > > Thank you~ > > Xintong Song > > > > On Fri, Jul 3, 2020 at 10:48 AM noon cjihg w

Re: Flink job不定期就会重启,版本是1.9

2020-07-02 文章 Xintong Song
从报错信息看是 Akka 的 RPC 调用超时,因为是 LocalFencedMessage 所以基本上可以排除网络问题。 建议看一下 JM 进程的 GC 压力以及线程数量,是否存在压力过大 RPC 来不及响应的情况。 Thank you~ Xintong Song On Fri, Jul 3, 2020 at 10:48 AM noon cjihg wrote: > Hi,大佬们 > > Flink job经常不定期重启,看了异常日志基本都是下面这种,可以帮忙解释下什么原因吗? > > 2020-07-01 20:20:43.875 [flink-akka.actor.def

Flink job不定期就会重启,版本是1.9

2020-07-02 文章 noon cjihg
Hi,大佬们 Flink job经常不定期重启,看了异常日志基本都是下面这种,可以帮忙解释下什么原因吗? 2020-07-01 20:20:43.875 [flink-akka.actor.default-dispatcher-27] INFO akka.remote.RemoteActorRefProvider$RemotingTerminator flink-akka.remote.default-remote-dispatcher-22 - Remoting shut down. 2020-07-01 20:20:43.875 [flink-akka.actor.default-d