这个问题有人清楚吗。今天又是重启,5min了,还是initializing阶段,client部分直接报异常退出(报的Caused by: org.apache.flink.runtime.rest.util.RestClientException: [Internal server error., <Exception on server side: org.apache.flink.runtime.client.DuplicateJobSubmissionException: Job has already been submitted.),应该是自动重试然后发现已提交了该任务所以报错。
大佬给介绍下initializinng阶段都干嘛,什么事情可能耗时。 比如状态的恢复? 赵一旦 <[email protected]> 于2021年2月7日周日 下午4:00写道: > 截图也没办法反应动态变化的过程。 > > 目前是10机器的Standalone集群,状态在5G左右。通过flink-client端提交任务,然后web-ui刷新就一直转圈,过一会(几十秒大概)就OK啦,然后刚刚OK一瞬间会有很多个处于Initialize状态的任务,然后慢慢(10s内吧)没掉。 > > flink-client端的话,有时候正常提交完成,有时候出现报错(类似说是重复任务的)。 > > > zilong xiao <[email protected]> 于2021年2月7日周日 下午3:25写道: > >> 有截图吗? >> >> 赵一旦 <[email protected]> 于2021年2月7日周日 下午3:13写道: >> >> > 这个问题现在还有个现象,我提交任务,web >> > UI就类似卡住状态,过一会刷新出来任务,会有4-5个initialize状态的任务,然后几秒之内陆续消失,剩下1个。 >> > >> > 目前怀疑是有什么重试机制,导致重复提交N个任务,然后可能还有什么去重机制,然后其中几个陆续自动停掉? >> > >> > 赵一旦 <[email protected]> 于2021年1月26日周二 上午10:51写道: >> > >> > > >> 如上,目前发现以前很快(10-30s)内能从敲命名到running的任务。现在有时候innitialize阶段就得1-2min。不清楚啥情况。 >> > > >> > >> >
