图片没有显示出来。container 调度是由 yarn 控制的,yarn 会优先选择运行中的节点。按理说 container
不会调度到下线的节点,你通过 yarn web 或者 yarn node -list 确认了吗?

chenyu_opensource <chenyu_opensou...@163.com> 于2024年2月27日周二 18:30写道:

> 你好,flink任务提交到yarn上,由于某个节点下线导致flink任务失败,如下:
>
> 同时重试超过次数,任务失败,如下图:
>
> 我想问一下,flink重试机制中
> 任务不会重新调度到新节点的container吗?为什么一直在同一个节点从而导致整体任务失败。这个调度是由yarn控制还是flink自身代码控制的?如有相关代码也请告知,谢谢。
>
> 期待回复,谢谢!
>

回复