如题,目前发现任务报错是:org.apache.flink.runtime.io.network.partition.PartitionNotFoundException:
Partition c74a0a104d81bf2d38f76f104d65a2ab#27@7e1a8495f062f8ceb964a3205e584613
not found

——————————
任务本身问题不大,也不是网络问题。 目前发现解决方法:

换成非单 JM 即可。

同时也发现一个可能原因,或另一个明显现象:

从web ui的Taskmanager界面可以发现,执行 start-cluster 脚本的机器A(同时也是 JM ,即配置到
masters 文件的唯一机器),该机器对应的tm的resource id中ip是127.0.0.1。其他机器都是显示的内网ip。

————
masters文件换2个以上机器后,没问题了,包括后一个现象,ip也都是正常的。

回复