非常谢谢您的解答,这个问题是zk中有失败任务的jobGraph,导致每次启动群集就会去检索,删除zk中残余后重启即可解决。
Thank you for your reply!
发件人: baiyg25...@hundsun.com
发送时间: 2019-03-26 09:40
收件人: user-zh
主题: Re: Re: flink ha模式进程hang!!!
是不是跟这个访问控制有关?
high-availability.zookeeper.client.acl: open
baiyg25...@hundsun.com
发件人: Han Xiao
发送时间
这个问题早上的时候已经解决,就是因为zk中有残余的失败jobGraph,删除即可恢复群集。
真的非常谢谢您,以后还要多和您请教学习。
Thank you for your reply!
发件人: Zili Chen
发送时间: 2019-03-26 09:46
收件人: user-zh@flink.apache.org
主题: Re: Re: flink ha模式进程hang!!!
如果没有清理此前的 zk 数据的话,有可能是此前你把 high-availability.storageDir 配置成
/flink/ha/zookeeper,随后清理了 hdfs 但是 zk 上还有过期
是不是跟这个访问控制有关?
high-availability.zookeeper.client.acl: open
baiyg25...@hundsun.com
发件人: Han Xiao
发送时间: 2019-03-26 09:33
收件人: user-zh@flink.apache.org
主题: Re: Re: flink ha模式进程hang!!!
Hi,早上好,谢谢您的回复,以下是我的配置项及参数:
flink-conf.yaml
common:
jobmanager.rpc.address: test10
jobmanager.rpc.port: 6123
test14
>
> 以上为全部配置项,结合下面报的错误信息检索路径,我的配置中并没有。。。很让我不解。
>
> Thank you for your reply!
> 发件人: Zili Chen
> 发送时间: 2019-03-25 19:57
> 收件人: user-zh@flink.apache.org
> 主题: Re: flink ha模式进程hang!!!
> 看起来是 HDFS 去 /flink/ha/zookeeper/submitte
test14
以上为全部配置项,结合下面报的错误信息检索路径,我的配置中并没有。。。很让我不解。
Thank you for your reply!
发件人: Zili Chen
发送时间: 2019-03-25 19:57
收件人: user-zh@flink.apache.org
主题: Re: flink ha模式进程hang!!!
看起来是 HDFS 去 /flink/ha/zookeeper/submittedJobGraphb05001535f91 这个路径下找
submittedJobGraph,这个看起来就不太对
能提供你的 ha 配置吗?特别是 high-availability.storageDir,我怀疑是不是没有配置这个啊
Best,
tison.
Han Xiao 于2019年3月25日周一 下午7:26写道:
> 各位朋友大家好,我是flink初学者,部署flink ha的过程中出现一些问题,麻烦大家帮忙看下;
> 启动flink ha后,jobmanager进程直接hang,使用的flink 1.7.2版本,下面log中有一处出现此错误 File does
> not exist: