hi naisili, 我没有在你的邮件里看到任何附件、截图或者文字描述的错误,麻烦你再确认一次。
Thank you~ Xintong Song On Fri, Apr 26, 2019 at 10:46 AM naisili Yuan <[email protected]> wrote: > 还是集群稳定性问题,发现了这个错误,我想问下是不是我配置集群高可用的问题,是否不依赖zookeeper会更稳定一点。 > 希望得到回复,谢谢! > > naisili Yuan <[email protected]> 于2019年4月22日周一 下午2:23写道: > >> 不好意思,我忘记贴图了。 >> 我的flink standalone集群挂了,查看日志,看到截图上的错误 >> 我自己分析不明白,谷歌也查不到对应的问题。希望能得到你们的帮助,谢谢! >> >> 问题描述:我正在运行任务的flink集群跑了两天后挂掉了,原因是所有taskmanager进程全部挂了,只有一个jobmanager还在。 >> >> 集群环境:5台centos7的机器,32核,256GB内存,2个jobmanager,5个taskmanager,每台机器32个slots。jobmanager使用zookeeper做了高可用。 >> 初步分析原因:zookeeper的问题 >> 另外:不小心把日志清理了,没法粘贴文字了~ >> >> Xintong Song <[email protected]> 于2019年4月22日周一 下午1:27写道: >> >>> Hi naisili, >>> >>> This is the user-zh mailing list, so if you speak Chinese you can ask >>> questions in Chinese. If you prefer using English, you can send emails to >>> [email protected]. Hope that helps you. >>> >>> BTW, I think you forgot to attache the screenshot. >>> >>> Thank you~ >>> >>> Xintong Song >>> >>> >>> >>> On Mon, Apr 22, 2019 at 10:53 AM naisili Yuan <[email protected]> >>> wrote: >>> >>> > I use standalone cluster on flink, and i use zookeeper for the >>> jobmanager >>> > HA. >>> > The Screenshot is my taskmanager proccess down log, falte a error. >>> > And is don't know why it failed, even i google the error. >>> > Ask for help, thanks. >>> > >>> > >>> > >>> >>
