Nfq226 opened a new issue, #2404:
URL: https://github.com/apache/shardingsphere-elasticjob/issues/2404

   问题:我们有个定时任务,某一时刻突然不执行了,期间没有任何代码和配置上的变动,然后过了一天左右又自动恢复了;
   排查:期间排查过zk, 
zk有一台机器漂移,漂移时间和服务节点拉取不到任务分片的时间完全吻合,推测可能是zk有问题:1)可能选主失败,2)选主成功后,主节点划分作业分片然后写zk失败,导致服务节点拉取不到zk作业分片;最后排查下来zk选主没问题,但是主节点划分作业写到zk是否成功无法查看,因为定时任务每次调度都会写入,而且问题不好稳定复现。
   这个大佬们有碰到过或者其他排查思路吗?
   


-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: 
[email protected]

For queries about this service, please contact Infrastructure at:
[email protected]

Reply via email to