大负载下缩短检查点间隔这个动作,是不是可以理解为,流量大的时候检查点间隔小,听上去可以自适应地保证检查点间隔时间内的流量。
但有个问题是检查点间隔缩短,意味着检查点的开销会增大,在本来由于业务流量造成的高负载情况下进一步提高节点的负载,不知道这种系统设计上会不会有困难。
还请其他大佬指教

coke half <[email protected]> 于2020年4月18日周六 下午1:05写道:

>
> 你好,我现在了解到有对检查点开销的问题建模中考虑到恢复时间等开销,当负载大时检查点间隔会缩短。其实问题也就是,在大负载情况下自动缩短检查点间隔这个动作在实际业务场景中有意义吗?谢谢
>
> ________________________________
> 发件人: Lee Sysuke <[email protected]>
> 发送时间: Friday, April 17, 2020 10:41:42 AM
> 收件人: user-zh <[email protected]>
> 主题: Re: 关于flink检查点
>
> 一点个人看法:
>
> 一般业务场景下,大家都需要对流任务的错误范围有个比较确定性的认知。比如设置固定的5min周期,就可以比较确定流处理即使failover,误差也能控制在五分钟内。
> 但如果是自适应的间隔,负载越高周期越长,但实际failover在高负载下出现的概率应该远大于低负载,这样的设置实用价值可能就并不太大了。
>
> half coke <[email protected]> 于2020年4月15日周三 下午4:15写道:
>
> > 是的,根据任务负载的变化自动调整checkpoint的间隔,或者可以通过用户写的逻辑调整检查点。
> > 刚开始学习flink,想请教一下。
> >
> > Congxian Qiu <[email protected]> 于2020年4月15日周三 下午12:33写道:
> >
> > > hi
> > >
> > > 你说的间隔自适应是指什么呢?是指做 checkpoint 的间隔自动调整吗?
> > >
> > > Best,
> > > Congxian
> > >
> > >
> > > half coke <[email protected]> 于2020年4月15日周三 下午12:24写道:
> > >
> > > > 请问下为什么flink没有支持自适应检查点间隔呢?是出于什么样的考虑吗?
> > > >
> > >
> >
>

回复