我想我知道了问题所在,应该是kafka生产者的生成速率相对较慢,导致正常处理时flink的处理速度较慢,在故障后恢复时,因为重新消费之前的数据,生产者段的数据相对充足,所以flink的处理速率就变大了

On 2021/04/14 04:14:30, "刘阳buaa" <[email protected]> wrote: 
> 你好!    
> 我针对WordCount写了一个kafka数据源的有状态的版本,我在模拟算子故障,见附件源码中抛出的InterruptException(算子运行20s后抛出异常),我发现恢复的时间大约为1s,而数据追赶花费的时间竟然只有200ms,而且在某个时间点又会变慢,和故障前的处理速度相似,这是什么机制呢?

回复