Re: 关于状态恢复后计算加快的疑问

克兰弗 Tue, 13 Apr 2021 23:37:46 -0700

我想我知道了问题所在，应该是kafka生产者的生成速率相对较慢，导致正常处理时flink的处理速度较慢，在故障后恢复时，因为重新消费之前的数据，生产者段的数据相对充足，所以flink的处理速率就变大了


On 2021/04/14 04:14:30, "刘阳buaa" <[email protected]> wrote: 
> 你好！    
> 我针对WordCount写了一个kafka数据源的有状态的版本，我在模拟算子故障，见附件源码中抛出的InterruptException（算子运行20s后抛出异常），我发现恢复的时间大约为1s，而数据追赶花费的时间竟然只有200ms，而且在某个时间点又会变慢，和故障前的处理速度相似，这是什么机制呢？

Re: 关于状态恢复后计算加快的疑问

回复