假设一个简单的map和reduce操作。A是Map Operator,B是keyby Operator。 A有两个task:taskA1和taskA2,B只有一个taskB
如果taskA2执行的特别慢,taskA1执行完毕checkpoint cp1后,告诉了taskB,然后已经开始(或者说可以开始)处理下一个checkpoint cp2的数据了。 这时候taskA2还在缓慢的处理cp1的数据。这时候: taskA1会继续处理cp2的数据吗? 如果是继续处理,taskB会处理taskA传递给taskB的cp2的数据吗? 还是taskA1和taskB都停止处理*,*等taskA2? 同样的问题,如果taskA本身就是一个reduce操作(keyby),taskB是一个map操作。那么同样的问题,答案是一样的吗? 谢谢~
