我们的场景是这样的:

从hive读数据,计算后写回hive。

从hive读数据,为了加快速度,使用了650个并发subTask。

向hive写数据,为了减少小文件,需要控制并发subTask数量。

因此需要找一个环节进行shuffle。

所以有上面的疑问。




--
Sent from: http://apache-flink.147419.n8.nabble.com/

回复