请教下: 1、DataStream 如按用户ID KeyBy后,同一个用户ID的数据最终会被分到一个Partition中吗?
2、假设1成立,这样就会有数据倾斜的问题。该如何解决?
3、假设1成立,如: DataStream
.keyBy(userID)
.timeWindow(....)
.aggregate(new
AggregateFunction(.......)),这里的AggregateFunction
为啥还需要merge呢。因为同一个Key的数据只会在同一个Partition中被计算,觉得不需要merge啊。
这三个问题有点疑惑,大神们帮忙看下!
感谢!
