Hi,您好
我有个需求,具体逻辑是:用 Flink 读 Kafka Topic 的用户行为数据,关联 Hbase
中用户的详细信息后输出。有个优化点是:在关联 Hbase 时会先通过 Topic 中的 userid 查
Hbase,并先将Hbase中的用户详细信息保存到状态中。这样有个好处:假设状态过期时间是6小时,用户在6小时之内有行为将会先从状态中读取。具体伪代码如下:
env.addSource(new FlinkKafkaConsumer011(...))
.map(message ->(userid,actions))
.keyby(userid)
.process(new MyHbaseStateFunction)
.print()
我想问的点是:如果用Flink Sql 实现上述功能的话,可能需要新增一个Flink UDF。但是类似上述场景,在
keyby之后,要获取同一个userid的详细信息,只需要读特定的task内的状态即可。如果用Flink
UDF实现的话,我该如何将数据通过userid分组。
- 自定义函数UDF函数相关疑问 王允诺
- ????????????????UDF???????????? claylin
