感谢您的回复,通过keyby细节实现有点难. id:1,name:A,value:A1 id:2,name:A,value:A2 id:1,name:B,value:A3
以上三条记录,第一条最先到达,后面两条到达后发现id或者name和第一条的id或者name一致value就取第一条的值。 输出: id:1,name:A,value:A1 id:2,name:A,value:A1 id:1,name:B,value:A1 原来的想法是存一个map,map的key是id或者name,value是对应的value值;例如上面例子对应的mapstate对应的k,v: key:1,value:A1 key:A,value:A1 key:2,value:A1 key:B,value:A1 发自我的iPhone ------------------ 原始邮件 ------------------ 发件人: tison <[email protected]> 发送时间: 2020年5月26日 19:01 收件人: user-zh <[email protected]> 主题: 回复:全局state 任意并行度全局状态从物理上就是不可行的,你可以了解一下分布式计算系统怎么部署物理作业的。“全局状态”要么依赖外部存储要么依赖实现(部署)细节。 你这个需求能不能自定义 KeyBy 细节(KeySelector)来实现?相关文档见 https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/api_concepts.html#define-keys-using-key-selector-functions Best, tison. star <[email protected]> 于2020年5月26日周二 下午6:42写道: > 请问,有全局状态组件吗?我有一个需求需要对数据里的id和name做映射,也就是如果两条数据的id或者name相同则映射成一个值;现在只能使用operator > state,并且并行度设置为1,来实现全局state > > > 谢谢 > > 发自我的iPhone
