Re: flink sql平台多版本支持问题

2021-06-12 文章 casel.chen
好的,我先尝试使用一下,谢谢! 在 2021-06-13 10:43:12,"Jeff Zhang" 写道: >如果不是native k8s的话,现在已经支持了,用remote模式就可以, >https://www.yuque.com/jeffzhangjianfeng/gldg8w/engh3w >native k8s的话,社区正在做,这是PR: https://github.com/apache/zeppelin/pull/4116 > > >casel.chen 于2021年6月13日周日 上午9:39写道: > >> 嗯,flink on

Re: Re: flink sql平台多版本支持问题

2021-06-12 文章 Jeff Zhang
如果不是native k8s的话,现在已经支持了,用remote模式就可以, https://www.yuque.com/jeffzhangjianfeng/gldg8w/engh3w native k8s的话,社区正在做,这是PR: https://github.com/apache/zeppelin/pull/4116 casel.chen 于2021年6月13日周日 上午9:39写道: > 嗯,flink on zeppelin也是一个不错的选择,只是因为现在flink on >

Re:Re: flink sql cdc数据同步至mysql

2021-06-12 文章 casel.chen
请问 flink sql cdc 场景下如何增大下游sink端并行度? 我试了修改default.parallism=2参数,并且将operator chain参数设置成false,并没有效果。 而后,我将作业分成两步:首先 源mysql cdc sink到 upsert kafka,再从 upsert kafka sink到 目标mysql。是想通过kafka partition增大sink并行度 初步测试效果是可以的,kafka建了3个partitions,每个partitions都按主键hash分配到数据,下游并行度跟partitions个数对齐。 以下是作业内容: --

Re:Re: flink sql平台多版本支持问题

2021-06-12 文章 casel.chen
嗯,flink on zeppelin也是一个不错的选择,只是因为现在flink on zeppelin还不支持作业运行在kubernetes上,所以暂时还无法直接使用,未来支持后可以考虑引入。 谢谢大佬给的建议。 在 2021-06-13 07:21:46,"Jeff Zhang" 写道: >另外一个选择是flink on zeppelin,可以调用flink on zeppelin的rest api,把zeppelin当做是flink >job server, zeppelin天然支持flink 1.10之后的所有版本。钉钉群:32803524 >

Re:flink sql cdc数据同步至mysql

2021-06-12 文章 casel.chen
即使下游sink能加大并行度,也不能确保上游同一个PK记录会流入到同一个task,也就无法保证操作同一条记录的顺序能正确replay,不是么? 在 2021-06-11 19:30:39,"东东" 写道: > > > >1、升级到1.13 >2、能不能追上要看写入量到底有多大,以及下游的处理能力啊,就是mysql自己的主从复制也不一定能确保追上,实践就知道了。 >3、可以设置一下default.parallism试试,如果发现被chain到一起了,可以把operator chain关掉试试。 > > >在 2021-06-11

Re: flink sql平台多版本支持问题

2021-06-12 文章 Jeff Zhang
另外一个选择是flink on zeppelin,可以调用flink on zeppelin的rest api,把zeppelin当做是flink job server, zeppelin天然支持flink 1.10之后的所有版本。钉钉群:32803524 casel.chen 于2021年6月12日周六 下午5:56写道: > 需求背景: > 因为不同Flink版本SQL底层实现不相同,同一个带状态的Flink SQL作业目前跨版本升级社区还不支持。所以如果基于Flink > SQL开发实时计算平台的话,平台需要支持不同Flink版本。早期的Flink

flink on 原生kubernetes支持批处理吗?

2021-06-12 文章 casel.chen
我们知道flink on 原生kubernetes当前是用k8s deployment运行一个流作业的,请问会用k8s job运行一个批作业吗?

Flink1.10 SQL支持消费Kafka多个Topic吗

2021-06-12 文章 Jason Lee
Hi,各位社区伙伴 我这里有一个问题想请教大家,Flink 1.10版本中可以写Flink SQL任务建表的时候指定多个Kafka的Topic吗?我发现Flink 1.12版本中Flink SQL任务可以通过用’topic’='topic-1;topic-2’这种方式消费多个Topic数据,但是想问一下大家知道在Flink 1.10版本中支持吗?可以通过正则匹配的方式实现消费多个Topic吗? 当然可以换一种方式比如建多个表每个表一个Topic饭后union,但是这种方式比较繁琐。 Best, JasonLee1781 | | 李闯 | |

flink sql平台多版本支持问题

2021-06-12 文章 casel.chen
需求背景: 因为不同Flink版本SQL底层实现不相同,同一个带状态的Flink SQL作业目前跨版本升级社区还不支持。所以如果基于Flink SQL开发实时计算平台的话,平台需要支持不同Flink版本。早期的Flink SQL作业用的是1.11,最新的Flink SQL作业采用的是1.13开发的。 而让平台支持不同Flink版本,我能想到有三种实现方案: 1. 平台直接调用 flink run 或 flink run-application 提交作业 优点:实现简单,每个flink版本都会带这个shell脚本