Hi 本超,
感谢你的回复,这个地方的代码我们确实改动过,官方代码的行为是正常的。非常感谢!
> 目前 Flink SQL 我这边使用也是无法指定各个算子的并行度。
> 1.并行度超过 topic partition 的时候会造成资源浪费
> 2.并行度超过 topic partition 后,checkpoint 也无法正常触发了
其中第二个问题是我们自己改动官方 Flink 源码造成的。
Best forideal
在 2020-08-22 11:37:20,"Benchao Li" <[email protected]> 写道:
>Hi forideal,
>
>我在本地试了一下,没有复现你说的这个情况。
>我看代码也没有这个逻辑,如果是没有分配到partition,应该是会阻塞住,而不是finish。
>你这个测试用的是社区的版本么?还是有什么特殊的改动?
>
>forideal <[email protected]> 于2020年8月21日周五 下午11:43写道:
>
>> Hi 赵一旦,
>> 基础信息:使用 watermark for 语法设置watermark,Flink SQL,Blink planner,Flink 1.10.0
>> 我最近做了一个实验,将Flink SQL 的并发设置为 kafka topic partition 的 2 倍,同时设置 idle 的时间为 10s。
>> 这时,1.source 会有一半的partition 立马就 finished
>> 2.下游的 workmark 变成了LONG的最大值
>> 整个任务都无法正常运行了。
>>
>>
>> Best forideal
>>
>>
>>
>>
>> 在 2020-08-17 10:05:48,"Zhao,Yi(SEC)" <[email protected]> 写道:
>> >我这边才研究FlinkSQL没几天。不过按照目前了解,是不支持算子级别并行度设置的。
>>
>> >此外你说的checkpoint无法正常触发,我估计是因为barrier的问题,部分并行示例没有分区数据,导致没数据就可能导致。这个问题类似,可能无解。
>> >
>> >非要解决可以写代码,把souce部分不使用sql实现。
>> >__________
>> >
>> >在 2020/8/15 下午8:21,“forideal”<[email protected]> 写入:
>> >
>> > Hi 赵一旦,
>> >
>> >
>> > 目前 Flink SQL 我这边使用也是无法指定各个算子的并行度。目前我这边遇到两个问题。
>> > 1.并行度超过 topic partition 的时候会造成资源浪费
>> > 2.并行度超过 topic partition 后,checkpoint 也无法正常触发了
>> >
>> >
>> > Best forideal
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> >
>> > 在 2020-08-14 12:03:32,"赵一旦" <[email protected]> 写道:
>> > >检查点呢,大多数用FlinkSQL的同学们,你们的任务是随时可运行那种吗,不是必须保证不可间断的准确性级别吗?
>> > >
>> > >Xingbo Huang <[email protected]> 于2020年8月14日周五 下午12:01写道:
>> > >
>> > >> Hi,
>> > >>
>> > >> 关于并行度的问题,据我所知,目前Table API上还没法对每一个算子单独设置并行度
>> > >>
>> > >> Best,
>> > >> Xingbo
>> > >>
>> > >> Zhao,Yi(SEC) <[email protected]> 于2020年8月14日周五 上午10:49写道:
>> > >>
>> > >> >
>> 并行度问题有人帮忙解答下吗,此外补充个相关问题,除了并行度,flink-sql情况下,能做检查点/保存点,并基于检查点/保存点重启sql任务吗。
>> > >> >
>> > >> > 发件人: "Zhao,Yi(SEC)" <[email protected]>
>> > >> > 日期: 2020年8月13日 星期四 上午11:44
>> > >> > 收件人: "[email protected]" <[email protected]>
>> > >> > 主题: 如何设置FlinkSQL并行度
>> > >> >
>> > >> > 看配置文件有 execution. Parallelism,但这个明显是全局类型的配置。
>> > >> > 如何给Sql生成的数据源结点,window结点,sink结点等设置不同的并行度呢?
>> > >> >
>> > >> > 比如数据源理论上应该和kafka分区数一致比较好,window则需要根据数据量考虑计算压力,sink也应该有相应的场景考虑。
>> > >> >
>> > >> >
>> > >>
>> >
>> >
>>
>
>
>--
>
>Best,
>Benchao Li