Re: 如何在Flink SQL中使用周期性水印?

2020-07-08 文章 noake
非常感谢大家的回复。


我们的业务场景已经解决了。
目前的做法是在TableSource中配置水印策略, 在WatermarkGenerator中判断是否需要发射新的水印




原始邮件
发件人:Jark wuimj...@gmail.com
收件人:user-zhuser...@flink.apache.org
发送时间:2020年7月8日(周三) 13:26
主题:Re: 如何在Flink SQL中使用周期性水印?


嗯, 可以在 JIRA 中开个 issue 描述下你的需求~ On Wed, 8 Jul 2020 at 12:01, 1193216154 
1193216...@qq.com wrote:  nbsp; nbsp;Jark,flink有没有必要去支持这个特性?我感觉还是有一些应用场景  
--nbsp;原始邮件nbsp;--  发件人:nbsp;"Jark 
Wu"imjark@gmail.comgt;;  发送时间:nbsp;2020年7月8日(星期三) 中午11:48  
收件人:nbsp;"user-zh"user-zh@flink.apache.orggt;;   主题:nbsp;Re: 如何在Flink 
SQL中使用周期性水印? 如果所有 partition 都没有数据,还希望 watermark 往前走,那 idle source 
确实解决不了这个问题。  目前确实没有太好的解决办法。   Best,  Jark   On Wed, 8 Jul 2020 at 11:08, 
1193216154 1193216154@qq.comgt; wrote:   gt; hi Jark Wu.  gt;  gt;  
我的理解是table.exec.source.idle-timeout只能解决watermark对齐的时候去忽略某个没有watermark的并行度。但是在每个并行度都没有watermark的时候,还是无法更新watermark。
  gt;  我觉得题主的意思应该是,在kafka的所有分区都没有数据的时候,最后一个窗口无法触发(因为没有watermark大于最后那个窗口结束时间了)。  
gt; 有没有可以设置在eventTime情况下,周期性生成当前时间的一个waterMark(和数据无关),因为可能没有新数据到来了。  gt;  gt;  
gt;  gt;  gt; --amp;nbsp;原始邮件amp;nbsp;--  gt; 
发件人:amp;nbsp;"Jark Wu"imjark@gmail.comamp;gt;;  gt; 
发送时间:amp;nbsp;2020年7月7日(星期二) 晚上6:09  gt; 
收件人:amp;nbsp;"user-zh"user-zh@flink.apache.orgamp;gt;;  gt;  gt; 
主题:amp;nbsp;Re: 如何在Flink SQL中使用周期性水印?  gt;  gt;  gt;  gt; Hi,  gt;  gt; 
这个问题我理解其实和周期性水印没有关系,是属于 idle source  gt; 的问题,你可以尝试下加上配置 
table.exec.source.idle-timeout = 10s 能不能解决你的问题。[1]  gt;  gt; Best,  gt; Jark  
gt;  gt; [1]:  gt;  gt;  
https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeout
  gt  
">https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeoutgt
  ;  gt; On Tue, 7 Jul 2020 at 17:35, noake noake@sina.cnamp;gt; wrote:  gt;  
gt; amp;gt; Dear All:  gt; amp;gt;  gt; amp;gt;  gt; amp;gt; 大佬们, 请教下如何在Flink 
SQL中使用周期性的水印。  gt; amp;gt; 我们在消费kafka时, 想设置在没有数据时水印时间也能继续向前走, 用的是Flink SQL。

Re: 如何在Flink SQL中使用周期性水印?

2020-07-07 文章 Jark Wu
嗯, 可以在 JIRA 中开个 issue 描述下你的需求~

On Wed, 8 Jul 2020 at 12:01, 1193216154 <1193216...@qq.com> wrote:

>  Jark,flink有没有必要去支持这个特性?我感觉还是有一些应用场景
>
>
>
>
> --原始邮件--
> 发件人:"Jark Wu" 发送时间:2020年7月8日(星期三) 中午11:48
> 收件人:"user-zh"
> 主题:Re: 如何在Flink SQL中使用周期性水印?
>
>
>
> 如果所有 partition 都没有数据,还希望 watermark 往前走,那 idle source 确实解决不了这个问题。
> 目前确实没有太好的解决办法。
>
> Best,
> Jark
>
> On Wed, 8 Jul 2020 at 11:08, 1193216154 <1193216...@qq.com wrote:
>
>  hi Jark Wu.
> 
> 
> 我的理解是table.exec.source.idle-timeout只能解决watermark对齐的时候去忽略某个没有watermark的并行度。但是在每个并行度都没有watermark的时候,还是无法更新watermark。
> 
> 我觉得题主的意思应该是,在kafka的所有分区都没有数据的时候,最后一个窗口无法触发(因为没有watermark大于最后那个窗口结束时间了)。
>  有没有可以设置在eventTime情况下,周期性生成当前时间的一个waterMark(和数据无关),因为可能没有新数据到来了。
> 
> 
> 
> 
>  --nbsp;原始邮件nbsp;----------
>  发件人:nbsp;"Jark Wu"  发送时间:nbsp;2020年7月7日(星期二) 晚上6:09
>  收件人:nbsp;"user-zh" 
>  主题:nbsp;Re: 如何在Flink SQL中使用周期性水印?
> 
> 
> 
>  Hi,
> 
>  这个问题我理解其实和周期性水印没有关系,是属于 idle source
>  的问题,你可以尝试下加上配置 table.exec.source.idle-timeout = 10s 能不能解决你的问题。[1]
> 
>  Best,
>  Jark
> 
>  [1]:
> 
> 
> https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeout
> 
> <https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeout>
> ;
>  On Tue, 7 Jul 2020 at 17:35, noake  
>  gt; Dear All:
>  gt;
>  gt;
>  gt; 大佬们, 请教下如何在Flink SQL中使用周期性的水印。
>  gt; 我们在消费kafka时, 想设置在没有数据时水印时间也能继续向前走, 用的是Flink SQL。


Re: 如何在Flink SQL中使用周期性水印?

2020-07-07 文章 Jark Wu
如果所有 partition 都没有数据,还希望 watermark 往前走,那 idle source 确实解决不了这个问题。
目前确实没有太好的解决办法。

Best,
Jark

On Wed, 8 Jul 2020 at 11:08, 1193216154 <1193216...@qq.com> wrote:

> hi Jark Wu.
>
> 我的理解是table.exec.source.idle-timeout只能解决watermark对齐的时候去忽略某个没有watermark的并行度。但是在每个并行度都没有watermark的时候,还是无法更新watermark。
> 我觉得题主的意思应该是,在kafka的所有分区都没有数据的时候,最后一个窗口无法触发(因为没有watermark大于最后那个窗口结束时间了)。
> 有没有可以设置在eventTime情况下,周期性生成当前时间的一个waterMark(和数据无关),因为可能没有新数据到来了。
>
>
>
>
> --原始邮件--
> 发件人:"Jark Wu" 发送时间:2020年7月7日(星期二) 晚上6:09
> 收件人:"user-zh"
> 主题:Re: 如何在Flink SQL中使用周期性水印?
>
>
>
> Hi,
>
> 这个问题我理解其实和周期性水印没有关系,是属于 idle source
> 的问题,你可以尝试下加上配置 table.exec.source.idle-timeout = 10s 能不能解决你的问题。[1]
>
> Best,
> Jark
>
> [1]:
>
> https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeout
>
> On Tue, 7 Jul 2020 at 17:35, noake 
>  Dear All:
> 
> 
>  大佬们, 请教下如何在Flink SQL中使用周期性的水印。
>  我们在消费kafka时, 想设置在没有数据时水印时间也能继续向前走, 用的是Flink SQL。


Re: 如何在Flink SQL中使用周期性水印?

2020-07-07 文章 Jark Wu
Hi,

这个问题我理解其实和周期性水印没有关系,是属于 idle source
的问题,你可以尝试下加上配置 table.exec.source.idle-timeout = 10s 能不能解决你的问题。[1]

Best,
Jark

[1]:
https://ci.apache.org/projects/flink/flink-docs-master/dev/table/config.html#table-exec-source-idle-timeout

On Tue, 7 Jul 2020 at 17:35, noake  wrote:

> Dear All:
>
>
> 大佬们, 请教下如何在Flink SQL中使用周期性的水印。
> 我们在消费kafka时, 想设置在没有数据时水印时间也能继续向前走, 用的是Flink SQL。


如何在Flink SQL中使用周期性水印?

2020-07-07 文章 noake
Dear All:


大佬们, 请教下如何在Flink SQL中使用周期性的水印。
我们在消费kafka时, 想设置在没有数据时水印时间也能继续向前走, 用的是Flink SQL。