yarn application -kill application_1565677682535_0431??????kill????????????????????

2019-09-08 文章 646208563
??flink??yarnsinkhdfs??close??yarn
 application -kill 
application_1565677682535_0431??killsink??close

Kafka 与 extractly-once

2019-09-08 文章 Jimmy Wong
Hi,all:
请教一下,我设置 checkpoint 的时间是 5 分钟,如果在这 5 分钟之内,某个 task 挂了,然后又重新拉起。我是不是可以理解为这时候从 
checkpoint 的数据获得的是这 5 分钟之前的 Kafka offset,但是这 5 分钟之内的消息已经消费,流向下游。重新拉起之后,source 
重放,那么这时候这 5 分钟的数据会再次被消费麽?如果再次消费,那么怎么保证 Extractly-Once 呢?
| |
Jimmy
|
|
wangzmk...@163.com
|
签名由网易邮箱大师定制



Re: FLINK WEEKLY 2019/36

2019-09-08 文章 Wesley Peng




on 2019/9/9 11:23, Zili Chen wrote:

FLINK WEEKLY 2019/36

很高兴和大家分享上周 FLINK 社区的发展。在过去的一周里,更多 FLINK 1.10 的特性被提出和讨论,包括新的 FLIP,来自 Apache
Pulsar 社区的 Connector 贡献等等。专门讨论 FLINK 1.10 将要实现什么特性的议程也在进行。
用户问题


A nice work. thank you.

regards.


FLINK WEEKLY 2019/36

2019-09-08 文章 Zili Chen
FLINK WEEKLY 2019/36 

很高兴和大家分享上周 FLINK 社区的发展。在过去的一周里,更多 FLINK 1.10 的特性被提出和讨论,包括新的 FLIP,来自 Apache
Pulsar 社区的 Connector 贡献等等。专门讨论 FLINK 1.10 将要实现什么特性的议程也在进行。
用户问题

Streaming File Sink疑问


FLINK 作业运行的集群和结果写入的 HDFS 集群不是同一个,配置 nameservices 正确寻址的方法

关于Flink SQL DISTINCT问题


FLINK SQL DISTINCT 窗口内去重的实现逻辑

flink1.9.0对DDL的支持


FLINK 1.9.0 仅支持通过 CLI Create View

如何优化flink内存?


特定业务使用滑动窗口导致占用大量内存,社区的成员分享了他们各自场景下对此问题的解决方案或绕过方案

flink1.9中blinkSQL对定义udf的TIMESTAMP类型报错


BLINK Planner 对 TIMESTAMP 支持与 FLINK Planner 的不同,确定为缺陷,将在 1.10 中修复

Making broadcast state queryable?


社区成员关于 queryable state 的改进建议,目前 queryable state 社区没有足够的 committer
能够参与到已有的改进方案讨论中。如果有更多的用户有对 queryable state 的需求的话,社区对此功能的优先级可能会重新定义

Post-processing batch JobExecutionResult


批作业场景下在 env.execute 后进一步处理作业结果的需求,目前除了提交到 session 集群以外由于 FLINK
作业提交逻辑的实现均无法做进一步处理。正在进行的 Client API 改进的讨论有助于改善这一情况

Flink SQL client support for running in Flink cluster


FLINK SQL Client 仅支持和预先部署的 standalone session 集群交互,是一个比较基础的实现。同样受限于目前
Client API 的缺陷,有望和 Client API 的改进一同得到改善
开发进展

FLINK-13954 Clean up ExecutionEnvironment / JobSubmission code paths


Client API 重构的一部分,重构 ExecutionEnvironment 和作业提交的遗留代码路径正在推进中

FLINK-13958 Job class loader may not be reused after batch job recovery


在最新的 Batch 作业恢复模式 region based restart 下,ClassLoader 加载 native library
可能会出现重复加载

[DISCUSS] Support JSON functions in Flink SQL


Xu Forward 发起了在 FLINK SQL 中支持 JSON 函数的讨论

[DISCUSS] Reducing build times


此前 Chesnay Schepler 发起的关于缩短 FLINK CI 构建时间的讨论有了新的进展,开始讨论是否将 FLINK 的 CI 迁移到
Travis 以外的系统上,以使得 e2e 的测试也能对每个 pull request 的提交都运行

[DISCUSS] Contribute Pulsar Flink connector back to Flink


来自 Apache Pulsar 社区的 Yijie Shen 提出了将适用于 FLINK 1.9.0 和 Pulsar 2.4.0 的
connector 贡献到 FLINK 社区的讨论。然而,由于此前 Pulsar connector 曾经提出过相同请求,但在提出 pull
request 之后被搁置至今,FLINK 社区和 Pulsar 社区正在商讨一个合适的贡献和维护 connector 的方式

[DISCUSS] FLIP-61 Simplify Flink's cluster level RestartStrategy
configuration


Till Rohrmann 提出的关于简化 FLINK 集群级别重启策略配置的 FLIP,已经被接受,正在实现中

[DISCUSS] FLIP-62: Set default restart delay for FixedDelay- and
FailureRateRestartStrategy to 1s


Till Rohrmann 提出的把重启策略的延迟默认值设置为非零值的 FLIP,这有助于避免 FLINK 以外的系统生成的流的重启。FLIP
已经被接受,正在实现中

FLIP-63: Rework table partition support


Jingsong Lee 提出的 FLIP-63,旨在重构 Table 的 partition 支持

[DISCUSS] FLIP-64: Support for Temporary Objects in Table module


Dawid Wysakowicz 提出的 FLIP-64,旨在支持 Table 中临时对象,是对 Catalog API 的功能完善

[DISCUSS] FLIP-66: Support time attribute in SQL DDL


Jark Wu 提出的 FLIP-66,旨在支持在 SQL DDL 中的时间属性,这将有助于用户对 DDL 生成的 Table 应用 window 操作
社区新闻

[DISCUSS] Features for Apache Flink 1.10


Gary Yao 发起了 FLINK 1.10 特性的讨论,旨在初步确定 FLINK 将会在 1.10 中引入什么功能和改进。同时,Gary
提议了自己和 Yu Li 担当 1.10 的 release manager

[ANNOUNCE] Kostas Kloudas joins the Flink PMC

回复: 多个keyBy时,只有最后一个超作用吗?

2019-09-08 文章 gaofeilong198...@163.com
相当于做了两次shuffle,对下游来讲只有最后一次shuffle生效,其他的shuffle都是浪费性能,如果想对name和age组合作分组的话, 
应该用keyby(name + age)。




gaofeilong198...@163.com
 
发件人: but...@163.com
发送时间: 2019-09-09 09:33
收件人: user-zh
主题: 多个keyBy时,只有最后一个超作用吗?
大家好,
我有如下代码:
 
dataStream.keyBy(PojoClass::getName).keyBy(PojoClass::getAge)...

这样的代码,我发现,只有最后一个keyBy生效,前面的不生效,
我想问原本设计就是这样的吗?
还是BUG?
 


Re: FLink WEB 怎么加登录验证?

2019-09-08 文章 Bruce Bian
Good morning !
+1.
if you use nginx dynamic(redirect) proxy to Flink web ui ,
you can use Nginx bash_aush module implement simple username and password
authentication;

Thanks.



Wesley Peng  于2019年9月5日周四 上午10:48写道:

> Hi
>
> on 2019/9/5 10:46, wanghongquan.sh wrote:
> > FLink WEB 控制台中,没有找到登录验证的配置,请问这个WEB怎么加登录验证?
>
> Flink does not directly support authenticating access to the web UI, but
> you can always put something like Apache's basic_auth in front of it.
>
>


多个keyBy时,只有最后一个超作用吗?

2019-09-08 文章 but...@163.com
大家好,
我有如下代码:

dataStream.keyBy(PojoClass::getName).keyBy(PojoClass::getAge)...

这样的代码,我发现,只有最后一个keyBy生效,前面的不生效,
我想问原本设计就是这样的吗?
还是BUG?