from:"xiao cai"

flink1.12.4 写入hdfs报错 java.lang.OutOfMemoryError: Direct buffer memory

2021-11-08 文章 xiao cai

通过flink 1.12.4 streaming file sink 写入hdfs，运行过程中抛出以下异常： 2021-11-08 20:39:05 java.io.IOException: java.lang.OutOfMemoryError: Direct buffer memory at org.apache.hadoop.hdfs.DataStreamer$LastExceptionInStreamer.set(DataStreamer.java:299) at

Re: Flink on yarn 如何指定固定几台yarn节点当做flink任务的运行节点

2020-12-21 文章 xiao cai

Hi 可以考虑使用yarn的node label特性，将flink的任务提交到特定的node上 Original Message Sender: r pp Recipient: user-zh Date: Monday, Dec 21, 2020 21:25 Subject: Re: Flink on yarn 如何指定固定几台yarn节点当做flink任务的运行节点嗯，指定几台机子用于使用flink 运行，为什么不在yarn 为flink 专门制定一个队列呢？需要网络隔离。。。内网速度多大？于2020年12月21日周一下午5:48写道： > 通过yarn

Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-08 文章 xiao cai

Hi Jark sorry，是1.12.0，我打错了 Original Message Sender: Jark Wu Recipient: user-zh Date: Wednesday, Dec 9, 2020 14:40 Subject: Re: FlinkSQL如何定义JsonObject数据的字段类型 Hi 赵一旦，这部分 jackson 组件已经自动处理了这部分逻辑。 Hi xiaocai, 你有什么 issue 是需要1.12.1的？ 1.12.0 这两天即将发布。 Best, Jark On Wed, 9 Dec 2020 at 14:34, xiao

Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-08 文章 xiao cai

Hi Jark Original Message Sender: Jark Wu Recipient: user-zh Date: Wednesday, Dec 9, 2020 14:40 Subject: Re: FlinkSQL如何定义JsonObject数据的字段类型 Hi 赵一旦，这部分 jackson 组件已经自动处理了这部分逻辑。 Hi xiaocai, 你有什么 issue 是需要1.12.1的？ 1.12.0 这两天即将发布。 Best, Jark On Wed, 9 Dec 2020 at 14:34, xiao cai wrote: > 好

Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-08 文章 xiao cai

好的，计划下周升级测试下，另：1.12.1计划何时发布呢 Original Message Sender: Jark Wu Recipient: user-zh Date: Tuesday, Dec 8, 2020 13:41 Subject: Re: FlinkSQL如何定义JsonObject数据的字段类型 hailong 说的定义成 STRING 是在1.12 版本上支持的， https://issues.apache.org/jira/browse/FLINK-18002 1.12 这两天就会发布，如果能升级的话，可以尝试一下。 Best, Jark On Tue,

Re: Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-07 文章 xiao cai

; Schema 不太确定的话，那么下游怎么用这个数据呢？ > > > Best， > Hailong > > 在 2020-12-07 15:21:16，"xiao cai" 写道： > >ROW需要写明具体的字段类型，比如： > >ROW<`id` string, …>，但是我并没有办法知道jsonObject中具体的schema > > > > > > Original Message > >Sender: 李轲 > >Recip

Re:Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-07 文章 xiao cai

那么下游怎么用这个数据呢？ Best， Hailong 在 2020-12-07 15:21:16，"xiao cai" 写道： >ROW需要写明具体的字段类型，比如： >ROW<`id` string, …>，但是我并没有办法知道jsonObject中具体的schema > > > Original Message >Sender: 李轲 >Recipient: user-zh >Date: Monday, Dec 7, 2020 16:14 >Subject: Re: FlinkSQL如

Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-07 文章 xiao cai

ROW需要写明具体的字段类型，比如： ROW<`id` string, …>，但是我并没有办法知道jsonObject中具体的schema Original Message Sender: 李轲 Recipient: user-zh Date: Monday, Dec 7, 2020 16:14 Subject: Re: FlinkSQL如何定义JsonObject数据的字段类型可以试试ROW 发自我的iPhone > 在 2020年12月7日，15:43，xiao cai 写道： > > String不行，取出来的值是null

Re: FlinkSQL如何定义JsonObject数据的字段类型

2020-12-06 文章 xiao cai

String不行，取出来的值是null Original Message Sender: silence Recipient: user-zh Date: Monday, Dec 7, 2020 14:26 Subject: Re: FlinkSQL如何定义JsonObject数据的字段类型可以用string -- Sent from: http://apache-flink.147419.n8.nabble.com/

FlinkSQL如何定义JsonObject数据的字段类型

2020-12-06 文章 xiao cai

Hi, flink version: 1.11.2 api: flink-sql 场景：使用flink sql定义了一张kafka的source表，kafka中数据为json格式的字符串。其中context是json的一个键，其值为jsonObject，数据示例如下： { “id”: 1, "context”: { … (这里的数据为jsonObject，具体schema不确定，由各个业务方自行确定，可能嵌套，也可能不嵌套，完全不可控) } } 建表语句为： CREATE TABLE json_source ( id bigint, context )

Re:FlinkSLQ双流join使用LAST_VALUE + INTERVAL JOIN时遇到问题

2020-11-03 文章 xiao cai

该是因为你的 kafkaSouce1 table 的 rowtime 经过 group by 后使用了 last_value 导致不是时间属性类型->`TimeIndicatorRelDataType`，而在 rule 进行判断后没有 windowBounds，所以就报了现在这个错误了。 Best, Hailong Wang 在 2020-11-03 18:27:51，"xiao cai" 写道： >Hi : >flink 版本 1.11.2 >问题：双流Join时，使用last_value + interval joi

FlinkSLQ双流join使用LAST_VALUE + INTERVAL JOIN时遇到问题

2020-11-03 文章 xiao cai

Hi : flink 版本 1.11.2 问题：双流Join时，使用last_value + interval join，报错：Rowtime attributes must not be in the input rows of a regular join. As a workaround you can cast the time attributes of input tables to TIMESTAMP before. 代码： // stream 1 create table kafkaSource1 ( id int, field_1 int, field_2

FlinkSLQ双流join使用LAST_VALUE + INTERVAL JOIN时遇到问题

2020-11-02 文章 xiao cai

Hi : flink 版本 1.11.2 问题：双流Join时，使用last_value + interval join，报错：Rowtime attributes must not be in the input rows of a regular join. As a workaround you can cast the time attributes of input tables to TIMESTAMP before. 代码： // stream 1 create table kafkaSource1 ( id int, field_1 int, field_2

如何为每个flink任务分别设置metrics的reporter

2020-10-12 文章 xiao cai

Hi：已知的设置metrics reporter的方式是在conf/flink-conf.yaml中，如果想要为每个任务分别设置不同的metrics reporter或者设置不同的参数，比如设置prometheus pushgateway的多个自定义的k=v，该如何设置呢？ Best xiao.

Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-29 文章 xiao cai

这个我们有尝试，遇到了classpath的问题，导致包冲突，无法启动进程，你们有遇到过相关的情况吗？原始邮件发件人: todd 收件人: user-zh 发送时间: 2020年9月29日(周二) 17:36 主题: Re: 怎么样在Flink中使用java代码提交job到yarn https://github.com/todd5167/flink-spark-submiter 可以参考这个案例，用ClusterCLient提交。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

回复: Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-28 文章 xiao cai

： 2020-09-25 16:42 收件人： user-zh 主题： Re: 怎么样在Flink中使用java代码提交job到yarn 可以捕获控制台打印出来的日志，flink相关日志的格式很固定，字符串截取就能获得 yarn application id 和 flink job id > 在 2020年9月25日，下午4:23，xiao cai 写道： > > Hi all： > 大家好，我目前遇到一个flink 任务提交方面的困扰： > 想要在自己的项目中（springboot）提交flink job到yarn上。目前采用的方式是process类在本地

Re:Re:HistoryServer完成任务丢失的问题

2020-09-27 文章 xiao cai

貌似是个bug 原始邮件发件人: xiao cai 收件人: user-zh 发送时间: 2020年9月27日(周日) 18:31 主题: Re:Re:HistoryServer完成任务丢失的问题是在history server中没有，但是yarn logs还是可以看到的，我理解是任务结束前，jobManager没有upload文件到指定目录，所以history server没有拉取到。但是为何没有upload，我通过jobManager的日志也没看出来，没有任何报错。原始邮件发件人: Michael Ran 收件人: user-zh 发送时间: 2020年9月

Re:Re:HistoryServer完成任务丢失的问题

2020-09-27 文章 xiao cai

貌似是个bug，我的版本是1.11.0 https://issues.apache.org/jira/browse/FLINK-18959?jql=project%20%3D%20FLINK%20AND%20issuetype%20%3D%20Bug%20AND%20text%20~%20%22history%20server%22 原始邮件发件人: xiao cai 收件人: user-zh 发送时间: 2020年9月27日(周日) 18:41 主题: Re:Re:HistoryServer完成任务丢失的问题貌似是个bug 原始邮件发件人: xiao cai

Re:Re:HistoryServer完成任务丢失的问题

2020-09-27 文章 xiao cai

故消失的在 2020-09-27 17:03:45，"xiao cai" 写道： >是的，默认是10s一次，但是这个是去jobmanager的归档目录里拉取的间隔。 >问题是cancel的那次job，并没有上传日志信息到归档目录里。 > > > 原始邮件 >发件人: Michael Ran >收件人: user-zh >发送时间: 2020年9月27日(周日) 16:45 >主题: Re:HistoryServer完成任务丢失的问题 > > >history 记得是定时拉取的，有延

Re:HistoryServer完成任务丢失的问题

2020-09-27 文章 xiao cai

是的，默认是10s一次，但是这个是去jobmanager的归档目录里拉取的间隔。问题是cancel的那次job，并没有上传日志信息到归档目录里。原始邮件发件人: Michael Ran 收件人: user-zh 发送时间: 2020年9月27日(周日) 16:45 主题: Re:HistoryServer完成任务丢失的问题 history 记得是定时拉取的，有延迟过去在 2020-09-27 16:40:27，"xiao cai" 写道： >Hi: >flink 1.11.0 >我启动了一个任务，当这个任务进行checkp

HistoryServer完成任务丢失的问题

2020-09-27 文章 xiao cai

Hi: flink 1.11.0 我启动了一个任务，当这个任务进行checkpoint的时候，我在webui中点击了cancel，任务在yarn中的状态时killed，但是再到history server中却找不到这个任务。同时我尝试了再yarn中kill application的方式，也是无法发现。这个问题有点随机，不是每次都会出现，有时候执行cancel，在history server又能看到。希望了解history serve相关原理的同学给予帮助。非常感谢。 best, xiao.

Flink SQL如何设置checkpoint的TTL

2020-09-27 文章 xiao cai

Hi: 目前想了解下载Flink SQL下该如何设置checkpoint的TTL。非常感谢指教 Best, xiao.

Re:Re:Re: Re: Flink SQL撤回流问题

2020-09-27 文章 xiao cai

: Michael Ran 收件人: user-zh 发送时间: 2020年9月27日(周日) 15:03 主题: Re:Re:Re: Re: Flink SQL撤回流问题感觉这不是flink的问题，我们也有类似场景，dt 按天其实并不多，直接就没要id了，如果你非要id，而且数量变化巨大，那么用integer ，当然还是有可能超。 auto 一般适用数据量不大的单表场景。分布式大数据量场景，都是自己设计id，或者不要id 在 2020-09-27 14:56:06，"xiao cai" 写道： >Hi Ran: >非常感谢，我试了insert into O

Re:Re: Re: Flink SQL撤回流问题

2020-09-27 文章 xiao cai

nsert into table(dt,num) values(dt,新数量) ON DUPLICATE KEY UPDATE dt=values(dt)你模拟下这个语句呢，看看id成为1 之后，是不是就不变了在 2020-09-27 14:32:57，"xiao cai" 写道： >Hi lec ssmi: > insert的时候没有指定id，只指定了dt和cnt，因为id在mysql的sink表里是自增的主键，所以flink sql里并没有指定。 > 原始邮件 >发件人: lec ssmi >收件人: flink-user-

Re: Re: Flink SQL撤回流问题

2020-09-27 文章 xiao cai

t; > > hi > 你建mysql要指定主键，另外创建flink表时也要指定一下主键 > > PRIMARY KEY (id) NOT ENFORCED，这样就会根据主键upsert了 > > > > > > > > > 在 2020-09-27 13:36:25，"xiao cai" 写道： > > >如果是先delete再insert，为何主键id一直都是1呢，如果delete在insert时指定了id值，那么auto_increment是不会变的。 >

Re:Re: Flink SQL撤回流问题

2020-09-27 文章 xiao cai

:36:25，"xiao cai" 写道： >如果是先delete再insert，为何主键id一直都是1呢，如果delete在insert时指定了id值，那么auto_increment是不会变的。 >这是我很困惑的地方。 > > > 原始邮件 >发件人: lec ssmi >收件人: flink-user-cn >发送时间: 2020年9月27日(周日) 13:06 >主题: Re: Flink SQL撤回流问题 > > >是不是底层的sink在处理retract的时候，使用的是先delte

Re: Flink SQL撤回流问题

2020-09-26 文章 xiao cai

如果是先delete再insert，为何主键id一直都是1呢，如果delete在insert时指定了id值，那么auto_increment是不会变的。这是我很困惑的地方。原始邮件发件人: lec ssmi 收件人: flink-user-cn 发送时间: 2020年9月27日(周日) 13:06 主题: Re: Flink SQL撤回流问题是不是底层的sink在处理retract的时候，使用的是先delte再insert ，而不是直接update呢。 xiao cai 于2020年9月27日周日下午12:08写道： > 场景如下： > source

Re:Flink SQL撤回流问题

2020-09-26 文章 xiao cai

件发件人: Michael Ran 收件人: user-zh 发送时间: 2020年9月27日(周日) 11:51 主题: Re:Flink SQL撤回流问题详细场景描述下呢在 2020-09-27 11:48:36，"xiao cai" 写道： >Hi: >使用Flink SQL撤回流写入MySQL，表的auto_increment 越来越大是为什么，我的输出结果只有一条，mysql表里也只有一条数据，自增主键id的值一直为1，但是auto_increment却越来越大。求解答。

Flink SQL撤回流问题

2020-09-26 文章 xiao cai

Hi: 使用Flink SQL撤回流写入MySQL，表的auto_increment 越来越大是为什么，我的输出结果只有一条，mysql表里也只有一条数据，自增主键id的值一直为1，但是auto_increment却越来越大。求解答。

Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-25 文章 xiao cai

-ynm 是指定job name的 xiao cai 于2020年9月25日周五下午5:01写道： > hi zilong: > 通过process提交任务以后，通过rest > api，如何知道哪一个是我提交的呢？如果这时有多个请求过来同时都提交了任务，怎么知道rest返回的application应该与哪一次提交对应呢？ > > > 原始邮件 > 发件人: zilong xiao > 收件人: user-zh > 发送时间: 2020年9月25日(周五) 16:55 > 主题: Re: 怎么样在Flink中使用java代

Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-25 文章 xiao cai

hi zilong: 通过process提交任务以后，通过rest api，如何知道哪一个是我提交的呢？如果这时有多个请求过来同时都提交了任务，怎么知道rest返回的application应该与哪一次提交对应呢？原始邮件发件人: zilong xiao 收件人: user-zh 发送时间: 2020年9月25日(周五) 16:55 主题: Re: 怎么样在Flink中使用java代码提交job到yarn 我知道呀，你不是从输出里抠的嘛？你想要更优雅的方式可以用rest api啊，这些信息都是可以拿到的 xiao cai 于2020年9月25日周五下午4:53写道

Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-25 文章 xiao cai

hi zilong：你说的这些信息我目前都能拿到，已经实现了。只是实现的方式很不优雅，而且提交的速度很慢。原始邮件发件人: zilong xiao 收件人: user-zh 发送时间: 2020年9月25日(周五) 16:48 主题: Re: 怎么样在Flink中使用java代码提交job到yarn JobId是说Flink的JobId还是yarn上面的application ID呢？containerID可以通过yarn rest api拿到呀 xiao cai 于2020年9月25日周五下午4:43写道： > > 使用process没办法拿到当

Re: 怎么样在Flink中使用java代码提交job到yarn

2020-09-25 文章 xiao cai

成，希望对你有帮助，祝好~ xiao cai 于2020年9月25日周五下午4:23写道： > Hi all： > 大家好，我目前遇到一个flink 任务提交方面的困扰： > 想要在自己的项目中（springboot）提交flink > job到yarn上。目前采用的方式是process类在本地起进程，调用bin/flink来启动。这样不是很优雅，而且比较难获取到提交的jobId和containerId。看到网上有博客使用ClusterClient的方式来提交，但是遇到了classpath的问题，会缺失一些FLINK_HOME/lib下的jar包 > 所

怎么样在Flink中使用java代码提交job到yarn

2020-09-25 文章 xiao cai

Hi all：大家好，我目前遇到一个flink 任务提交方面的困扰：想要在自己的项目中（springboot）提交flink job到yarn上。目前采用的方式是process类在本地起进程，调用bin/flink来启动。这样不是很优雅，而且比较难获取到提交的jobId和containerId。看到网上有博客使用ClusterClient的方式来提交，但是遇到了classpath的问题，会缺失一些FLINK_HOME/lib下的jar包所以我想问，应该如何在自己的应用中提交任务到yarn，既能拿到任务信息，又可以解决classpath为指定带来的困扰。非常感谢 best,

Re: 如何在启动taskmanager时传入自定义的java参数

2020-09-15 文章 xiao cai

ture \ -yD taskmanager.network.netty.client.numThreads=2 \ -yD taskmanager.network.netty.server.numThreads=2 \ -c com.hstong.fintech.cep.main.SmartStareJob /data0/www/quant-cep.jar \ --profile daily --channalName smartStareChannal wch...@163.com 发件人： xiao cai 发送时间： 2020-09-15 17:46 收件人： user-zh

Re: 如何在启动taskmanager时传入自定义的java参数

2020-09-15 文章 xiao cai

解决了我的问题，非常感谢。原始邮件发件人: zilong xiao 收件人: user-zh 发送时间: 2020年9月15日(周二) 18:23 主题: Re: 如何在启动taskmanager时传入自定义的java参数可以在flink-conf.yaml里设置，例如： env.java.opts: -Djob.name={{job_name}} xiao cai 于2020年9月15日周二下午5:46写道： > Hi： > 我修改了flink的一些源码，需要通过外部-Dkey=value的形式动态将值传入，试了下无法直接通过bin/flink ru

如何在启动taskmanager时传入自定义的java参数

2020-09-15 文章 xiao cai

Hi：我修改了flink的一些源码，需要通过外部-Dkey=value的形式动态将值传入，试了下无法直接通过bin/flink run 后加-D的方式来添加，有什么好的办法吗？

FlinkSQL如何处理上游的表结构变更

2020-09-04 文章 xiao cai

Hi all: flink version : 1.11.0 场景：上游的数据来自binlog，当发生表结构变更时，希望能够实时的变动flink内部表的schema，但是目前来看，表的schema都是create table时写死的，有什么办法可以处理这种场景呢

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 文章 xiao cai

过程中发现，该参数只能删除jobmanager对应的metrics group，不能删除tm的。我们开启了randomJobNameSuffix，该参数会让JM和TM的metrics信息分属不同metrics group。感觉这可能是一个bug? xiao cai 于2020年9月1日周二下午4:57写道： > Hi: > 可以试试在flink-conf.yaml中添加： > metrics.reporter.promgateway.deleteOnShutdown: true > > > Best, > Xiao > 原

回复：关于FlinkSQL的窗口和触发

2020-09-01 文章 xiao cai

Hi: 可以试试增加如下配置： table.exec.emit.early-fire.enabled = true table.exec.emit.early-fire.delay = 1 Best, Xiao 原始邮件发件人: Cayden chen<1193216...@qq.com> 收件人: user-zh 发送时间: 2020年9月1日(周二) 17:10 主题: 回复：关于FlinkSQL的窗口和触发 hi，目前不支持。sql语义只支持窗口结束触发计算 --原始邮件-- 发件人:

Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据

2020-09-01 文章 xiao cai

Hi: 可以试试在flink-conf.yaml中添加： metrics.reporter.promgateway.deleteOnShutdown: true Best, Xiao 原始邮件发件人: bradyMk 收件人: user-zh 发送时间: 2020年9月1日(周二) 16:50 主题: Re: 回复：flink1.9.1采用Prometheus Pushgateway监控，当任务被kill掉，但grafana还是可以监控到数据您好，我不是很懂您的意思，例如我这边有一个这样的指标：flink_jobmanager_job_uptime 监控一个任务的运行时长；

Re: 答复: Flink on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件

2020-08-24 文章 xiao cai

Hi 确实可以稳定复现，failover后就会出现找不到lib包中的jar文件里的class文件，只能重启。不过我是cli模式启动的on-yarn，没有试过per-job和application，计划这两天尝试下application指定jar包地址到hdfs上，看是否能够复现。 Best, xiao cai 原始邮件发件人: Congxian Qiu 收件人: user-zh 发送时间: 2020年8月24日(周一) 20:39 主题: Re: 答复: Flink on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件 Hi 理论上第

DDL中声明主键会报类型不匹配

2020-08-20 文章 xiao cai

Hi： flink版本1.11.0 connector为kafka DDL中声明某个字段为primary key时，会报类型不匹配，去掉primary key constraint就可以正常执行。把shop_id设置为 varchar not null也不行。 org.apache.flink.table.api.ValidationException: Type STRING NOT NULL of table field 'shop_id' does not match with the physical type STRING of the 'shop_id' field

回复：答复: Flink on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件

2020-08-20 文章 xiao cai

Hi：感谢答复，确实是个思路。不过个人感觉能够在启动第一个container的时候，将本地的lib中的jar文件上传到hdfs中，然后后续的failover的container能够统一从hdfs中获取，这样应该就不会有这个问题了。貌似社区在1.11版本针对jar的拷贝做了优化，我还在看这方面的内容。有进展再交流。 Best, xiao cai 原始邮件发件人: 范超收件人: user-zh@flink.apache.org 发送时间: 2020年8月20日(周四) 09:11 主题: 答复: Flink on Yarn 启动任务，任务重启后貌似taskmanager中会

回复： flinkSQL eventtime问题

2020-08-19 文章 xiao cai

Hi: create table kafka ( nested_field Row(event_time timestamp(3), other_field string), watermark for nested_field.event_time as {watermark_definition} ) with ( ‘connector' = ‘kafka' ) 看看这样能够使用 Best, xiao cai 原始邮件发件人: ★猛★ 收件人: user-zh 发送时间: 2020年8月19日(周三) 17:48 主题: 回复： flinkSQL eventtime问题

Re: Flink on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件

2020-08-18 文章 xiao cai

Hi Flink版本是 1.11.0 期望的行为是将kafka中的数据实时写入hbase表 xxx这个class是在lib下的某个jar中的任务初始运行都是正常的，jar包也是可以找到的，运行期间失败了，然后进入了restarting状态，就不停的在running和restarting状态切换我提交任务的节点是20，然后container运行的节点是22，lib中的jar都在20节点上，所以猜测是任务运行过程中，重新分配新的container时丢失了lib中jar资源。 Best, xiao cai 原始邮件发件人: Congxian Qiu 收件人: user-zh

Flink on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件

2020-08-18 文章 xiao cai

如题：link on Yarn 启动任务，任务重启后貌似taskmanager中会丢失lib中的jar文件我的任务时kafka source -> hbase sink 任务申请到新的container后，启动任务时会丢失原本存在的class文件，怀疑是重新申请的container中没有获取到lib中的资源，是否应该将lib中资源放到hdfs？该如何配置。 Best xiao cai 错误堆栈： 2020-08-19 11:23:08,099 INFO org.apache.flink.yarn.YarnResourceMana

Re: Print SQL connector无法正常使用

2020-08-17 文章 xiao cai

Hi china_tao: 你好，HBase肯定没有问题的，请问你可以正常使用print connector吗，能否让我看看正确的使用姿势，感谢原始邮件发件人: china_tao 收件人: user-zh 发送时间: 2020年8月17日(周一) 23:00 主题: Re: Print SQL connector无法正常使用 String createHbaseSql = CREATE TABLE dimension ( rowKey STRING, cf ROW, tas BIGINT ) WITH ( 'connector.type' = 'hbase',

Print SQL connector无法正常使用

2020-08-16 文章 xiao cai

Hi All: 目前使用flink sql的Print SQL connector，想要将查询的结果打印出来，结果报错： Caused by: org.apache.flink.table.api.NoMatchingTableFactoryException: Could not find a suitable table factory for 'org.apache.flink.table.factories.TableSinkFactory' in the classpath.

答复: HBase Sink报错：UpsertStreamTableSink requires that Table has a full primary keys

2020-08-14 文章 xiao cai

Hi Jark: 感谢回答，我发现是我join的时候，是想将hbase作为维表使用的，但是我遗漏了for system_time as of语句，添加后就不会再报这个错了。另外有个问题想请教：1.11中新版hbase connector只是指with中指定version为1.4所创建的表吗，我发现使用1.4.3的版本，也是可以正常使用的。是不是说明pk在1.4和1.4.3两个版本上都是生效的？再次感谢。 Best Xiao Cai 发送自 Windows 10 版邮件应用发件人: Jark Wu 发送时间: 2020年8月14日 23:23 收件人

HBase Sink报错：UpsertStreamTableSink requires that Table has a full primary keys

2020-08-13 文章 xiao cai

Hi All: 使用flink-sql写入hbase sink时报错： UpsertStreamTableSink requires that Table has a full primary keys if it is updated. 我共创建了4张表，1张kafka source表，3张hbase 维表，1张hbase sink表 kafka source表与hbase 维表left join后的结果insert到hbase sink表中： sql如下： create table user_click_source( `id` bigint, `name` varchar,

Re: 使用Kafka Sink时报错：AppendStreamTableSink doesn't support consuming update changes

2020-08-12 文章 xiao cai

AppendStreamTableSink，所以不能处理社区已经有一个issue在处理这个问题了，应该1.12能提供这个功能。 Best Leonard [1]https://issues.apache.org/jira/browse/FLINK-18826 <">https://issues.apache.org/jira/browse/FLINK-18826> > 在 2020年8月12日，15:58，xiao cai 写道： > > Hi Jark: > 版本：1.11.0 > 问题：flink-sql，数据经过group by 和le

使用Kafka Sink时报错：AppendStreamTableSink doesn't support consuming update changes

2020-08-12 文章 xiao cai

', ) insert into kafka_table_2(shop_id, user_id, category_id, ts, row_time, proc_time) select shop_id, age, area from kafka_table_1 left join hbase_table for system_time as of kafka_table_1.proc_time as temp on kafka_table_1.shop_id = temp.rowKey group by shop_id, age, area 原始邮件发件人: xiao cai 收件人

AppendStreamTableSink doesn't support consuming update changes

2020-08-12 文章 xiao cai

Hi Jark：版本：1.11.0 问题：flink-sql，数据经过group by 和left join后写入kafka sink，会在语法校验阶段报错： AppendStreamTableSink doesn't support consuming update changes which is produced by node GroupAggregate

AppendStreamTableSink doesn't support consuming update changes

2020-08-12 文章 xiao cai

Hi Jark：版本：1.11.0 问题：flink-sql，数据经过group by 和left join后写入kafka sink，会在语法校验阶段报错：

Re: flink row 类型

2020-07-23 文章 xiao cai

Hi ，Dream 比如你最终拿到的是Row(10)，10表示有10个字段，这些字段的顺序是固定的，那么你可以把每个字段在row里的索引的映射关系保存下来，如下 map ，然后 row.getField(map.get(fieldName))获取你需要的值原始邮件发件人: Dream-底限收件人: user-zh 发送时间: 2020年7月23日(周四) 14:57 主题: Re: flink row 类型 hi、xiao cai 可以说一下思路吗，我没太懂》》可以考虑把字段索引值保存下来再获取 Dream-底限于2020年7月23日周四下午2:56写道

Re: flink row 类型

2020-07-23 文章 xiao cai

可以考虑把字段索引值保存下来再获取原始邮件发件人: Dream-底限收件人: user-zh 发送时间: 2020年7月23日(周四) 14:08 主题: Re: flink row 类型 hi 是的，我们的数据场景比较尴尬，那我想其他方式实现一下 Benchao Li 于2020年7月23日周四下午12:55写道： > 这个应该是做不到的。name只是SQL plan过程的东西，在运行时它就没有什么实际意义了。 > 你是想在udf里面获取row里面每个字段的名字是吧？如果是的话，我理解现在应该是做不到的。 > > Dream-底限于2020年7月22日周三

Re:回复：flink1.11 set yarn slots failed

2020-07-16 文章 xiao cai

可以看这里https://ci.apache.org/projects/flink/flink-docs-stable/ops/config.html 原始邮件发件人: Zhou Zach 收件人: user-zh 发送时间: 2020年7月16日(周四) 15:28 主题: Re:回复：flink1.11 set yarn slots failed -D前缀好使，要设置yarn name用什么参数啊，1.11官网的文档有些都不好使了在 2020-07-16 15:03:14，"flinkcx" 写道：

Re:回复：flink1.11 set yarn slots failed

2020-07-16 文章 xiao cai

可以看这里原始邮件发件人: Zhou Zach 收件人: user-zh 发送时间: 2020年7月16日(周四) 15:28 主题: Re:回复：flink1.11 set yarn slots failed -D前缀好使，要设置yarn name用什么参数啊，1.11官网的文档有些都不好使了在 2020-07-16 15:03:14，"flinkcx" 写道： >是不是应该用-D作为前缀来设置,比如-Dtaskmanager.numberOfTaskSlots=4 > > > 原始邮件 >发件人: Zhou Zach >收件人: Flink user-zh

59 matches

Mail list logo