Re:flink sql jdbc connector是否支持多流拼接?

2023-03-02 文章
这种情况下有两种方式可以处理 1> 注册表-使用join方式直接拼接成大宽表写入 2> 每个任务-直接写入下游数据 ,每个任务只更新自己的字段即可(因为主键相同) 在 2023-03-02 20:59:59,"casel.chen" 写道: >flink sql jdbc connector是否支持多流拼接? >业务上存在基于主键打宽场景,即多个流有相同的主键字段,除此之前其他字段没有重叠,现在想打成一张大宽表写入mysql/oracle这些关系数据库。 >每条流更新大宽表的一部分字段。

Pyflink提交

2022-11-25 文章
在使用pyflink提交任务时,部署模式onyarn 1 在不使用Map等算子下如下参数 能够提交成功 并且运行 .flink run -ynm pytest -m yarn-cluster -pyclientexec ***/python3 -pyexec ***/python3 -pyarch *** /python3.6.8.zip -py demo.py 2 在使用到map算子时 提交没有问题,但是运行报错,报错日志如下: .flink run -ynm pytest -m yarn-cluster -pyclientexec

Re:Re: pyflink1.11.1连接hive问题

2020-09-03 文章
pi.python.shaded.py4j.commands.CallCommand.execute(CallCommand.java:79) at org.apache.flink.api.python.shaded.py4j.GatewayConnection.run(GatewayConnection.java:238) at java.lang.Thread.run(Thread.java:748) 在 2020-09-03 16:15:30,"Dian Fu" 写道: >有更完整的log吗? > >> 在 2020年9月

pyflink1.11.1连接hive问题

2020-09-03 文章
使用hivecatalog连接 抱一下错误 flink py4j.protocol.Py4JJavaError: An error occurred while calling o10.registerCatalog. : java.lang.NullPointerException

Re:无法从checkpoint中恢复state

2020-09-03 文章
再启动服务的时候 需要指定checkpoint回复地址,你这里只是指定了做checkpint地址 在 2020-09-03 16:03:41,"sun" <1392427...@qq.com> 写道: >你好,我有2个问题 > >1:每次重启服务,checkpoint的目录中chk- 总是从chk-1开始,chk-2 ,没有从上次的编号开始 > >2:重启服务后,没有从checkpoint中恢复state的数据 > >下面是我的配置,我是在本地调试的,单机 > > > >final StreamExecutionEnvironment

Re:Re: Re: Re: 回复:flink1.10 checkpoint 运行一段时间空指针异常

2020-07-19 文章
ok 我过两天试一下 最近有点忙 过两天测试一下1.11 到时候结果同步给大家 ,另外之前测试jdk使用jdk1.8.0_231 也是不行的 会报同样的错误 在 2020-07-13 20:06:01,"Congxian Qiu" 写道: >Hi 程龙 > >如果可以的话,也麻烦使用 1.11.0 测试下看问题是否还存在。 > >Best, >Congxian > > >程龙 <13162790...@163.com> 于2020年7月13日周一 上午10:

Re:Re: Re: flink on yarn日志问题

2020-07-14 文章
> 1. >> > > >> 我验证了一下,如果开启了日志收集,那tm的日志是会保存的,但是你整个application结束前可能看不到,有一个trick的方法,首先在jm日志中找到tm分配到了哪个NodeManager上,通过拼接url的方式来获取container的日志 >> > > 2. 你是否需要调整一下重启策略[1]? 如果开启了ck,默认情况下就会一直尝试重启job >> > > >> > > [1] >> > > >> http

flink on yarn日志问题

2020-07-12 文章
请问一下两个问题 1 flink on yarn的时候 taskmanager 挂掉的时候 上面的日志会被删除掉 无法查看 ,除了使用es收集日志的这种方案, 还有没有可以使taskmanager 挂掉,相关日志仍然可以保留。 2 flink on yarn模式 当由于错误导致taskmanager 挂掉,但是jobmanager 却一直存在, 有没有好的方式或者策略 , 可以是当task失败 达到重试次数之后 taskmanager挂掉,jobmanager也挂掉

Re:Re: Re: 回复:flink1.10 checkpoint 运行一段时间空指针异常

2020-07-12 文章
>> >> >> -- >> Best, yuchuan >> >> >> >> 在 2020-07-06 14:04:58,"Congxian Qiu" 写道: >> >@陈凯 感谢你分享的这个方法,比较好奇这两个的区别是什么?修改后的 patch 在 closure 中一开始 copy 了一份 >> >CheckpointMeta,也就是说 845 - 867 行之间,之前的 checkpointMeta 会变为 null

Re:回复:flink1.10 checkpoint 运行一段时间空指针异常

2020-07-01 文章
都是分配不到资源(slot)的错误,应该还是checkpoint 为空导致的,不知道为啥为空 在 2020-07-01 20:51:34,"JasonLee" <17610775...@163.com> 写道: >你到具体的tm上找到相关的operator看看是不是有异常信息 > > >| | >JasonLee >| >| >邮箱:17610775...@163.com >| > >Signature is customized by Netease Mai

flink1.10 checkpoint 运行一段时间空指针异常

2020-07-01 文章
flink1.10上 程序运行几个小时后就会报不能执行checkpoint 空指针异常 具体如下: java.lang.Exception: Could not perform checkpoint 3201 for operator Filter -> Map (2/8). at org.apache.flink.streaming.runtime.tasks.StreamTask.triggerCheckpointOnBarrier(StreamTask.java:816) at

Re:flink open 时候 transient使用问问题

2020-06-23 文章
1 首先transient 是对修饰的变量不进行序列化 2 你使用transient的目的需要明确 使用来干啥的 3 状态都是可以读取并且使用的 不进行序列化 在 2020-06-24 11:37:09,"kcz" <573693...@qq.com> 写道: >请教大佬一个代码问题,当在open初始化一些mysql的client或者 >初始化state时候,用了transient是不是会对代码有优化作用,这里不是太理解。

Re:flink任务失败重启时, flink last checkpoint 失败但任务仍然正常重启,导致 state 重启前后不一致

2020-06-23 文章
可以自己改一下源码中的消费者 判断偏移量 ,如果是原先的正常启动 如果不是则不进行启动 在 2020-06-22 20:09:11,"莫失莫忘" 写道: >如题,可以要求flink失败重启时 必须正常从checkpoint恢复,否则就重启失败吗?

Re:Flink 1.10中是否有接口或方法获取批任务执行进度

2020-06-23 文章
可以试试自定义listener 在 2020-06-24 09:12:05,"faaron zheng" 写道: >Flink 1.10中是否有接口或方法获取批任务执行进度,百分比? faaron zheng 邮箱:faaronzh...@gmail.com 签名由 >网易邮箱大师 定制

Re:Re: flink 通过 --classpath 传入https-xxx.xxx.jar 在1.8上正常运行 在flink1.10 就会报传入的jar包找不到

2020-06-23 文章
java.net.URLClassLoader}. > > >--classpath这个参数需要提前将jar部署在各个节点上或者使用NFS,确认jar是存在的吗 > > >Best, >Yang > >程龙 <13162790...@163.com> 于2020年6月22日周一 上午11:43写道: > >> 2020-06-22 10:16:34,379 INFO >> org.apache.flink.runtime.executiongraph.Executio

Re:Re:flink 通过 --classpath 传入https-xxx.xxx.jar 在1.8上正常运行 在flink1.10 就会报传入的jar包找不到

2020-06-23 文章
嗯 确认都能访问 使用http的方式 在 2020-06-23 10:04:55,"Weixubin" <18925434...@163.com> 写道: >和版本应该没什么关系。如果是多节点部署的情况下,-C 所指定的URL 需要各个节点都能访问得到。 确认下该URL能被所有节点访问到吗 > Best, > Bin > > > > > > > > > > > > > > >At 2020-06-22 11:4

Re:在线数据质量

2020-06-21 文章
一般都会的 在 2020-06-22 10:52:17,"wangxiangyan" 写道: >hi,大家的在线任务会在晚上重跑一次做校正吗?

Re:Re: 【Flink在sink端的Exactly once语义】

2020-06-21 文章
需要自己实现比如幂等操作 比如通过表示为操作 在 2020-06-22 10:04:43,"Benchao Li" 写道: >看起来现在只有Kafka实现了TwoPhaseCommitSinkFunction,所以目前应该也只有Kafka支持exactly once。 > >不过像Mysql、ES这种,可以根据主键来更新的,只要能做到at least once应该就可以了。 > >忝忝向仧 <153488...@qq.com> 于2020年6月21日周日 下午11:27写道: > >> Hi,all: >> >> >>

flink 通过 --classpath 传入https-xxx.xxx.jar 在1.8上正常运行 在flink1.10 就会报传入的jar包找不到

2020-06-21 文章
2020-06-22 10:16:34,379 INFO org.apache.flink.runtime.executiongraph.ExecutionGraph- Sink: Unnamed (6/6) (5dd98ec92e0d5e53597cb7520643c7f5) switched from SCHEDULED to DEPLOYING. 2020-06-22 10:16:34,379 INFO org.apache.flink.runtime.executiongraph.ExecutionGraph- Deploying

Re:re:提交flink代码 无法创建taskmanager flink web界面一致停留在created状态 ,日志报错如下

2020-05-30 文章
是用代码提交的jobmanager 是可以加载的 就是启动taskmanager 这个目录就没有创建, 界面如下 ,错误日志就是我下面贴出来的那个 在 2020-05-30 19:16:57,"462329521" <462329...@qq.com> 写道: >你的提交命令是什么呢看样子是加载不到配置文件 > > >-- 原始邮件 -- >发件人: "程龙"<13162790...@163.com; &

提交flink代码 无法创建taskmanager flink web界面一致停留在created状态 ,日志报错如下

2020-05-30 文章
2020-05-30 19:07:31,418 INFO org.apache.flink.yarn.YarnTaskExecutorRunner - 2020-05-30 19:07:31,418 INFO org.apache.flink.yarn.YarnTaskExecutorRunner - Registered UNIX signal

Re:flink 访问hadoop集群问题

2020-05-29 文章
下面的代码是你本地运行的是吗 如果是本地需要最简单的方式 就是把hdfs-site.xml 和core-site.xml 配置文件放到资源目录下 在 2020-05-29 15:06:21,"了不起的盖茨比" <573693...@qq.com> 写道: >请教大家一个问题 , >hadoop服务TestHACluster,可是我用api访问时候,填写了path >hdfs://TestHACluster/user/flink/test >就会去访问TestHACluster:8020, 但是我是没有那个端口的,针对这种情况怎么处理下。

Re:flink写入hbase 报错如下 还会导致反压 任务变慢

2020-05-28 文章
这不是flink的问题,之前遇到过相关问题 hbase region分裂的时候 会出现此类问题 你可以看看日志是否hbase region当时正在分裂, 在 2020-05-28 16:57:35,"air23" 写道: 2020-05-28 16:54:23,867 INFO org.apache.hadoop.hbase.client.AsyncRequestFutureImpl - id=2, table=GC_SCHEM:mon1, attempt=7/16, failureCount=427ops, last

Re:Re: flink-sql watermark问题

2020-05-28 文章
可以先在之前对于long类型的字段转换成Timestmap 类型 再生成watermark 在 2020-05-28 17:00:53,"Benchao Li" 写道: >Hi, > >没太看明白你的问题是什么。目前的确是只支持Timestmap(3)作为事件时间列。 >之所以还不支持long作为事件时间列,主要考虑的是时区问题。但是这个社区也在考虑,可以参考[1] > >[1] https://issues.apache.org/jira/browse/FLINK-16938 > >guaishushu1...@163.com