from:"HunterXHunter"

Re: flinksql ttl不生效

2021-06-09 Thread HunterXHunter

建议关闭state.backend.incremental ，因为我遇到过，开启增量ckp导致ckp一直增大，关掉就正常了 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 【问题分析】Fink任务无限反压

2021-06-07 Thread HunterXHunter

掐头去尾的提问，完全不知道是什么问题，没法回答你，最好是贴出代码，贴出图片等大家才能帮忙分析 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink checkpoint 速度很慢问题排查

2021-06-03 Thread HunterXHunter

一般是 Job A出现背压了，checkpoint的时候是要等背压的数据都处理完了才会处理barrier。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink Sql 的/checkpoint/shared/文件夹大小不断增长，源数据没有数据激增，应该如何控制？

2021-06-01 Thread HunterXHunter

那会一直增大下去吗，我跑了4天，ckp一直变大，没有稳定的迹象。是不是我需要调整compaction的配置 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink Sql 的/checkpoint/shared/文件夹大小不断增长，源数据没有数据激增，应该如何控制？

2021-05-31 Thread HunterXHunter

我遇到过的问题就是开了增量checkpoint后，checkpoint会越来越大，关闭之后checkpoint就正常了 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink Sql 的/checkpoint/shared/文件夹大小不断增长，源数据没有数据激增，应该如何控制？

2021-05-31 Thread HunterXHunter

关闭增量checkpoint -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 维度表处理时间

2021-05-20 Thread HunterXHunter

使用cdc的方式读取 mysql的更新数据，使用connect流的方式连接两个流，这样可以避免掉watermark才能触发计算的问题。建议在事实表join不到数据的时候进行缓存用 onTime进行触发。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 请教，有哪些连接器能让我获得一个非 update/delete，但又有主键的流呢？

2021-05-18 Thread HunterXHunter

json格式改debezium-json试试 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink sql源表定义字段列表问题

2021-05-17 Thread HunterXHunter

不需要提供全部字段 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Re:flink sql怎样将change log stream转换成append log stream?

2021-05-17 Thread HunterXHunter

tableEnv.executeSql(DDLSourceSQLManager.cdcCreateTableSQL("order_info")); tableEnv .toRetractStream(tableEnv.from("order_info"), Row.class) .filter((FilterFunction>) booleanRowTuple2 -> booleanRowTuple2.f0) .map((MapFunction, Row>)

Re: Exception: Could not perform checkpoint

2021-05-17 Thread HunterXHunter

看源码是在 catch里面的（应该是在executeCheckpointing的时候报错了，但是catch里面还有一个nullpoint没catch导致程序退出）： if (LOG.isDebugEnabled()) { LOG.debug("{} - did NOT finish synchronous part of checkpoint {}. " + "Alignment duration:

Re: 关于union之后的keyBy问题

2021-05-16 Thread HunterXHunter

这部分没人报bug，所以社区一般是不会去验证的。所以你要给出你的代码，同时对问题描述尽量清晰，否则很难有人去自己写代码验证问题。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Table-api sql 预检查

2021-04-29 Thread HunterXHunter

tableEnv.explainSql(""); -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 背压问题

2021-04-28 Thread HunterXHunter

中间有错误数据或者其他错误原因，背压不会导致数据丢失 -- Sent from: http://apache-flink.147419.n8.nabble.com/

问题：flink 1.13编译 flink-parquet报错 -类重复：org.apache.flink.formats.parquet.generated.SimpleRecord

2021-04-26 Thread HunterXHunter

查看发现 org.apache.avro avro-maven-plugin ${avro.version} generate-sources

Re: DataStreamAPI 与flink sql疑问

2021-04-26 Thread HunterXHunter

你试过吗？ -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 疑问：当开启state.backend.incremental 后 Checkpointed Data Size 会不断变大

2021-04-22 Thread HunterXHunter

没解决，我只能把它关闭了 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 設置look up table source

2021-04-21 Thread HunterXHunter

理论上只要实现了LookupTableSource。你在 TableFunction 里面怎么重写 eval 都可以，不管你是要读取哪里的数据怎么读。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-21 Thread HunterXHunter

在ddl的时候设置了 watermark。在任务页面查看watermark的时候一直没有更新watermark -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 如果输入有回撤流的话，group by时间窗口会遇到GroupWindowAggregate doesn't support consuming update and delete changes

2021-04-19 Thread HunterXHunter

toAppendDataStream试试看 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 关于Flink SQL中Interval Join使用时watermark的疑惑

2021-04-15 Thread HunterXHunter

问题一： Interval Join doesn't support consuming update and delete changes是因为输入A或者B是一个更新流问题二：interval join使用buffer来缓存A和B的数据，没有放在state里，只有在watermark超过下边界会触发onEventtime清理 buffer。延迟问题：没有类似statettl的配置，interval join不受statettl控制清除状态乱序问题：如果 B的数据时间小于 watermark则匹配不到，一切是跟watermmark相关以上个人看源码理解的。希望有帮助 --

Re: Flink CEP事件查询，如何在flink运行中动态更新cep规则

2021-04-15 Thread HunterXHunter

可能需要修改源码： https://blog.csdn.net/young_0609/article/details/110407781 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-15 Thread HunterXHunter

但是用process-time是有数据的，目前用partition-time一直没成功写出过数据 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: Flink CEP 使用Keyby之后无法输出结果

2021-04-15 Thread HunterXHunter

这不是一个问题，是我理解的问题。感谢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 关于Flink SQL中Interval Join使用时watermark的疑惑

2021-04-15 Thread HunterXHunter

1： Interval Join doesn't support consuming update and delete changes 是因为A或B是一个update stream 2： Interval Join 的临时数据是放在buffer中，当wtm超过边界时间就会清理掉 buffer也就join不到了。所以 statettl无法控制A流的缓存数据。延迟问题：所以如果wtm不更新，A流的数据不会被清理因为不受statettl控制乱序问题：如果B流的旧时间小于 watermark就join不上以上是个人理解、、 -- Sent from:

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-04-15 Thread HunterXHunter

有人知道这个bug吗 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 分组滚动窗口无法触发计算，由于 watermark 没有被生成，或者被计算。

2021-04-12 Thread HunterXHunter

1.12默认是 eventtime不需要设置 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 求问Hive DDL TBLPROPERTIES不生效

2021-04-08 Thread HunterXHunter

你好, 1：我设置的时候就是使用的 partition-time 同时设定checkpoint间隔为60s。但是我发现watermark一直没有生成或者更新，导致我的数据一直无法commit。想知道为什么watermark无法生成。当时使用process-time是没问题的。 2：因为写hive的话会有小文件的问题。所以我使用file sink来设置合并文件和控制文件大小。但是写文件是无法写hive metastore。所以hive查不出数据。想知道有什么方法解决hive小文件问题，难道只能T+1做小文件合并吗。 -- Sent from:

Re: flink-sql 客户端采用execution.target: yarn-per-job 模式，如何指定提交的队列？？

2021-04-02 Thread HunterXHunter

flink run -yD yarn.application.queue=x -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-02 Thread HunterXHunter

重要: 在流模式下使用 FileSink 时需要启用 Checkpoint ，每次做 Checkpoint 时写入完成。如果 Checkpoint 被禁用，部分文件（part file）将永远处于 'in-progress' 或 'pending' 状态，下游系统无法安全地读取。在官方文档找到了这个，必须要有checkpoint才行，但是我手动savepoint之后，虽然有sucess文件，但是没有数据 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-01 Thread HunterXHunter

查看hdfs文件：分区一直是这样的一个文件，没有生成 _SUCCESS文件 .part-40a2c94d-0437-4666-8d43-31c908aaa02e-0-0.inprogress.73dcc10b-44f4-47e3-abac-0c14bd59f9c9 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-01 Thread HunterXHunter

你好，这个问题已经解决了。我现在通过官方例子： SET table.sql-dialect=default; create table flink_kafka( sys_time bigint, rt AS TO_TIMESTAMP(FROM_UNIXTIME(sys_time / 1000, '-MM-dd HH:mm:ss')), WATERMARK FOR rt AS rt - INTERVAL '5' SECOND ) WITH ( 'connector' = 'kafka', 'topic' = 'xx',

flink 1.12.2 sql-cli 写入Hive报错 is_generic

2021-04-01 Thread HunterXHunter

当配置好HiveCatalog后， SQL-Cli 也可以查到hive库表信息创建kafka表： create table test.test_kafka( word VARCHAR ) WITH ( 'connector' = 'kafka', 'topic' = 'xx', 'scan.startup.mode' = 'latest-offset', 'properties.bootstrap.servers' = 'xx', 'properties.group.id' = 'test', 'format' = 'json',

Re: Flink1.11如何实现Tumble Window后基于event time倒序取第一条作统计

2021-03-17 Thread HunterXHunter

GroupWindowAggregate不支持update或者delete的datasource。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: interval join 如何用 process time

2021-03-17 Thread HunterXHunter

你不定义watermark好像用的就是pro time -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 提交两个SQL任务，其中一个不生效。

2021-03-11 Thread HunterXHunter

StatementSet inserts = tableEnv.createStatementSet(); inserts.addInsertSql("insert into xxx select * from xxx") // topic1 -》topic2任务 inserts.addInsertSql("insert into xxx select * from xxx") // topic2 -》Postgre 任务 inserts.execute(); -- Sent from: http://apache-flink.147419.n8.nabble.com/

疑问：当开启state.backend.incremental 后 Checkpointed Data Size 会不断变大

2021-03-11 Thread HunterXHunter

1：当开启state.backend.incremental 后 Checkpointed Data Size 会不断变大我10分钟一次checkpoint，每次都增大2M，两天增大到400M，但其实我的实际应该只有20M（只做一个窗口计算）（我做savepoint之后也才20M）。已设置了 ttl。 2：当我关闭state.backend.incremental 后。每次checkpoint也就20M左右，不会变大了。按我的理解：state.backend.incremental 开启后，Checkpointed Data

Re: flink sql如何从远程加载jar包中的udf

2021-03-10 Thread HunterXHunter

通过 createTemporarySystemFunction 试试看呢 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 如何定义时态表

2021-03-10 Thread HunterXHunter

把格式调整下，很乱看不明白 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-10 Thread HunterXHunter

试了 1.12.2，还是一样问题。 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-10 Thread HunterXHunter

但是看情况好像是只有在：DataStream发生Keyby或者 setParallelism的时候才会发生 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-10 Thread HunterXHunter

1.12.1 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-09 Thread HunterXHunter

再试了一下：修改并行度也不行 .setParallelism(9) -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-09 Thread HunterXHunter

经过再一次验证：即使我做group by rowtime的操作，我对datastream做keyby(rowtime) 也有这个问题例如： tableEnv.createTemporaryView("test3", tableEnv.sqlQuery("select msg,rowtime from test ")); SingleOutputStreamOperator r = tableEnv.toRetractStream(tableEnv.from("test3"), Row.class) .filter(x -> x.f0) .keyby(_.f1)

Re: Flink Job 如何集成到自己的系统，方便管理

2021-03-09 Thread HunterXHunter

https://github.com/zhp8341/flink-streaming-platform-web 这个你可以参考下 -- Sent from: http://apache-flink.147419.n8.nabble.com/

BUG ：DataStream 转 Table 后无法触发窗口计算

2021-03-08 Thread HunterXHunter

1：当DataStream是由一个table 经过 group by rowtime 转换过来的就无法触发窗口例如： tableEnv.createTemporaryView("test3", tableEnv.sqlQuery("select msg,rowtime from test group by msg,rowtime")); // 获得 DataStream，并定义wtm生成 SingleOutputStreamOperator r = tableEnv.toRetractStream(tableEnv.from("test3"), Row.class)

Re: flink sql中如何使用异步io关联维表？

2021-03-03 Thread HunterXHunter

定义一个 sourcetable -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: UDF 重复调用的问题、

2021-03-02 Thread HunterXHunter

为什么4次是没问题的，感觉只执行一次才是最优的 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: 关于flink窗口state

2021-02-07 Thread HunterXHunter

你这代码贴的乱七八糟。。。你需要再richjoinfunction里面设置valuestate的生命周期，他不随着窗口而销毁，窗口只会销毁自己设定的state，有空你可以看看window的源码，里面有清理state的逻辑 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: getCurrentWatermark

2021-02-04 Thread HunterXHunter

currentMaxTimestamp 只是当前数据流里面最大，但不一定是全部的最大。当数据出现延迟，或者多流的情况下，lastEmittedWatermark 不一定会比 currentMaxTimestamp 小 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink sql

2021-02-04 Thread HunterXHunter

我做了。。添加了一个sql语法类似 "select " + "msg," + "count(1) cnt" + " from test" + " where msg = 'hello' " + " group by TUMBLE(rowtime, INTERVAL '30' SECOND), msg " + " EMIT \n" + " WITH

Re: StreamAPi Window 在使用 .evictor(TimeEvictor.of(Time.seconds(0))).sum().print 报NullPoint

2021-02-04 Thread HunterXHunter

我认为这可能是一个bug （当然也可能是故意这样设计的）：在 EvictingWindowOperator.emitWindowContents()位置： userFunction.process(triggerContext.key, triggerContext.window, processContext, projectedContents, timestampedCollector); 当timestampedCollector的size = 0时；执行到 ReduceApplyWindowFunction部分： public void apply(K k, W

StreamAPi Window 在使用 .evictor(TimeEvictor.of(Time.seconds(0))).sum().print 报NullPoint

2021-02-03 Thread HunterXHunter

代码如下： evictor设置的在窗口触发前清理所有数据，按理进入sum是没有数据，但是调试的时候发现，sum经过计算会输出 null 进入 print，导致报 Nullpoint。不知道是bug还是我的问题； class A { String word; Long time; public A(String word, Long time) { this.word = word; this.time = time; }

Re: Flink window evictor(TimeEvictor.of(Time.seconds(0))) 会出现 NullPoint问题

2021-02-03 Thread HunterXHunter

代码如下： stream .keyBy((KeySelector, String>) o -> o.f0) .window(TumblingEventTimeWindows.of(Time.seconds(100))) .trigger(ContinuousProcessingTimeTrigger.of(Time.seconds(2))) .evictor(TimeEvictor.of(Time.seconds(0))) .sum(1) .print(); 当数据在窗口计算前被全部清除时，sum结果会是一个null，会传入print，导致 nullpoint -- Sent

Flink window evictor(TimeEvictor.of(Time.seconds(0))) 会出现 NullPoint问题

2021-02-03 Thread HunterXHunter

当程序使用 evictor(TimeEvictor.of(Time.seconds(0))) 来清除窗口触发前数据时，当数据全部被清除了，在print时会报Null point Caused by: java.lang.NullPointerException at org.apache.flink.api.common.functions.util.PrintSinkOutputWriter.write(PrintSinkOutputWriter.java:73) at

Re: Flink SQL kafka connector有办法获取到partition、offset信息嘛？

2021-01-20 Thread HunterXHunter

CREATE TABLE KafkaTable ( `event_time` TIMESTAMP(3) METADATA FROM 'timestamp', `partition` BIGINT METADATA VIRTUAL, `offset` BIGINT METADATA VIRTUAL, `user_id` BIGINT, `item_id` BIGINT, `behavior` STRING ) WITH ( 'connector' = 'kafka', 'topic' = 'user_behavior',

Flink ddl sql 在 Test和在Main里面执行结果不同

2021-01-20 Thread HunterXHunter

同一段代码，在main里面可以正常正常，在Test里面却直接结束 StreamExecutionEnvironment bsEnv = StreamExecutionEnvironment.getExecutionEnvironment(); EnvironmentSettings bsSettings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build(); StreamTableEnvironment bsTableEnv =

Flink CEP 使用Keyby之后无法输出结果

2021-01-13 Thread HunterXHunter

Pattern.begin("start") .where(new SimpleCondition() { @Override public boolean filter(KafkaTopicOffsetTimeMsg kafkaTopicOffsetTimeMsg) throws Exception { return

Re: flink sql es写入时，用户名密码认证不支持

2020-12-16 Thread HunterXHunter

是的，需要上传certificate文件，1.12好像没有上传文件的配置 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Re: flink sql es写入时，用户名密码认证不支持

2020-11-30 Thread HunterXHunter

你说的是es的 xpack 认证吗，需要你载入certificate文件是吗 -- Sent from: http://apache-flink.147419.n8.nabble.com/

Flink 1.11 table.executeInsert 程序退出

2020-09-29 Thread HunterXHunter

当我在使用 StreamTableEnvironment Api的时候； Table a = getStreamTable(getKafkaDataStream("test", "localhost:9092", "latest"),"topic,offset,msg"); tableEnv.createTemporaryView("test", a); tableEnv.executeSql(DDLSourceSQLManager.createCustomPrintlnRetractSinkTbl("printlnSink_retract"));

61 matches

Mail list logo