度还有就是调大
state.backend.fs.memory-threshold
参数(默认值是1KB,最大值是1MB),但是这个参数会有一个副作用,可能需要同时调大jobmanager的heap大小。
祝好
唐云
From: 陈冬林 <874269...@qq.com>
Sent: Friday, July 19, 2019 9:45
To: user-zh@flink.apache.org
Subject: Re: checkpoint 文件夹Chk-no 下面文件个数是能
checkpoint间隔实在太小了。
祝好
唐云
From: 陈冬林 <874269...@qq.com>
Sent: Thursday, July 18, 2019 17:49
To: user-zh@flink.apache.org
Cc: myas...@live.com
Subject: Fwd: checkpoint 文件夹Chk-no 下面文件个数是能计算出来的吗?
唐云老师您好;
基于hdfs的backend 可以优化checkpoint小文件的数量吗?减少namenode压力吗?
现状是会影响namenode
好的,非常感谢您的解答。
> 下面是被转发的邮件:
>
> 发件人: Yun Tang
> 主题: 回复: checkpoint 文件夹Chk-no 下面文件个数是能计算出来的吗?
> 日期: 2019年7月18日 GMT+8 下午4:06:59
> 收件人: "user-zh@flink.apache.org"
> 回复-收件人: user-zh@flink.apache.org
>
> Hi
>
> 源码部分可以参考[1] DefaultOperatorStat
com>
Sent: Thursday, July 18, 2019 15:34
To: user-zh@flink.apache.org
Subject: Fwd: checkpoint 文件夹Chk-no 下面文件个数是能计算出来的吗?
谢谢您的解答,
那些文件的数量是只和operator的并行度相关吗?是不是还有key 的个数等相关?有没有具体的公式呢?我没有在源码里找到这块的逻辑
还有一个最重要的问题,这些文件即然不能合并,state小文件合并指的是那些文件呢?
祝安
Andrew
> 下面是被转发的邮件:
>
> 发件
谢谢您的解答,
那些文件的数量是只和operator的并行度相关吗?是不是还有key 的个数等相关?有没有具体的公式呢?我没有在源码里找到这块的逻辑
还有一个最重要的问题,这些文件即然不能合并,state小文件合并指的是那些文件呢?
祝安
Andrew
> 下面是被转发的邮件:
>
> 发件人: Yun Tang
> 主题: 回复: checkpoint 文件夹Chk-no 下面文件个数是能计算出来的吗?
> 日期: 2019年7月18日 GMT+8 下午3:24:57
> 收件人: "u
uly 18, 2019 15:21
To: user-zh@flink.apache.org
Subject: checkpoint 文件夹Chk-no 下面文件个数是能计算出来的吗?
[cid:A90251C2-5DED-42D9-AA11-8D9314A2F1B9@360buyAD.local]
state_checkpoints_dir/2d93ffacbddcf363b960317816566552/chk-2903/1e95606a-8f70-4876-ad6f-95e5cc38af86
state_checkpoints_dir/2d93ffacbddcf363b960317816
state_checkpoints_dir/2d93ffacbddcf363b960317816566552/chk-2903/1e95606a-8f70-4876-ad6f-95e5cc38af86
state_checkpoints_dir/2d93ffacbddcf363b960317816566552/chk-2903/2a012214-734a-4c2b-804b-d96f4f3dddf8