HI, Px New

1. Checkpoint 保存数量可以通过参数: state.checkpoints.num-retained 来控制,默认是 1
2. _metadata 只是一些元数据,保存了state 的句柄,其他文件是 state 数据,由各 Task 在触发 checkpoint 
的时候上传。相反在恢复 checkpoint 的时候JM 读取_metadata 将相应句柄下发到 Task,Task 通过远端 HDFS 拉取对应的 
state。


Best
Weihua Hu

> 2020年6月5日 13:36,Px New <[email protected]> 写道:
> 
> Hi everyOne 有一个关于CheckPoint相关的一个问题:
> 1.我在项目中使用的状态后端为:Fsstatebackend
> 2.我在jobManager的log输出找到相应的job ID后 去对应的HDFS 找到了对应的chk目录
> 3.但我有两个疑问: 
> 3.1.没有设置 chk的存储数默认是多保留多少份呢(我这边看到保留了近20次的chk)?
> 3.2 当我点进具体的chk-id 后 发现有很多文件[见2图] 我清楚的是当任务发生异常后tesk 会从hdfs 将_metadata 
> 下载后进行任务恢复操作的,那其他的哪些文件是如何产生的?以及有什么作用呢?
> 期待回复:😀😀
> 
> 
> 

回复