非常感谢张老师的回复,今天集群有切换master,之后,出现这个问题,我用jstack检查下是否有快照相关的线程卡住
张铎(Duo Zhang) <palomino...@gmail.com> 于2023年3月27日周一 21:22写道: > 那个日志的意思是有 snapshot 正在执行,所以不会跑 cleaner。可以查一下是否有正在执行的 snapshot 操作卡住了之类的 > > leojie <leo...@apache.org> 于2023年3月27日周一 20:53写道: > > > hi all, > > > > > 向社区求助一个HBase的情况,情况描述如下:在我们快照scan的场景中,有些大表会较为频繁的做快照(如天级),但是这些快照元数据删除后,快照引用的hfile貌似未清理,这体现在,我们的集群archive目录空间占用嗖嗖往上涨。hmaster中,只找到如下貌似相关的日志: > > [image: image.png] > > 2023-03-27 13:07:10,939 WARN [dir-scan-pool4-thread-5] > > snapshot.SnapshotFileCache: Not checking unreferenced files since > snapshot > > is running, it will skip to clean the HFiles this time > > 除此之外无有用日志。 > > 当我们切换HMaster服务后,清理线程貌似又开始工作了,archive目录空间占用会被大量释放,这在我们集群容量监控指标上体现的非常明显。 > > 我们使用的hbase版本是2.2.6,求助社区出现这样的情况可能是什么原因,是否有相似的PR可以供这个版本使用,非常感谢 > > >