This is an automated email from the ASF dual-hosted git repository. wangdan pushed a commit to branch master in repository https://gitbox.apache.org/repos/asf/incubator-pegasus-website.git
The following commit(s) were added to refs/heads/master by this push: new fdc1420c Update table soft delete doc for Chinese version (#117) fdc1420c is described below commit fdc1420ce008b28015c68f04afb9f339d3023fab Author: ninsmiracle <110282526+ninsmira...@users.noreply.github.com> AuthorDate: Thu Jun 5 15:10:18 2025 +0800 Update table soft delete doc for Chinese version (#117) --- _docs/zh/administration/table-soft-delete.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/_docs/zh/administration/table-soft-delete.md b/_docs/zh/administration/table-soft-delete.md index 1e254262..837d7775 100644 --- a/_docs/zh/administration/table-soft-delete.md +++ b/_docs/zh/administration/table-soft-delete.md @@ -30,14 +30,14 @@ drop 命令用于删除一个表,通过 `-r` 选项指定数据的保留时间 ## 过期表数据的物理删除 过期表的数据在各个 replica server 上也未必能立即被物理删除,因为: * 表的保留时间过期后,只有通过 shell 设置了 `set_meta_level lively`,使 meta server 进入 [负载均衡模式](rebalance#控制集群的负载均衡),meta server 才会通过 `config_sync` RPC 通知 replica server 删除相关的 replica。而 replica server 在收到 meta server 的通知后,就会将需删除的 replica 文件夹通过添加 `.gar` 后缀进行重命名,表示这是可以被删除的垃圾数据。但此时数据仍未被真正物理删除。 -* replica server 会定期(配置文件 `disk_stat_interval_seconds`)扫描各个数据文件夹(配置文件 `data_dirs`),统计文件夹的使用情况。对于标记为 `.gar` 后缀的 replica 文件夹,获取其最后修改时间,并和当前时间进行比较,只有当两者时间差超过了阈值(配置文件 `gc_disk_garbage_replica_interval_seconds`)后,在会将文件夹删除掉。此时数据才算被真正物理删除。 +* replica server 会定期(配置文件 `disk_stat_interval_seconds`,默认为10分钟)扫描各个数据文件夹(配置文件 `data_dirs`),统计文件夹的使用情况。对于标记为 `.gar` 后缀的 replica 文件夹,获取其最后修改时间,并和当前时间进行比较,只有当两者时间差超过了阈值(配置文件 `gc_disk_garbage_replica_interval_seconds`,默认为1天)后,在会将文件夹删除掉。此时数据才算被真正物理删除。 所以综上所述,能够影响表被删除后进行物理删除的时间点的配置项包括: * `[meta_server] hold_seconds_for_dropped_app`:当 drop 表没有指定 `-r` 选项时,决定该表的保留时间。 * `[replication] disk_stat_interval_seconds`:replica server 定期扫描各个数据文件夹的时间间隔。 * `[replication] gc_disk_garbage_replica_interval_seconds`:垃圾 replica 文件夹的最后修改时间距离当前时间超过这个阈值,文件夹才会被删除。 -如果遇到需要紧急删除数据以释放磁盘空间,但是又不方便重启 replica server 更新配置的情况,可以根据表 ID 进行手工暴力删除,但是千万注意: +如果遇到需要紧急删除数据以释放磁盘空间,但是又不方便重启 replica server 更新配置的情况,可以登入Pegasus的replica server所部署的节点,根据表 ID 进行手动强制删除,但是千万注意: * 不到万不得已,不要进行手工暴力删表,避免误操作。 * 坚决只能删除 **过期表** 的数据。 * 不要误删其他表的数据。 --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@pegasus.apache.org For additional commands, e-mail: commits-h...@pegasus.apache.org