This is an automated email from the ASF dual-hosted git repository.

wangdan pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/incubator-pegasus-website.git


The following commit(s) were added to refs/heads/master by this push:
     new fdc1420c Update table soft delete doc for Chinese version (#117)
fdc1420c is described below

commit fdc1420ce008b28015c68f04afb9f339d3023fab
Author: ninsmiracle <110282526+ninsmira...@users.noreply.github.com>
AuthorDate: Thu Jun 5 15:10:18 2025 +0800

    Update table soft delete doc for Chinese version (#117)
---
 _docs/zh/administration/table-soft-delete.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/_docs/zh/administration/table-soft-delete.md 
b/_docs/zh/administration/table-soft-delete.md
index 1e254262..837d7775 100644
--- a/_docs/zh/administration/table-soft-delete.md
+++ b/_docs/zh/administration/table-soft-delete.md
@@ -30,14 +30,14 @@ drop 命令用于删除一个表,通过 `-r` 选项指定数据的保留时间
 ## 过期表数据的物理删除
 过期表的数据在各个 replica server 上也未必能立即被物理删除,因为:
 * 表的保留时间过期后,只有通过 shell 设置了 `set_meta_level lively`,使 meta server 进入 
[负载均衡模式](rebalance#控制集群的负载均衡),meta server 才会通过 `config_sync` RPC 通知 replica 
server 删除相关的 replica。而 replica server 在收到 meta server 的通知后,就会将需删除的 replica 
文件夹通过添加 `.gar` 后缀进行重命名,表示这是可以被删除的垃圾数据。但此时数据仍未被真正物理删除。
-* replica server 会定期(配置文件 `disk_stat_interval_seconds`)扫描各个数据文件夹(配置文件 
`data_dirs`),统计文件夹的使用情况。对于标记为 `.gar` 后缀的 replica 
文件夹,获取其最后修改时间,并和当前时间进行比较,只有当两者时间差超过了阈值(配置文件 
`gc_disk_garbage_replica_interval_seconds`)后,在会将文件夹删除掉。此时数据才算被真正物理删除。
+* replica server 会定期(配置文件 `disk_stat_interval_seconds`,默认为10分钟)扫描各个数据文件夹(配置文件 
`data_dirs`),统计文件夹的使用情况。对于标记为 `.gar` 后缀的 replica 
文件夹,获取其最后修改时间,并和当前时间进行比较,只有当两者时间差超过了阈值(配置文件 
`gc_disk_garbage_replica_interval_seconds`,默认为1天)后,在会将文件夹删除掉。此时数据才算被真正物理删除。
 
 所以综上所述,能够影响表被删除后进行物理删除的时间点的配置项包括:
 * `[meta_server] hold_seconds_for_dropped_app`:当 drop 表没有指定 `-r` 选项时,决定该表的保留时间。
 * `[replication] disk_stat_interval_seconds`:replica server 定期扫描各个数据文件夹的时间间隔。
 * `[replication] gc_disk_garbage_replica_interval_seconds`:垃圾 replica 
文件夹的最后修改时间距离当前时间超过这个阈值,文件夹才会被删除。
 
-如果遇到需要紧急删除数据以释放磁盘空间,但是又不方便重启 replica server 更新配置的情况,可以根据表 ID 进行手工暴力删除,但是千万注意:
+如果遇到需要紧急删除数据以释放磁盘空间,但是又不方便重启 replica server 更新配置的情况,可以登入Pegasus的replica 
server所部署的节点,根据表 ID 进行手动强制删除,但是千万注意:
 * 不到万不得已,不要进行手工暴力删表,避免误操作。
 * 坚决只能删除 **过期表** 的数据。
 * 不要误删其他表的数据。


---------------------------------------------------------------------
To unsubscribe, e-mail: commits-unsubscr...@pegasus.apache.org
For additional commands, e-mail: commits-h...@pegasus.apache.org

Reply via email to