Hola cual es la retención que tienes del wall ?

|wal_keep_size es un valor que deberias ajustar para poder retener los wall necesarios para replicar ambos targets.
|

On 16/08/2024 6:33 am, Elizabeth Fernandez wrote:
Hola a todos,
Tengo dos maquinas con ubuntu 20.04 y postgresql-13, donde una es el servidor primario y la otra es la replica. Se está utlizando streaming replication with slots desde hace más de dos años. Necesito crear otra replica adicional con el servidor primario (no cascada). El disco asignado al directorio de datos de postgresql es de 4TB y la base de datos ocupa 1.8 TB. Se requiere cambiar la configuracion de ambos servidores y hacerles upgrade del hardware al mismo momento. Un nuevo servidor esta listo y lo que se quiere hacer es crear en este servidor otra replica, para luego promoverla a servidor de base de datos principal, hacer lo que se tenga que hacer con los otros dos servidores y luego, montar de nuevo el esquema de replicacion.
El comando que he utilizado para la creacion de la replica es:
pg_basebackup -h <master_ip> -p 5432 -D <data directorio>  -U <user> -Fp -P -v -R -Xs --checkpoint=fast -C -S <nombre_slot> Hasta ahora cuando lo he utilizado ha funcionado. Esta semana traté de crear la 2da replica, pero cuando finalizó el pg_basebackup y se ejecutó el start de la base de datos, el log indica que requiere hacer el streaming de un WAL del servidor primario y el mismo ya fue eliminado.

Detalles:
1.- El pg_basebackup inició
START WAL LOCATION: 53A7/33000028 (file 00000005000053A700000033)
CHECKPOINT LOCATION: 53A7/33000098
BACKUP METHOD: streamed
BACKUP FROM: master
START TIME: 2024-08-12 16:13:20 EDT
LABEL: pg_basebackup base backup
START TIMELINE: 5

2.- En el directorio pg_wal de la replica están todos los wal desde el inicio del proceso (tres dias tardó en ejecutar el pg_basebackup)
total 241G
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000033
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000034
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000035
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000036
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000037
...
-rw------- 1 postgres postgres 16777216 Aug 15 06:38 00000005000053E30000002F -rw------- 1 postgres postgres 16777216 Aug 15 06:39 00000005000053E300000030 -rw------- 1 postgres postgres 16777216 Aug 15 06:39 00000005000053E300000031 -rw------- 1 postgres postgres 16777216 Aug 15 06:39 00000005000053E300000032 -rw------- 1 postgres postgres 16777216 Aug 15 06:39 00000005000053E300000033
-rw------- 1 postgres postgres      182 Aug 12 16:13 00000005.history
drwx------ 2 postgres postgres   905216 Aug 15 06:39 archive_status

3.- Postgres log
2024-08-15 06:42:01.893 EDT [127390] LOG:  starting PostgreSQL 13.15 (Ubuntu 13.15-1.pgdg20.04+1) on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0, 64-bit 2024-08-15 06:42:01.893 EDT [127390] LOG:  listening on IPv4 address "0.0.0.0", port 5432 2024-08-15 06:42:01.893 EDT [127390] LOG:  listening on IPv6 address "::", port 5432 2024-08-15 06:42:01.894 EDT [127390] LOG:  listening on Unix socket "/var/run/postgresql/.s.PGSQL.5432" 2024-08-15 06:42:01.976 EDT [127391] LOG:  database system was interrupted; last known up at 2024-08-15 06:38:10 EDT
2024-08-15 06:42:38.671 EDT [127391] LOG:  entering standby mode
2024-08-15 06:42:38.761 EDT [127391] LOG:  redo starts at 53A7/33000028
2024-08-15 06:42:40.087 EDT [127391] LOG:  incorrect resource manager data checksum in record at 53A7/4570AA10 2024-08-15 06:42:40.185 EDT [127394] LOG:  started streaming WAL from primary at 53A7/45000000 on timeline 5 2024-08-15 06:42:40.185 EDT [127394] FATAL:  could not receive data from WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has already been removed 2024-08-15 06:42:40.293 EDT [127395] LOG:  started streaming WAL from primary at 53A7/45000000 on timeline 5 2024-08-15 06:42:40.293 EDT [127395] FATAL:  could not receive data from WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has already been removed 2024-08-15 06:42:45.293 EDT [127396] LOG:  started streaming WAL from primary at 53A7/45000000 on timeline 5 2024-08-15 06:42:45.293 EDT [127396] FATAL:  could not receive data from WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has already been removed 2024-08-15 06:42:50.295 EDT [127397] LOG:  started streaming WAL from primary at 53A7/45000000 on timeline 5

Agradecería si alguien puede ayudarme con esto.
Saludos,
Elizabeth Fernandez

Reply via email to