Hola a todos,
Tengo dos maquinas con ubuntu 20.04 y postgresql-13, donde una es el
servidor primario y la otra es la replica. Se está utlizando streaming
replication with slots desde hace más de dos años. Necesito crear otra
replica adicional con el servidor primario (no cascada). El disco asignado
al directorio de datos de postgresql es de 4TB y la base de datos ocupa 1.8
TB. Se requiere cambiar la configuracion de ambos servidores y hacerles
upgrade del hardware al mismo momento. Un nuevo servidor esta listo y lo
que se quiere hacer es crear en este servidor otra replica, para luego
promoverla a servidor de base de datos principal, hacer lo que se tenga que
hacer con los otros dos servidores y luego, montar de nuevo el esquema de
replicacion.
El comando que he utilizado para la creacion de la replica es:
pg_basebackup -h <master_ip> -p 5432 -D <data directorio>  -U <user> -Fp -P
-v -R -Xs --checkpoint=fast -C -S <nombre_slot>
Hasta ahora cuando lo he utilizado ha funcionado. Esta semana traté de
crear la 2da replica, pero cuando finalizó el pg_basebackup y se ejecutó el
start de la base de datos, el log indica que requiere hacer el streaming de
un WAL del servidor primario y el mismo ya fue eliminado.

Detalles:
1.- El pg_basebackup inició
START WAL LOCATION: 53A7/33000028 (file 00000005000053A700000033)
CHECKPOINT LOCATION: 53A7/33000098
BACKUP METHOD: streamed
BACKUP FROM: master
START TIME: 2024-08-12 16:13:20 EDT
LABEL: pg_basebackup base backup
START TIMELINE: 5

2.- En el directorio pg_wal de la replica están todos los wal desde el
inicio del proceso (tres dias tardó en ejecutar el pg_basebackup)
total 241G
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000033
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000034
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000035
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000036
-rw------- 1 postgres postgres  16M Aug 12 16:15 00000005000053A700000037
...
-rw------- 1 postgres postgres 16777216 Aug 15 06:38
00000005000053E30000002F
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000030
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000031
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000032
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000033
-rw------- 1 postgres postgres      182 Aug 12 16:13 00000005.history
drwx------ 2 postgres postgres   905216 Aug 15 06:39 archive_status

3.- Postgres log
2024-08-15 06:42:01.893 EDT [127390] LOG:  starting PostgreSQL 13.15
(Ubuntu 13.15-1.pgdg20.04+1) on x86_64-pc-linux-gnu, compiled by gcc
(Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0, 64-bit
2024-08-15 06:42:01.893 EDT [127390] LOG:  listening on IPv4 address
"0.0.0.0", port 5432
2024-08-15 06:42:01.893 EDT [127390] LOG:  listening on IPv6 address "::",
port 5432
2024-08-15 06:42:01.894 EDT [127390] LOG:  listening on Unix socket
"/var/run/postgresql/.s.PGSQL.5432"
2024-08-15 06:42:01.976 EDT [127391] LOG:  database system was interrupted;
last known up at 2024-08-15 06:38:10 EDT
2024-08-15 06:42:38.671 EDT [127391] LOG:  entering standby mode
2024-08-15 06:42:38.761 EDT [127391] LOG:  redo starts at 53A7/33000028
2024-08-15 06:42:40.087 EDT [127391] LOG:  incorrect resource manager data
checksum in record at 53A7/4570AA10
2024-08-15 06:42:40.185 EDT [127394] LOG:  started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:40.185 EDT [127394] FATAL:  could not receive data from
WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has
already been removed
2024-08-15 06:42:40.293 EDT [127395] LOG:  started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:40.293 EDT [127395] FATAL:  could not receive data from
WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has
already been removed
2024-08-15 06:42:45.293 EDT [127396] LOG:  started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:45.293 EDT [127396] FATAL:  could not receive data from
WAL stream: ERROR:  requested WAL segment 00000005000053A700000045 has
already been removed
2024-08-15 06:42:50.295 EDT [127397] LOG:  started streaming WAL from
primary at 53A7/45000000 on timeline 5

Agradecería si alguien puede ayudarme con esto.
Saludos,
Elizabeth Fernandez

Reply via email to