Hola cual es la retención que tienes del wall ?
|wal_keep_size es un valor que deberias ajustar para poder retener los
wall necesarios para replicar ambos targets.
|
On 16/08/2024 6:33 am, Elizabeth Fernandez wrote:
Hola a todos,
Tengo dos maquinas con ubuntu 20.04 y postgresql-13, donde una es el
servidor primario y la otra es la replica. Se está utlizando streaming
replication with slots desde hace más de dos años. Necesito crear otra
replica adicional con el servidor primario (no cascada). El disco
asignado al directorio de datos de postgresql es de 4TB y la base de
datos ocupa 1.8 TB. Se requiere cambiar la configuracion de ambos
servidores y hacerles upgrade del hardware al mismo momento. Un nuevo
servidor esta listo y lo que se quiere hacer es crear en este servidor
otra replica, para luego promoverla a servidor de base de datos
principal, hacer lo que se tenga que hacer con los otros dos
servidores y luego, montar de nuevo el esquema de replicacion.
El comando que he utilizado para la creacion de la replica es:
pg_basebackup -h <master_ip> -p 5432 -D <data directorio> -U <user>
-Fp -P -v -R -Xs --checkpoint=fast -C -S <nombre_slot>
Hasta ahora cuando lo he utilizado ha funcionado. Esta semana traté de
crear la 2da replica, pero cuando finalizó el pg_basebackup y se
ejecutó el start de la base de datos, el log indica que requiere hacer
el streaming de un WAL del servidor primario y el mismo ya fue eliminado.
Detalles:
1.- El pg_basebackup inició
START WAL LOCATION: 53A7/33000028 (file 00000005000053A700000033)
CHECKPOINT LOCATION: 53A7/33000098
BACKUP METHOD: streamed
BACKUP FROM: master
START TIME: 2024-08-12 16:13:20 EDT
LABEL: pg_basebackup base backup
START TIMELINE: 5
2.- En el directorio pg_wal de la replica están todos los wal desde el
inicio del proceso (tres dias tardó en ejecutar el pg_basebackup)
total 241G
-rw------- 1 postgres postgres 16M Aug 12 16:15 00000005000053A700000033
-rw------- 1 postgres postgres 16M Aug 12 16:15 00000005000053A700000034
-rw------- 1 postgres postgres 16M Aug 12 16:15 00000005000053A700000035
-rw------- 1 postgres postgres 16M Aug 12 16:15 00000005000053A700000036
-rw------- 1 postgres postgres 16M Aug 12 16:15 00000005000053A700000037
...
-rw------- 1 postgres postgres 16777216 Aug 15 06:38
00000005000053E30000002F
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000030
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000031
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000032
-rw------- 1 postgres postgres 16777216 Aug 15 06:39
00000005000053E300000033
-rw------- 1 postgres postgres 182 Aug 12 16:13 00000005.history
drwx------ 2 postgres postgres 905216 Aug 15 06:39 archive_status
3.- Postgres log
2024-08-15 06:42:01.893 EDT [127390] LOG: starting PostgreSQL 13.15
(Ubuntu 13.15-1.pgdg20.04+1) on x86_64-pc-linux-gnu, compiled by gcc
(Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0, 64-bit
2024-08-15 06:42:01.893 EDT [127390] LOG: listening on IPv4 address
"0.0.0.0", port 5432
2024-08-15 06:42:01.893 EDT [127390] LOG: listening on IPv6 address
"::", port 5432
2024-08-15 06:42:01.894 EDT [127390] LOG: listening on Unix socket
"/var/run/postgresql/.s.PGSQL.5432"
2024-08-15 06:42:01.976 EDT [127391] LOG: database system was
interrupted; last known up at 2024-08-15 06:38:10 EDT
2024-08-15 06:42:38.671 EDT [127391] LOG: entering standby mode
2024-08-15 06:42:38.761 EDT [127391] LOG: redo starts at 53A7/33000028
2024-08-15 06:42:40.087 EDT [127391] LOG: incorrect resource manager
data checksum in record at 53A7/4570AA10
2024-08-15 06:42:40.185 EDT [127394] LOG: started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:40.185 EDT [127394] FATAL: could not receive data
from WAL stream: ERROR: requested WAL segment
00000005000053A700000045 has already been removed
2024-08-15 06:42:40.293 EDT [127395] LOG: started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:40.293 EDT [127395] FATAL: could not receive data
from WAL stream: ERROR: requested WAL segment
00000005000053A700000045 has already been removed
2024-08-15 06:42:45.293 EDT [127396] LOG: started streaming WAL from
primary at 53A7/45000000 on timeline 5
2024-08-15 06:42:45.293 EDT [127396] FATAL: could not receive data
from WAL stream: ERROR: requested WAL segment
00000005000053A700000045 has already been removed
2024-08-15 06:42:50.295 EDT [127397] LOG: started streaming WAL from
primary at 53A7/45000000 on timeline 5
Agradecería si alguien puede ayudarme con esto.
Saludos,
Elizabeth Fernandez