Olá

ontem tivemos duas paradas na replicação do primário para o standby, ou
seja, o standby não recebeu mais atualizações do primário.
Após mais de 4 horas assim, reiniciamos o standby e tudo voltou ao normal.

Você faz consultas sobre o standby? Você faz dump sobre o standby?

Não existem mensagens de erro no log do PostgreSQL primário nem no standby.

Nem o OSWatcher nem o Zabbix exibem problemas de conectividade, disco ou SO.

Existe alguma maneira de diagnosticar melhor esse problema?

Monitorar a visão pg_stat_replication no servidor principal.
Lá você pode ver todos os standby conectados e o atraso de replicaçã, seja no envio dos dados, no recebimento e na aplicação do outro lado.

Seria interessante alguma solução que não fosse aumentar a verbosidade
do log, pois posso ter restrições de armazenamento se deixasse em modo
debug durante todo o tempo.

Não há necessidade num primeiro momento.

Segue minhas configurações:

PostgreSQL 9.3.10 on x86_64-unknown-linux-gnu, compiled by gcc (GCC)

9.3.11 disponível, atualize o quanto antes!

4.4.7 20120313 (Red Hat 4.4.7-16), 64-bit
Red Hat Enterprise Linux Server release 6.7 (Santiago)


wal_level = hot_standby
archive_mode = on
archive_command = '/usr/local/bin/copy_archive_logs.sh %p %f'
archive_timeout = 300
max_wal_senders = 5

Você tem 5 standby conectados? ou você faz uso de pg_basebackup mais alguma outra ferramenta?

wal_keep_segments = 64
wal_sync_method = open_sync

Nem sempre a melhor opção, já usou a ferramenta pg_test_fsync?

[]s
Flavio Gurgel
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a