On 02-03-2016 11:22, Everton Berz wrote:
> ontem tivemos duas paradas na replicação do primário para o standby, ou
> seja, o standby não recebeu mais atualizações do primário.
> Após mais de 4 horas assim, reiniciamos o standby e tudo voltou ao normal.
> 
O que você quis dizer com parou de replicar? Dependendo do cenário, uma
simples consulta pode "parar" a replicação com algum bloqueio (aka
lock). Quais os valores dos parâmetros max_standby_*_delay?

> Não existem mensagens de erro no log do PostgreSQL primário nem no standby.
> 
Quando a conexão de replicação cai de maneira inesperada você tem uma
mensagem no log. O processo wal sender e/ou wal receiver estava presente
nos respectivos servidores? Você executou um strace no wal sender?

> Nem o OSWatcher nem o Zabbix exibem problemas de conectividade, disco ou SO.
> 
Isso está parecendo consultas longas com bloqueios.

> Existe alguma maneira de diagnosticar melhor esse problema?
> 
Qualquer problema na replicação é reportado no log.

Recordo-me que há uma correção na 9.3.11 cuja mensagem de ERRO de
conexão não era emitida após receber um EOF.

Fix premature clearing of libpq's input buffer when socket EOF is seen

Atualize sua versão.


-- 
   Euler Taveira                   Timbira - http://www.timbira.com.br/
   PostgreSQL: Consultoria, Desenvolvimento, Suporte 24x7 e Treinamento
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a