On 02-03-2016 11:22, Everton Berz wrote: > ontem tivemos duas paradas na replicação do primário para o standby, ou > seja, o standby não recebeu mais atualizações do primário. > Após mais de 4 horas assim, reiniciamos o standby e tudo voltou ao normal. > O que você quis dizer com parou de replicar? Dependendo do cenário, uma simples consulta pode "parar" a replicação com algum bloqueio (aka lock). Quais os valores dos parâmetros max_standby_*_delay?
> Não existem mensagens de erro no log do PostgreSQL primário nem no standby. > Quando a conexão de replicação cai de maneira inesperada você tem uma mensagem no log. O processo wal sender e/ou wal receiver estava presente nos respectivos servidores? Você executou um strace no wal sender? > Nem o OSWatcher nem o Zabbix exibem problemas de conectividade, disco ou SO. > Isso está parecendo consultas longas com bloqueios. > Existe alguma maneira de diagnosticar melhor esse problema? > Qualquer problema na replicação é reportado no log. Recordo-me que há uma correção na 9.3.11 cuja mensagem de ERRO de conexão não era emitida após receber um EOF. Fix premature clearing of libpq's input buffer when socket EOF is seen Atualize sua versão. -- Euler Taveira Timbira - http://www.timbira.com.br/ PostgreSQL: Consultoria, Desenvolvimento, Suporte 24x7 e Treinamento _______________________________________________ pgbr-geral mailing list pgbr-geral@listas.postgresql.org.br https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral