[pgsql-es-ayuda] RE: repmgr y failover automático error

2017-03-15 Por tema Lazaro Garcia
Gracias por la respuesta, realmente lo que hago es detener el servicio de 
postgres en el maestro para que un esclavo sea promovido a maestro, con esto 
repmgr se detiene en este nodo. Luego cuando recupero el nodo fallido, reinicio 
el proceso de repmgr nuevamente en ese nodo.

Saludos a todos.

-Mensaje original-
De: Jaime Casanova [mailto:jaime.casan...@2ndquadrant.com] 
Enviado el: miércoles, 15 de marzo de 2017 12:44 p. m.
Para: Lazaro Garcia
CC: POSTGRES
Asunto: Re: repmgr y failover automático error

2017-02-14 5:42 GMT-05:00 Lazaro Garcia :
> Hola a todos en la lista. Creo haber encontrado el problema con el failover 
> automático y repmgr.
>
> Cuando se produce el proceso de failover, el proceso repmgr en el nodo 
> fallido muere.
>
[...]
>
> ¿Es este el comportamiento esperado?
>

Saludos,

Según recuerdo si. Ahora, si el nodo fallo pudo ser:
1) una prueba de laboratorio como la tuya,
2) un problema trasiente de red
3) un fallo de disco
4) falla catastrófica de la máquina

en cualquiera de los 3 últimos casos deberías hacer un chequeo completo de la 
máquina antes de ponerla a funcionar. Como parte de ese chequeo surgirá que el 
repmgrd se detuvo.
Y si, el chequeo debe ser aún en el caso del fallo trasiente de red porque 
quieres asegurarte por qué ocurrió y si no está enmascarando un problema mayor.

-- 
Jaime Casanova  www.2ndQuadrant.com
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services


-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripci�n:
http://www.postgresql.org/mailpref/pgsql-es-ayuda


[pgsql-es-ayuda] Re: repmgr y failover automático error

2017-03-15 Por tema Jaime Casanova
2017-02-14 5:42 GMT-05:00 Lazaro Garcia :
> Hola a todos en la lista. Creo haber encontrado el problema con el failover 
> automático y repmgr.
>
> Cuando se produce el proceso de failover, el proceso repmgr en el nodo 
> fallido muere.
>
[...]
>
> ¿Es este el comportamiento esperado?
>

Saludos,

Según recuerdo si. Ahora, si el nodo fallo pudo ser:
1) una prueba de laboratorio como la tuya,
2) un problema trasiente de red
3) un fallo de disco
4) falla catastrófica de la máquina

en cualquiera de los 3 últimos casos deberías hacer un chequeo
completo de la máquina antes de ponerla a funcionar. Como parte de ese
chequeo surgirá que el repmgrd se detuvo.
Y si, el chequeo debe ser aún en el caso del fallo trasiente de red
porque quieres asegurarte por qué ocurrió y si no está enmascarando un
problema mayor.

-- 
Jaime Casanova  www.2ndQuadrant.com
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripci�n:
http://www.postgresql.org/mailpref/pgsql-es-ayuda