[pgsql-es-ayuda] RE: repmgr y failover automático error

2017-03-15 Por tema Lazaro Garcia
Gracias por la respuesta, realmente lo que hago es detener el servicio de 
postgres en el maestro para que un esclavo sea promovido a maestro, con esto 
repmgr se detiene en este nodo. Luego cuando recupero el nodo fallido, reinicio 
el proceso de repmgr nuevamente en ese nodo.

Saludos a todos.

-Mensaje original-
De: Jaime Casanova [mailto:jaime.casan...@2ndquadrant.com] 
Enviado el: miércoles, 15 de marzo de 2017 12:44 p. m.
Para: Lazaro Garcia
CC: POSTGRES
Asunto: Re: repmgr y failover automático error

2017-02-14 5:42 GMT-05:00 Lazaro Garcia :
> Hola a todos en la lista. Creo haber encontrado el problema con el failover 
> automático y repmgr.
>
> Cuando se produce el proceso de failover, el proceso repmgr en el nodo 
> fallido muere.
>
[...]
>
> ¿Es este el comportamiento esperado?
>

Saludos,

Según recuerdo si. Ahora, si el nodo fallo pudo ser:
1) una prueba de laboratorio como la tuya,
2) un problema trasiente de red
3) un fallo de disco
4) falla catastrófica de la máquina

en cualquiera de los 3 últimos casos deberías hacer un chequeo completo de la 
máquina antes de ponerla a funcionar. Como parte de ese chequeo surgirá que el 
repmgrd se detuvo.
Y si, el chequeo debe ser aún en el caso del fallo trasiente de red porque 
quieres asegurarte por qué ocurrió y si no está enmascarando un problema mayor.

-- 
Jaime Casanova  www.2ndQuadrant.com
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services


-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripci�n:
http://www.postgresql.org/mailpref/pgsql-es-ayuda


[pgsql-es-ayuda] Re: repmgr y failover automático error

2017-03-15 Por tema Jaime Casanova
2017-02-14 5:42 GMT-05:00 Lazaro Garcia :
> Hola a todos en la lista. Creo haber encontrado el problema con el failover 
> automático y repmgr.
>
> Cuando se produce el proceso de failover, el proceso repmgr en el nodo 
> fallido muere.
>
[...]
>
> ¿Es este el comportamiento esperado?
>

Saludos,

Según recuerdo si. Ahora, si el nodo fallo pudo ser:
1) una prueba de laboratorio como la tuya,
2) un problema trasiente de red
3) un fallo de disco
4) falla catastrófica de la máquina

en cualquiera de los 3 últimos casos deberías hacer un chequeo
completo de la máquina antes de ponerla a funcionar. Como parte de ese
chequeo surgirá que el repmgrd se detuvo.
Y si, el chequeo debe ser aún en el caso del fallo trasiente de red
porque quieres asegurarte por qué ocurrió y si no está enmascarando un
problema mayor.

-- 
Jaime Casanova  www.2ndQuadrant.com
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripci�n:
http://www.postgresql.org/mailpref/pgsql-es-ayuda


[pgsql-es-ayuda] RE: repmgr y failover automático error

2017-02-14 Por tema Lazaro Garcia
Hola a todos en la lista. Creo haber encontrado el problema con el failover 
automático y repmgr.

Cuando se produce el proceso de failover, el proceso repmgr en el nodo fallido 
muere.

El servicio Postgresql se detiene en el Nodo1, Nodo2 se promueve como maestro 
automáticamente pero repmgr en nodo1 se detiene, y necesito iniciar repmgr 
nuevamente después de recuperar Nodo1.

¿Es este el comportamiento esperado?

Saludos a todos.

-Mensaje original-
De: Lazaro Garcia [mailto:lazaro3...@gmail.com] 
Enviado el: lunes, 13 de febrero de 2017 11:08 a. m.
Para: 'Jaime Casanova'
CC: 'POSTGRES'
Asunto: repmgr y failover automático

Buenos días a todos, alguien me pudiera enviar algún enlace o darme alguna 
recomendación sobre el proceso de failover automático con repmgr, pues llevo 
días intentando el proceso pero solo funciona una vez, cuando los papeles se 
invierten no me funciona y debo reiniciar todos los servicios.

Por otra parte tengo activa la opción --monitoring-history y sucede lo mismo, 
una vez se invierten los papeles, deja de funcionar.

Saludos y gracias a todos por su tiempo.

-Mensaje original-
De: Lazaro Garcia [mailto:lazaro3...@gmail.com] Enviado el: viernes, 10 de 
febrero de 2017 09:28 a. m.
Para: 'Jaime Casanova'
CC: 'POSTGRES'
Asunto: RE: [pgsql-es-ayuda] repmgr y failover automático

Jaime muchas gracias por la respuesta, te explico los pasos:

1. Para convertir el nodo1 en esclavo del nodo2 ejecuté una recuperación desde 
repmgr.

repmgr -h maestro -U repmgr -d repmgr -D /var/lib/postgresql/9.6/main/ -f 
/etc/postgresql/9.6/main/repmgr.conf --rsync-only --force standby clone

Una vez terminado el proceso de clonado, inicié el servicio de postgres en el 
nuevo esclavo. El nodo1 inicia bien sin problemas en la réplica.

2. El servicio de repmgrd está corriendo, es un servicio añadido al sistema.

Debo hacer algo más?
Luego de la recuperación hay que notificarle algo a repmgr?


Saludos a todos.


-Mensaje original-
De: Jaime Casanova [mailto:jaime.casan...@2ndquadrant.com]
Enviado el: viernes, 10 de febrero de 2017 03:24 a. m.
Para: Lazaro Garcia
CC: POSTGRES
Asunto: Re: [pgsql-es-ayuda] repmgr y failover automático

2017-02-09 9:42 GMT-05:00 Lazaro Garcia :
> Hola a todos en la lista. He instalado y configurado repmgr y repmgrd 
> en 2 nodos utilizando failover automático.
>
> En una configuración inicial el nodo1 es el maestro y nodo2 el esclavo.
> Cuando apago el nodo1 el nodo2 es promovido a maestro automáticamente, 
> luego recupero el nodo1 para que sea esclavo del nodo2, (aquí se 
> invierten los
> papeles) sin embargo cuando detengo el nodo2, el nodo1 no se me 
> promueve a maestro.
>

1. Como convertiste al nodo1 en esclavo del nodo2? Debes asegurarte de que el 
registro correspondiente en repmgr_schema.repl_nodes este activo.
2. Te aseguraste que el repmgrd este corriendo en el nodo1 luego de agregarlo 
nuevamente?

-- 
Jaime Casanova  www.2ndQuadrant.com
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services


-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripci�n:
http://www.postgresql.org/mailpref/pgsql-es-ayuda