On Fri, Feb 08, 2008 at 08:56:01AM -0200, Jeronimo Zucco wrote:
| [EMAIL PROTECTED] wrote:
| > Ola!
| >
| > Tenho atualmente drbd + heartbeat, funcionando blz, so que surgiu uma
| > duvida aki.
| >
| > Exemplo: Meus servidores rodando drbd + heartbeat funcionao assim: se
| > o servidor primario cair o segundario assume como primario e quando o
| > que era primario volta como segundario, ate ai tudo bem.
| >
| > Vamos supor que o servidor primario cai, e nao volta por talta de
| > energia, ao logo apos um tempo o servidor secundario que esta virou
| > primario caia tambem, pois o nobreak que ele esta ligado acabou a
| > energia tambem, e nesta situacao nao estou perto para ver qual
| > servidor caiu por ultimo.
| >
| > Sei que tenho que saber qual foi o ultimo servidor que caiu por
| > ultimo, pois ele tem que ser ligado primeiro. mas se eu nao souber
| > qual foi, como descubro?

O DRBD tem, há um bom tempo, o conceito de Generation Counter implementado.
Ele mesmo se encarrega de verificar quem foi o último master (primário) e,
caso os dois estejam marcados como primários, ele verifica qual deles foi o
primário numa instância mais atual.

Claro que, com intervenção humana e um pouco de força bruta, se pode fazer
coisas incríveis e corromper todos os dados :)

Mas no caso comum de a) cai o primário; b) o secundário assume e c) cai o
secundário, o drbd consegue resolver o problema quando os dois forem
religados. Mas não deve existir nenhum passo "d)" que não seja religar os
dois servidores apra o drbd fazer a mágica dele.

Um outro ponto importante é que o script usado no heartbeat não deve
_forçar_ o nodo a levantar o DRBD como primário se este reclamar de algo.

Abraço,
Luis

| > <mailto:[email protected]>
| 
| Use uma ferramenta de monitoramento para saber isso, como o nagios.
| 
|     Outra coisa nesse monitoramento, é que assim que o secundário entrar
| no ar, você já deve tomar providências para que o seviço volte ao
| normal, e não esperar com que a energia do segundo servidor acabe. Nesse
| caso específico, você teria que necessariamente desligar os dois
| servidores, mas com o drbd e heartbeat pelo menos ganhou tempo para
| avisar todo mundo para sair do sistema, fazer shutdown corretamente do
| sistema, etc.
| 
| >
| > E se eu ligar o servidor errado, eu feito de ligar o servidor que caiu
| > por ultimo eu acabar ligando o servidor que caiu primeiro.
| > Desde ja agradeco
| > <mailto:[email protected]>
| 
| Pode ocorrer o problema de split-brain, e você deverá resincronizar a
| base drbd.
| 
| 
| -- 
| Jeronimo Zucco
| LPIC-1 Linux Professional Institute Certified
| Núcleo de Processamento de Dados
| Universidade de Caxias do Sul
| 
| http://jczucco.blogspot.com
| 
| 
| _______________________________________________
| Linux-HA mailing list
| [email protected]
| http://listas.linuxchix.org.br/mailman/listinfo/linux-ha
---end quoted text---

-- 
[ Luis Claudio R. Goncalves                    Bass - Gospel - RT ]
[ Fingerprint: 4FDD B8C4 3C59 34BD 8BE9  2696 7203 D980 A448 C8F8 ]

_______________________________________________
Linux-HA mailing list
[email protected]
http://listas.linuxchix.org.br/mailman/listinfo/linux-ha

Responder a