On Fri, Feb 08, 2008 at 08:56:01AM -0200, Jeronimo Zucco wrote: | [EMAIL PROTECTED] wrote: | > Ola! | > | > Tenho atualmente drbd + heartbeat, funcionando blz, so que surgiu uma | > duvida aki. | > | > Exemplo: Meus servidores rodando drbd + heartbeat funcionao assim: se | > o servidor primario cair o segundario assume como primario e quando o | > que era primario volta como segundario, ate ai tudo bem. | > | > Vamos supor que o servidor primario cai, e nao volta por talta de | > energia, ao logo apos um tempo o servidor secundario que esta virou | > primario caia tambem, pois o nobreak que ele esta ligado acabou a | > energia tambem, e nesta situacao nao estou perto para ver qual | > servidor caiu por ultimo. | > | > Sei que tenho que saber qual foi o ultimo servidor que caiu por | > ultimo, pois ele tem que ser ligado primeiro. mas se eu nao souber | > qual foi, como descubro?
O DRBD tem, há um bom tempo, o conceito de Generation Counter implementado. Ele mesmo se encarrega de verificar quem foi o último master (primário) e, caso os dois estejam marcados como primários, ele verifica qual deles foi o primário numa instância mais atual. Claro que, com intervenção humana e um pouco de força bruta, se pode fazer coisas incríveis e corromper todos os dados :) Mas no caso comum de a) cai o primário; b) o secundário assume e c) cai o secundário, o drbd consegue resolver o problema quando os dois forem religados. Mas não deve existir nenhum passo "d)" que não seja religar os dois servidores apra o drbd fazer a mágica dele. Um outro ponto importante é que o script usado no heartbeat não deve _forçar_ o nodo a levantar o DRBD como primário se este reclamar de algo. Abraço, Luis | > <mailto:[email protected]> | | Use uma ferramenta de monitoramento para saber isso, como o nagios. | | Outra coisa nesse monitoramento, é que assim que o secundário entrar | no ar, você já deve tomar providências para que o seviço volte ao | normal, e não esperar com que a energia do segundo servidor acabe. Nesse | caso específico, você teria que necessariamente desligar os dois | servidores, mas com o drbd e heartbeat pelo menos ganhou tempo para | avisar todo mundo para sair do sistema, fazer shutdown corretamente do | sistema, etc. | | > | > E se eu ligar o servidor errado, eu feito de ligar o servidor que caiu | > por ultimo eu acabar ligando o servidor que caiu primeiro. | > Desde ja agradeco | > <mailto:[email protected]> | | Pode ocorrer o problema de split-brain, e você deverá resincronizar a | base drbd. | | | -- | Jeronimo Zucco | LPIC-1 Linux Professional Institute Certified | Núcleo de Processamento de Dados | Universidade de Caxias do Sul | | http://jczucco.blogspot.com | | | _______________________________________________ | Linux-HA mailing list | [email protected] | http://listas.linuxchix.org.br/mailman/listinfo/linux-ha ---end quoted text--- -- [ Luis Claudio R. Goncalves Bass - Gospel - RT ] [ Fingerprint: 4FDD B8C4 3C59 34BD 8BE9 2696 7203 D980 A448 C8F8 ] _______________________________________________ Linux-HA mailing list [email protected] http://listas.linuxchix.org.br/mailman/listinfo/linux-ha
