Gilmar,

* Qual a versão do heartbeat?
* Podes colocar no próximo email o arquivo de configuração?
* Se puderes, cria um arquivo com as mensagens do /var/log/messages de um
  minuto antes da queda até o heartbeat começar a gerar estes logs. Se for
  muito grande, compacta antes de enviar.

Normalmente, se o heartbeat pára e os serviços continuam rodando, significa
erro na configuração. Estes sintomas que descreveste acontecem durante o
uso real ou em falhas induzidas para teste?

Abraço,
Luis

On Fri, Jan 12, 2007 at 06:32:05PM -0200, Gilmar Cabral wrote:
| Ola a todos!
| Estou com um problema aki muito estranho com o heartbeat, ja testei com
| a serie 2.0 completa para 64 bits pois o servidor que tenho e um atlhon 64 X2 
| e todas as versões que testei apresentarão o mesmo problema que e o seguinte:
| Aki utilizo o drbd + heartbeat estão funcionando perfeitamente, so que
| por exemplo quando um dos meus servidores aki cai por algum motivo,
| exemplo falta de energia acontece dele fica desligado no periodo acima
| de 20 minutos, o heartbeat do servidor primario para, so que os serviços
| continuão rodando menos o heartbeat e no servidor primario começa a gerar um 
log de um
| 3 M. de tamanho, segue abaixo um pedaço.
| Se o servidor secundario retornar antes dos 20 minutos, tudo fica
| normal não gera o log de tamanho mostro e funciona perfeiteamente.
| Desde ja agradeço sugestões de como resolver este problema.
| 
| Estou utilizando Distro centos 4.3 para 64 bits.
| 
| heartbeat[2299]: 2006/12/18_10:58:15 info: Current arena value: 0
| heartbeat[2299]: 2006/12/18_10:58:15 info: These are nothing to worry about.
| heartbeat[2299]: 2006/12/18_19:58:56 WARN: node aroeira.agrovale: is dead
| heartbeat[2299]: 2006/12/18_19:58:56 info: Dead node aroeira.agrovale
| gave up resources.
| heartbeat[2299]: 2006/12/18_19:58:56 info: Link aroeira.agrovale:eth1 dead.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:41 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Shutting down.
| heartbeat[2299]: 2006/12/18_20:18:42 ERROR: Cannot write to media pipe
| 0: Resource temporarily unavailable
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[3] : [protocol=1]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[4] :
| [src=jacaranda.agrovale]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[5] :
| [(1)srcuuid=0x5e0c18(36 27)]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[6] : [seq=2089aa]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[7] : [hg=6d]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[8] : [ts=4587117b]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[9] : [ld=0.50 0.76 0.49
| 2/128 28397]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[10] : [ttl=3]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: MSG[11] : [auth=1 99f7d880]
| heartbeat[2331]: 2006/12/18_20:33:07 ERROR: write failure on bcast
| eth1.: Interrupted system call
| 
| _______________________________________________
| Linux-HA mailing list
| [email protected]
| http://listas.linuxchix.org.br/mailman/listinfo/linux-ha
| 
| E-mail classificado pelo Identificador de Spam Inteligente Terra.
| Para alterar a categoria classificada, visite
| 
http://mail.terra.com.br/protected_email/imail/imail.cgi?+_u=lc_poa&_l=1,1168633996.678585.24894.caneria.hst.terra.com.br,7172,Des15,Des15
| 
| Esta mensagem foi verificada pelo E-mail Protegido Terra.
| Scan engine: McAfee VirusScan / Atualizado em 12/01/2007 / Versão: 5.1.00/4938
| Proteja o seu e-mail Terra: http://mail.terra.com.br/
| 
---end quoted text---

-- 
[ Luis Claudio R. Goncalves                    lclaudio at unix dot sh ]
[ Fingerprint:   4FDD B8C4 3C59 34BD 8BE9  2696 7203 D980 A448 C8F8    ]
[ Linux-HA Developer - LateNite Programmer - Gospel User - Bass Player ]
[ Fault Tolerance - Real-Time - Distributed Systems - IECLB - Is 40:31 ]

_______________________________________________
Linux-HA mailing list
[email protected]
http://listas.linuxchix.org.br/mailman/listinfo/linux-ha

Responder a