Olá a todos. Estou enfrentando uns problemas com servidores HP DL380 G5 em um rede, e ainda não consegui isolar a causa. Porém, uma das hipóteses é falha de hardware, uma que vez que os dois sofreram uma certa agressão recentemente.
O sintoma aparente é que os servidores travam por pequenos instantes, a todo momento. Tenho tido algumas evidências de que o problema é relacionado ao hardware mesmo, inclusive essas mensagens de log do kernel: Dec 14 10:09:16 slave kernel: BUG: soft lockup - CPU#4 stuck for 12s! [kipmi1:4501] Dec 14 12:27:56 slave kernel: BUG: soft lockup - CPU#7 stuck for 14s! [kipmi1:4501] Dec 14 13:50:54 slave kernel: BUG: soft lockup - CPU#6 stuck for 15s! [kipmi1:4501] Dec 14 13:50:55 slave kernel: BUG: soft lockup - CPU#1 stuck for 10s! [swapper:0] Dec 14 13:56:38 slave kernel: BUG: soft lockup - CPU#6 stuck for 14s! [kipmi1:4501] Dec 14 14:06:26 slave kernel: BUG: soft lockup - CPU#3 stuck for 10s! [kipmi1:4501] Dec 14 14:18:06 slave kernel: BUG: soft lockup - CPU#6 stuck for 12s! [kipmi1:4501] Dec 14 15:22:07 slave kernel: BUG: soft lockup - CPU#3 stuck for 20s! [kipmi1:4501] Dec 14 15:22:08 slave kernel: BUG: soft lockup - CPU#1 stuck for 19s! [swapper:0] Dec 14 18:31:36 slave kernel: BUG: soft lockup - CPU#3 stuck for 20s! [dlm_send:3864] Dec 14 18:31:36 slave kernel: BUG: soft lockup - CPU#7 stuck for 20s! [kipmi1:4501] Algum de vocês pode me sugerir uma ferramenta pra rodar testes de CPU, e ver se realmente estou com problemas? Ficaria muito grato. Obrigado. Obs: esses sistemas não são Debian, por isso o OFF-TOPIC. -- To UNSUBSCRIBE, email to [email protected] with a subject of "unsubscribe". Trouble? Contact [email protected]

