Hola Lista,
Tengo dos servidores virtuales:
* Debian 7 x.64 (3.2.0-4-amd64), el rol de este servidor es de hacer peticiones
TCP a otro servidor
* Nagios Profesional vAppliance (2.6.32-431.17.1.el6.x86_64) Servidor con aprox
200 dispositivos a monitorear.
Los servidores no presentan actividad normal graficadas, es decir sin picos.
Estos servidores viven en XenServer, el problema es que eventualmente se están
bloqueando y se quedan congelados, no responde ni la consola local.
Despues de forzar el reinicio de estas VM, no hay nada en sus logs que me
indiquen que sucedio, simplemente es como si desconectaras la VM o como si aun
equipo fisico le quitaras la energia. La unica pista es que cuando eso ocurre
en el XenServer veo el siguiente log:
kern.log
Jun 23 20:13:28 mega-svr-030 kernel: [11277653.712612] qla2xxx
[0000:41:00.1]-801c:5: Abort command issued nexus=5:2:2 -- 1 2002.
Jun 23 20:13:28 mega-svr-030 kernel: [11277653.712900] qla2xxx
[0000:41:00.1]-801c:5: Abort command issued nexus=5:1:3 -- 1 2002.
Jun 23 20:13:28 mega-svr-030 kernel: [11277653.713148] qla2xxx
[0000:41:00.1]-801c:5: Abort command issued nexus=5:3:2 -- 1 2002.
Jun 23 20:13:28 mega-svr-030 kernel: [11277653.713919] device-mapper:
multipath: Failing path 65:192.
Jun 23 20:13:34 mega-svr-030 kernel: [11277659.633335] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:34 mega-svr-030 kernel: [11277659.633651] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.642895] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.643140] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:6 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.643308] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:1:8 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.643464] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:1:8 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.643668] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:35 mega-svr-030 kernel: [11277660.643813] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:36 mega-svr-030 kernel: [11277661.652801] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:36 mega-svr-030 kernel: [11277661.653000] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:36 mega-svr-030 kernel: [11277661.653156] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Jun 23 20:13:36 mega-svr-030 kernel: [11277661.653302] qla2xxx
[0000:41:00.0]-801c:3: Abort command issued nexus=3:0:2 -- 1 2002.
Se me ocurre actualizar el kernel de mis VM, pero antes de hacerlo quisiera
saber si alguien puede ayudarme a diagnosticar el problema o hacerme llegar
alguna recomendacion o mejor practica.
Gracias!
--
To UNSUBSCRIBE, email to [email protected]
with a subject of "unsubscribe". Trouble? Contact [email protected]
Archive: https://lists.debian.org/[email protected]