EDAC mensajes de alerta
Estimados, hace unas 2 semanas se mostraba en los logs algunas lineas sobre EDAC e752x.. busque en google y aparentemente era algo referente a la memoria... reinicie el servidor y ejecute memtest durante unas 18 horas y no presento ninguna variación/error. hoy, revisando los logs, me encuentro con las mismas lineas en los registros: = Jul 10 08:59:22 bacula kernel: [828050.517836] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:22 bacula kernel: [828050.517844] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:22 bacula kernel: [828050.517849] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:22 bacula kernel: [828050.517855] EDAC e752x: Test computed row 8 Jul 10 08:59:22 bacula kernel: [828050.517857] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:22 bacula kernel: [828050.517863] EDAC MC0: CE page 0x3272, offset 0xd40, grain 0, syndrome 0x400, row 1, channel 1, label : e752x CE Jul 10 08:59:22 bacula kernel: [828050.517868] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:22 bacula kernel: [828050.517871] EDAC e752x: Test computed row 8 Jul 10 08:59:22 bacula kernel: [828050.517876] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:22 bacula kernel: [828050.517880] EDAC MC0: CE page 0x3272, offset 0xd40, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE Jul 10 08:59:45 bacula kernel: [828073.499505] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:45 bacula kernel: [828073.499513] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:45 bacula kernel: [828073.499519] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:45 bacula kernel: [828073.499524] EDAC e752x: Test computed row 8 Jul 10 08:59:45 bacula kernel: [828073.499527] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:45 bacula kernel: [828073.499533] EDAC MC0: CE page 0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE Jul 10 08:59:45 bacula kernel: [828073.499538] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:45 bacula kernel: [828073.499541] EDAC e752x: Test computed row 8 Jul 10 08:59:45 bacula kernel: [828073.499545] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:45 bacula kernel: [828073.499549] EDAC MC0: CE page 0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE = ... alguna idea ??? la parte del Non-Fatal me tranquiliza un poco, pero no me gusta para nada que aparezcan estes mensajes asi de la nada. el servidor es un SuperMicro (SUPER SERVER SYS-7044H-TRB 4U) con 8G de RAM y este es el estado actual: = $ free total used free sharedbuffers cached Mem: 83111488018752 292396 0 645447779780 -/+ buffers/cache: 1744288136720 Swap: 10485683601048208 = top - 09:27:21 up 9 days, 14:44, 2 users, load average: 0.00, 0.01, 0.00 Tasks: 72 total, 1 running, 71 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0%us, 0.2%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 8311148k total, 8018776k used, 292372k free,64524k buffers Swap: 1048568k total, 360k used, 1048208k free, 7779776k cached PID USER PR NI VIRT RES SHR S %CPU %MEMTIME+ COMMAND 4862 postgres 20 0 38760 25m 25m S0 0.3 0:30.05 postgres: writer process 505 root 20 0 11136 4696 2932 S0 0.1 0:00.14 sshd: victor [priv] 3825 root 20 0 11136 4696 2932 S0 0.1 0:00.14 sshd: victor [priv] 4859 postgres 20 0 38632 4496 3964 S0 0.1 0:03.06 /usr/lib/postgresql/8.2/bin/postgres -D /var/lib/postgresql/8.2/main -c config_file=/etc/postgr 5006 bacula20 0 51784 4436 2680 S0 0.1 1:07.06 /usr/sbin/bacula-dir -c /etc/bacula/bacula-dir.conf -u bacula -g bacula 4879 snmp 20 0 8788 4124 2440 S0 0.0 2:06.51 /usr/sbin/snmpd -Lsd -Lf /dev/null -u snmp -I -smux -p /var/run/snmpd.pid 0.0.0.0 4744 root 20 0 109m 3548 1820 S0 0.0 0:01.64 /usr/sbin/nscd [...] = $ uname -a Linux bacula 2.6.24-18-server #1 SMP Wed May 28 21:25:52 UTC 2008 i686 GNU/Linux = y el sistema tiene todos los parches al dia .. bueno.. bueno.. hoy acabo de instalar la version 2.6.24.19 del kernel !!! pero estuve mirando los cambios de versión y ninguno hace referencia a memoria o algo relacioando !!! en este enlace, hay un problema semejante y aparentemente con la misma configuracion que tengo.. http://readlist.com/lists/vger.kernel.org/linux-kernel/56/282465.html pero no hay respuestas.. y en mi caso (como no uso swap) no se reinicia !!! ;-) la distro es ubuntu-server y en la maquina (como se muestra en la salida de top) correr simplemente bacula (director+storage) + postgres y unas cositas mas basicas (snmp, ssh, etc,etc). la maquina tiene
EDAC mensajes de alerta
- Mensaje original De: Victor Hugo dos Santos [EMAIL PROTECTED] Para: Discusion de Linux en Castellano linux@listas.inf.utfsm.cl Enviado: jueves, 10 de julio, 2008 9:58:16 Asunto: EDAC mensajes de alerta Estimados, hace unas 2 semanas se mostraba en los logs algunas lineas sobre EDAC e752x.. busque en google y aparentemente era algo referente a la memoria... reinicie el servidor y ejecute memtest durante unas 18 horas y no presento ninguna variación/error. hoy, revisando los logs, me encuentro con las mismas lineas en los registros: = Jul 10 08:59:22 bacula kernel: [828050.517836] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:22 bacula kernel: [828050.517844] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:22 bacula kernel: [828050.517849] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:22 bacula kernel: [828050.517855] EDAC e752x: Test computed row 8 Jul 10 08:59:22 bacula kernel: [828050.517857] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:22 bacula kernel: [828050.517863] EDAC MC0: CE page 0x3272, offset 0xd40, grain 0, syndrome 0x400, row 1, channel 1, label : e752x CE Jul 10 08:59:22 bacula kernel: [828050.517868] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:22 bacula kernel: [828050.517871] EDAC e752x: Test computed row 8 Jul 10 08:59:22 bacula kernel: [828050.517876] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:22 bacula kernel: [828050.517880] EDAC MC0: CE page 0x3272, offset 0xd40, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE Jul 10 08:59:45 bacula kernel: [828073.499505] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:45 bacula kernel: [828073.499513] EDAC e752x: Non-Fatal Error DRAM Controler Jul 10 08:59:45 bacula kernel: [828073.499519] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:45 bacula kernel: [828073.499524] EDAC e752x: Test computed row 8 Jul 10 08:59:45 bacula kernel: [828073.499527] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:45 bacula kernel: [828073.499533] EDAC MC0: CE page 0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE Jul 10 08:59:45 bacula kernel: [828073.499538] EDAC e752x: Test row 1 Table 0 255 2 255 4 255 6 255 Jul 10 08:59:45 bacula kernel: [828073.499541] EDAC e752x: Test computed row 8 Jul 10 08:59:45 bacula kernel: [828073.499545] EDAC e752x MC0: row 1 not found in remap table Jul 10 08:59:45 bacula kernel: [828073.499549] EDAC MC0: CE page 0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1, label : e752x CE = ... alguna idea ??? la parte del Non-Fatal me tranquiliza un poco, pero no me gusta para nada que aparezcan estes mensajes asi de la nada. el servidor es un SuperMicro (SUPER SERVER SYS-7044H-TRB 4U) con 8G de RAM y este es el estado actual: = $ free total used free sharedbuffers cached Mem: 83111488018752 292396 0 645447779780 -/+ buffers/cache: 1744288136720 Swap: 10485683601048208 = top - 09:27:21 up 9 days, 14:44, 2 users, load average: 0.00, 0.01, 0.00 Tasks: 72 total, 1 running, 71 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0%us, 0.2%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 8311148k total, 8018776k used, 292372k free,64524k buffers Swap: 1048568k total, 360k used, 1048208k free, 7779776k cached PID USER PR NI VIRT RES SHR S %CPU %MEMTIME+ COMMAND 4862 postgres 20 0 38760 25m 25m S0 0.3 0:30.05 postgres: writer process 505 root 20 0 11136 4696 2932 S0 0.1 0:00.14 sshd: victor [priv] 3825 root 20 0 11136 4696 2932 S0 0.1 0:00.14 sshd: victor [priv] 4859 postgres 20 0 38632 4496 3964 S0 0.1 0:03.06 /usr/lib/postgresql/8.2/bin/postgres -D /var/lib/postgresql/8.2/main -c config_file=/etc/postgr 5006 bacula20 0 51784 4436 2680 S0 0.1 1:07.06 /usr/sbin/bacula-dir -c /etc/bacula/bacula-dir.conf -u bacula -g bacula 4879 snmp 20 0 8788 4124 2440 S0 0.0 2:06.51 /usr/sbin/snmpd -Lsd -Lf /dev/null -u snmp -I -smux -p /var/run/snmpd.pid 0.0.0.0 4744 root 20 0 109m 3548 1820 S0 0.0 0:01.64 /usr/sbin/nscd [...] = $ uname -a Linux bacula 2.6.24-18-server #1 SMP Wed May 28 21:25:52 UTC 2008 i686 GNU/Linux = y el sistema tiene todos los parches al dia .. bueno.. bueno.. hoy acabo de instalar la version 2.6.24.19 del kernel !!! pero estuve mirando los cambios de versión y ninguno hace referencia a memoria o algo relacioando !!! -- Estimado No soy muy entendido en estos temas de hardware, pero de lo que haz puesto me parece que el error se esta dando a nivel de verificacion de paridad en las memorias. que tipo de test hiciste? se verifico o es posible
DNS bug
Estimados: Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco sobre problemas que afectan a la mayoria de los servicios DNS. El boletin de la US-CERT: http://www.kb.cert.org/vuls/id/800113 El dia 8/julio/2008 MS publico: http://support.microsoft.com/kb/953230 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 libero parches el mismo dia 8/7/2008: https://rhn.redhat.com/errata/RHSA-2008-0533.html Me parece raro que nadie por estos lares hubiese comentado el hecho. Saludos! -- Atte. Ricardo Utreras Estrella From [EMAIL PROTECTED] Thu Jul 10 12:12:46 2008 From: [EMAIL PROTECTED] (Hector Gatica) Date: Thu Jul 10 12:15:01 2008 Subject: DNS bug In-Reply-To: [EMAIL PROTECTED] References: [EMAIL PROTECTED] Message-ID: [EMAIL PROTECTED] On Thu, 10 Jul 2008 11:11:15 -0400, Ricardo Utreras Estrella [EMAIL PROTECTED] wrote: Estimados: Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco sobre problemas que afectan a la mayoria de los servicios DNS. El boletin de la US-CERT: http://www.kb.cert.org/vuls/id/800113 El dia 8/julio/2008 MS publico: http://support.microsoft.com/kb/953230 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 libero parches el mismo dia 8/7/2008: https://rhn.redhat.com/errata/RHSA-2008-0533.html Me parece raro que nadie por estos lares hubiese comentado el hecho. Saludos! -- Atte. Ricardo Utreras Estrella Vi en un update de Debian que actualizaba bind (ayer o antes de ayer), debe ser por eso. Extraño sería que no estuviesen las actualizaciones. Saludos. -- Informatica Bio-Bio Comunicaciones S.A Administrador de Redes Fono : 09-1523359
DNS bug
Hector Gatica escribió: On Thu, 10 Jul 2008 11:11:15 -0400, Ricardo Utreras Estrella [EMAIL PROTECTED] wrote: Estimados: Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco sobre problemas que afectan a la mayoria de los servicios DNS. El boletin de la US-CERT: http://www.kb.cert.org/vuls/id/800113 El dia 8/julio/2008 MS publico: http://support.microsoft.com/kb/953230 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 libero parches el mismo dia 8/7/2008: https://rhn.redhat.com/errata/RHSA-2008-0533.html Me parece raro que nadie por estos lares hubiese comentado el hecho. Saludos! -- Atte. Ricardo Utreras Estrella Vi en un update de Debian que actualizaba bind (ayer o antes de ayer), debe ser por eso. Extraño sería que no estuviesen las actualizaciones. Saludos. Yep. Para quienes quieran chequear sus DNS: http://doxpara.com/ Saludos -- Atte. Ricardo Utreras Estrella From [EMAIL PROTECTED] Thu Jul 10 12:04:24 2008 From: [EMAIL PROTECTED] (Marcelo Mujica) Date: Thu Jul 10 12:44:01 2008 Subject: DNS bug In-Reply-To: [EMAIL PROTECTED] References: [EMAIL PROTECTED] Message-ID: [EMAIL PROTECTED] Estimados: Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco sobre problemas que afectan a la mayoria de los servicios DNS. El boletin de la US-CERT: http://www.kb.cert.org/vuls/id/800113 El dia 8/julio/2008 MS publico: http://support.microsoft.com/kb/953230 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 libero parches el mismo dia 8/7/2008: https://rhn.redhat.com/errata/RHSA-2008-0533.html Me parece raro que nadie por estos lares hubiese comentado el hecho. Saludos! Es un error de la mayoria de las implementaciones DNS Segun Dan Kaminsky (Quien investiga el problema) se estaría corrigiendo en forma secreta para luego ditribuir parches en forma coordinada. Mas detalles en http://www.doxpara.com/ Saludos From [EMAIL PROTECTED] Thu Jul 10 14:46:27 2008 From: [EMAIL PROTECTED] (Marcos Ramirez) Date: Thu Jul 10 15:25:17 2008 Subject: EDAC mensajes de alerta In-Reply-To: [EMAIL PROTECTED] References: [EMAIL PROTECTED] Message-ID: [EMAIL PROTECTED] On Thu, 2008-07-10 at 09:58 -0400, Victor Hugo dos Santos wrote: Estimados, hace unas 2 semanas se mostraba en los logs algunas lineas sobre EDAC e752x.. busque en google y aparentemente era algo referente a la memoria... reinicie el servidor y ejecute memtest durante unas 18 horas y no presento ninguna variación/error. Nunca se me ha presentado el error que mencionas, pero quiza te sirva esta pagina http://kbase.redhat.com/faq/FAQ_85_7898.shtm Podrias tratar de determinar si tienes un falso positivo antes de considerar ocultar los mensajes de error y/o cambiar el hardware. Saludos -- Marcos Ramirez [EMAIL PROTECTED]
DNS bug
Marcelo Mujica escribió: Estimados: Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco sobre problemas que afectan a la mayoria de los servicios DNS. El boletin de la US-CERT: http://www.kb.cert.org/vuls/id/800113 El dia 8/julio/2008 MS publico: http://support.microsoft.com/kb/953230 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 libero parches el mismo dia 8/7/2008: https://rhn.redhat.com/errata/RHSA-2008-0533.html Me parece raro que nadie por estos lares hubiese comentado el hecho. Saludos! Es un error de la mayoria de las implementaciones DNS Segun Dan Kaminsky (Quien investiga el problema) se estaría corrigiendo en forma secreta para luego ditribuir parches en forma coordinada. Mas detalles en http://www.doxpara.com/ Saludos Yep, pero segun tengo entendido los parches actuales lo unico que hacen en aleatorizar (¿asi se dice?) el puerto en la comunicacion servidor-cliente. Por lo pronto mis DNS con RHEL4 ya los actualice con el parche de redhat: bind-9.2.4-28.0.1.el4 Saludos! -- Atte. Ricardo Utreras From [EMAIL PROTECTED] Fri Jul 11 17:48:37 2008 From: [EMAIL PROTECTED] (Marcelo Mujica) Date: Fri Jul 11 17:49:59 2008 Subject: =?utf-8?q?Tr=C3=A1fico?= Message-ID: [EMAIL PROTECTED] Será que mi MTA vale hongo o es que estan muy callados?...o me echaron por 0 aporte? Saludos From [EMAIL PROTECTED] Fri Jul 11 17:57:58 2008 From: [EMAIL PROTECTED] (Larry Letelier N.) Date: Fri Jul 11 17:58:03 2008 Subject: =?iso-8859-1?q?Re=3A_Tr=E1fico?= In-Reply-To: [EMAIL PROTECTED] References: [EMAIL PROTECTED] Message-ID: [EMAIL PROTECTED] El día 11 de julio de 2008 17:48, Marcelo Mujica [EMAIL PROTECTED] escribió: Será que mi MTA vale hongo o es que estan muy callados?...o me echaron por 0 aporte? Saludos WTF! -- Larry Letelier N. [EMAIL PROTECTED] [EMAIL PROTECTED] From [EMAIL PROTECTED] Fri Jul 11 18:20:21 2008 From: [EMAIL PROTECTED] (Renato Covarrubias Romero) Date: Fri Jul 11 18:20:53 2008 Subject: =?utf-8?q?Tr=C3=A1fico?= In-Reply-To: [EMAIL PROTECTED] References: [EMAIL PROTECTED] Message-ID: [EMAIL PROTECTED] El Vie 11 Jul 2008, Marcelo Mujica escribió: Será que mi MTA vale hongo o es que estan muy callados?...o me echaron por 0 aporte? Si, tu correo es cero aporte. Lamentablemente ya no hay nada que hacer al respecto. ;) Te ganaras el odio de muchos, pero bueno Si piensas que no recibes todo lo que se envía a la lista, visita: http://listas.inf.utfsm.cl/pipermail/linux/ Eso -- Renato Covarrubias Romero - counter.li.org #399677 rcovarru [at] alumnos.inf.utfsm.cl http://rnt.bla.cl Estudiante Ingenieria Civil Informatica, Casa Central, UTFSM.