EDAC mensajes de alerta

2008-07-10 Por tema Victor Hugo dos Santos
Estimados,

hace unas 2  semanas se mostraba en los logs algunas lineas sobre EDAC e752x..
busque en google y aparentemente era algo referente a la memoria...
reinicie el servidor y ejecute memtest durante unas 18 horas y no
presento ninguna variación/error.

hoy, revisando los logs, me encuentro con las mismas lineas en los registros:

=
Jul 10 08:59:22 bacula kernel: [828050.517836] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:22 bacula kernel: [828050.517844] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:22 bacula kernel: [828050.517849] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:22 bacula kernel: [828050.517855] EDAC e752x: Test computed row 8
Jul 10 08:59:22 bacula kernel: [828050.517857] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:22 bacula kernel: [828050.517863] EDAC MC0: CE page
0x3272, offset 0xd40, grain 0, syndrome 0x400, row 1, channel 1, label
: e752x CE
Jul 10 08:59:22 bacula kernel: [828050.517868] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:22 bacula kernel: [828050.517871] EDAC e752x: Test computed row 8
Jul 10 08:59:22 bacula kernel: [828050.517876] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:22 bacula kernel: [828050.517880] EDAC MC0: CE page
0x3272, offset 0xd40, grain 0, syndrome 0x500, row 1, channel 1, label
: e752x CE
Jul 10 08:59:45 bacula kernel: [828073.499505] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:45 bacula kernel: [828073.499513] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:45 bacula kernel: [828073.499519] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:45 bacula kernel: [828073.499524] EDAC e752x: Test computed row 8
Jul 10 08:59:45 bacula kernel: [828073.499527] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:45 bacula kernel: [828073.499533] EDAC MC0: CE page
0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1,
label : e752x CE
Jul 10 08:59:45 bacula kernel: [828073.499538] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:45 bacula kernel: [828073.499541] EDAC e752x: Test computed row 8
Jul 10 08:59:45 bacula kernel: [828073.499545] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:45 bacula kernel: [828073.499549] EDAC MC0: CE page
0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1,
label : e752x CE
=

... alguna idea ??? la parte del Non-Fatal me tranquiliza un
poco, pero no me gusta para nada que aparezcan estes mensajes asi de
la nada.

el servidor es un SuperMicro (SUPER SERVER SYS-7044H-TRB 4U) con 8G de
RAM y este es el estado actual:

=
$ free
 total   used   free sharedbuffers cached
Mem:   83111488018752 292396  0  645447779780
-/+ buffers/cache: 1744288136720
Swap:  10485683601048208

=
top - 09:27:21 up 9 days, 14:44,  2 users,  load average: 0.00, 0.01, 0.00
Tasks:  72 total,   1 running,  71 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.0%us,  0.2%sy,  0.0%ni, 99.8%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8311148k total,  8018776k used,   292372k free,64524k buffers
Swap:  1048568k total,  360k used,  1048208k free,  7779776k cached

  PID USER  PR  NI  VIRT  RES  SHR S %CPU %MEMTIME+  COMMAND
 4862 postgres  20   0 38760  25m  25m S0  0.3   0:30.05 postgres:
writer process
  505 root  20   0 11136 4696 2932 S0  0.1   0:00.14 sshd:
victor [priv]
 3825 root  20   0 11136 4696 2932 S0  0.1   0:00.14 sshd:
victor [priv]
 4859 postgres  20   0 38632 4496 3964 S0  0.1   0:03.06
/usr/lib/postgresql/8.2/bin/postgres -D /var/lib/postgresql/8.2/main
-c config_file=/etc/postgr
 5006 bacula20   0 51784 4436 2680 S0  0.1   1:07.06
/usr/sbin/bacula-dir -c /etc/bacula/bacula-dir.conf -u bacula -g
bacula
 4879 snmp  20   0  8788 4124 2440 S0  0.0   2:06.51
/usr/sbin/snmpd -Lsd -Lf /dev/null -u snmp -I -smux -p
/var/run/snmpd.pid 0.0.0.0
 4744 root  20   0  109m 3548 1820 S0  0.0   0:01.64 /usr/sbin/nscd
[...]

=
$ uname -a
Linux bacula 2.6.24-18-server #1 SMP Wed May 28 21:25:52 UTC 2008 i686 GNU/Linux

=

y el sistema tiene todos los parches al dia .. bueno.. bueno.. hoy
acabo de instalar la version 2.6.24.19 del kernel !!!
pero estuve mirando los cambios de versión y ninguno hace referencia a
memoria o algo relacioando !!!

en este enlace, hay un problema semejante y aparentemente con la misma
configuracion que tengo..
http://readlist.com/lists/vger.kernel.org/linux-kernel/56/282465.html
pero no hay respuestas.. y en mi caso (como no uso swap) no se reinicia !!! ;-)

la distro es ubuntu-server y en la maquina (como se muestra en la
salida de top) correr simplemente bacula (director+storage) + postgres
y unas cositas mas basicas (snmp, ssh, etc,etc).
la maquina tiene 

EDAC mensajes de alerta

2008-07-10 Por tema Christian Montero Hernández
- Mensaje original 

De: Victor Hugo dos Santos [EMAIL PROTECTED]
Para: Discusion de Linux en Castellano linux@listas.inf.utfsm.cl
Enviado: jueves, 10 de julio, 2008 9:58:16
Asunto: EDAC mensajes de alerta

Estimados,

hace unas 2  semanas se mostraba en los logs algunas lineas sobre EDAC e752x..
busque en google y aparentemente era algo referente a la memoria...
reinicie el servidor y ejecute memtest durante unas 18 horas y no
presento ninguna variación/error.

hoy, revisando los logs, me encuentro con las mismas lineas en los registros:

=
Jul 10 08:59:22 bacula kernel: [828050.517836] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:22 bacula kernel: [828050.517844] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:22 bacula kernel: [828050.517849] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:22 bacula kernel: [828050.517855] EDAC e752x: Test computed row 8
Jul 10 08:59:22 bacula kernel: [828050.517857] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:22 bacula kernel: [828050.517863] EDAC MC0: CE page
0x3272, offset 0xd40, grain 0, syndrome 0x400, row 1, channel 1, label
: e752x CE
Jul 10 08:59:22 bacula kernel: [828050.517868] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:22 bacula kernel: [828050.517871] EDAC e752x: Test computed row 8
Jul 10 08:59:22 bacula kernel: [828050.517876] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:22 bacula kernel: [828050.517880] EDAC MC0: CE page
0x3272, offset 0xd40, grain 0, syndrome 0x500, row 1, channel 1, label
: e752x CE
Jul 10 08:59:45 bacula kernel: [828073.499505] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:45 bacula kernel: [828073.499513] EDAC e752x: Non-Fatal
Error DRAM Controler
Jul 10 08:59:45 bacula kernel: [828073.499519] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:45 bacula kernel: [828073.499524] EDAC e752x: Test computed row 8
Jul 10 08:59:45 bacula kernel: [828073.499527] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:45 bacula kernel: [828073.499533] EDAC MC0: CE page
0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1,
label : e752x CE
Jul 10 08:59:45 bacula kernel: [828073.499538] EDAC e752x: Test row 1
Table 0 255 2 255 4 255 6 255
Jul 10 08:59:45 bacula kernel: [828073.499541] EDAC e752x: Test computed row 8
Jul 10 08:59:45 bacula kernel: [828073.499545] EDAC e752x MC0: row 1
not found in remap table
Jul 10 08:59:45 bacula kernel: [828073.499549] EDAC MC0: CE page
0x103f92, offset 0x100, grain 0, syndrome 0x500, row 1, channel 1,
label : e752x CE
=

... alguna idea ??? la parte del Non-Fatal me tranquiliza un
poco, pero no me gusta para nada que aparezcan estes mensajes asi de
la nada.

el servidor es un SuperMicro (SUPER SERVER SYS-7044H-TRB 4U) con 8G de
RAM y este es el estado actual:

=
$ free
 total   used   free sharedbuffers cached
Mem:   83111488018752 292396  0  645447779780
-/+ buffers/cache: 1744288136720
Swap:  10485683601048208

=
top - 09:27:21 up 9 days, 14:44,  2 users,  load average: 0.00, 0.01, 0.00
Tasks:  72 total,   1 running,  71 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.0%us,  0.2%sy,  0.0%ni, 99.8%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8311148k total,  8018776k used,   292372k free,64524k buffers
Swap:  1048568k total,  360k used,  1048208k free,  7779776k cached

  PID USER  PR  NI  VIRT  RES  SHR S %CPU %MEMTIME+  COMMAND
4862 postgres  20   0 38760  25m  25m S0  0.3   0:30.05 postgres:
writer process
  505 root  20   0 11136 4696 2932 S0  0.1   0:00.14 sshd:
victor [priv]
3825 root  20   0 11136 4696 2932 S0  0.1   0:00.14 sshd:
victor [priv]
4859 postgres  20   0 38632 4496 3964 S0  0.1   0:03.06
/usr/lib/postgresql/8.2/bin/postgres -D /var/lib/postgresql/8.2/main
-c config_file=/etc/postgr
5006 bacula20   0 51784 4436 2680 S0  0.1   1:07.06
/usr/sbin/bacula-dir -c /etc/bacula/bacula-dir.conf -u bacula -g
bacula
4879 snmp  20   0  8788 4124 2440 S0  0.0   2:06.51
/usr/sbin/snmpd -Lsd -Lf /dev/null -u snmp -I -smux -p
/var/run/snmpd.pid 0.0.0.0
4744 root  20   0  109m 3548 1820 S0  0.0   0:01.64 /usr/sbin/nscd
[...]

=
$ uname -a
Linux bacula 2.6.24-18-server #1 SMP Wed May 28 21:25:52 UTC 2008 i686 GNU/Linux

=

y el sistema tiene todos los parches al dia .. bueno.. bueno.. hoy
acabo de instalar la version 2.6.24.19 del kernel !!!
pero estuve mirando los cambios de versión y ninguno hace referencia a
memoria o algo relacioando !!!
--

Estimado 

No soy muy entendido en estos temas de hardware, pero de lo que haz puesto me 
parece que el error se esta dando a nivel de verificacion de paridad en las 
memorias.
que tipo de test hiciste? se verifico o es posible 

DNS bug

2008-07-10 Por tema Ricardo Utreras Estrella
Estimados:

Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco 
sobre problemas que afectan a la mayoria de los servicios DNS.

El boletin de la US-CERT:
http://www.kb.cert.org/vuls/id/800113

El dia 8/julio/2008 MS publico:
http://support.microsoft.com/kb/953230

Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 
libero parches el mismo dia 8/7/2008:
https://rhn.redhat.com/errata/RHSA-2008-0533.html

Me parece raro que nadie por estos lares hubiese comentado el hecho.

Saludos!

--
Atte. Ricardo Utreras Estrella
From [EMAIL PROTECTED]  Thu Jul 10 12:12:46 2008
From: [EMAIL PROTECTED] (Hector Gatica)
Date: Thu Jul 10 12:15:01 2008
Subject: DNS bug
In-Reply-To: [EMAIL PROTECTED]
References: [EMAIL PROTECTED]
Message-ID: [EMAIL PROTECTED]

On Thu, 10 Jul 2008 11:11:15 -0400, Ricardo Utreras Estrella
[EMAIL PROTECTED] wrote:
 Estimados:
 
 Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco
 sobre problemas que afectan a la mayoria de los servicios DNS.
 
 El boletin de la US-CERT:
 http://www.kb.cert.org/vuls/id/800113
 
 El dia 8/julio/2008 MS publico:
 http://support.microsoft.com/kb/953230
 
 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5
 libero parches el mismo dia 8/7/2008:
 https://rhn.redhat.com/errata/RHSA-2008-0533.html
 
 Me parece raro que nadie por estos lares hubiese comentado el hecho.
 
 Saludos!
 
 --
 Atte. Ricardo Utreras Estrella

Vi en un update de Debian que actualizaba bind (ayer o antes de ayer), debe
ser por eso.
Extraño sería que no estuviesen las actualizaciones.

Saludos.

-- 
Informatica Bio-Bio Comunicaciones S.A
Administrador de Redes
Fono : 09-1523359


DNS bug

2008-07-10 Por tema Ricardo Utreras Estrella
Hector Gatica escribió:
 On Thu, 10 Jul 2008 11:11:15 -0400, Ricardo Utreras Estrella
 [EMAIL PROTECTED] wrote:
 Estimados:

 Desde el dia de ayer a traves de diversos foros y blogs se ha hecho eco
 sobre problemas que afectan a la mayoria de los servicios DNS.

 El boletin de la US-CERT:
 http://www.kb.cert.org/vuls/id/800113

 El dia 8/julio/2008 MS publico:
 http://support.microsoft.com/kb/953230

 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5
 libero parches el mismo dia 8/7/2008:
 https://rhn.redhat.com/errata/RHSA-2008-0533.html

 Me parece raro que nadie por estos lares hubiese comentado el hecho.

 Saludos!

 --
 Atte. Ricardo Utreras Estrella
 
 Vi en un update de Debian que actualizaba bind (ayer o antes de ayer), debe
 ser por eso.
 Extraño sería que no estuviesen las actualizaciones.
 
 Saludos.
 

Yep. Para quienes quieran chequear sus DNS:
http://doxpara.com/

Saludos

--
Atte. Ricardo Utreras Estrella
From [EMAIL PROTECTED]  Thu Jul 10 12:04:24 2008
From: [EMAIL PROTECTED] (Marcelo Mujica)
Date: Thu Jul 10 12:44:01 2008
Subject: DNS bug
In-Reply-To: [EMAIL PROTECTED]
References: [EMAIL PROTECTED]
Message-ID: [EMAIL PROTECTED]


 Estimados:

 Desde el dia de ayer a traves de diversos foros y blogs se ha hecho 
 eco sobre problemas que afectan a la mayoria de los servicios DNS.

 El boletin de la US-CERT:
 http://www.kb.cert.org/vuls/id/800113

 El dia 8/julio/2008 MS publico:
 http://support.microsoft.com/kb/953230

 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 
 libero parches el mismo dia 8/7/2008:
 https://rhn.redhat.com/errata/RHSA-2008-0533.html

 Me parece raro que nadie por estos lares hubiese comentado el hecho.

 Saludos!

Es un error de la mayoria de las implementaciones DNS
Segun Dan Kaminsky (Quien investiga el problema)  se estaría corrigiendo 
en forma  secreta para luego ditribuir parches en forma coordinada.
Mas detalles en http://www.doxpara.com/

Saludos
From [EMAIL PROTECTED]  Thu Jul 10 14:46:27 2008
From: [EMAIL PROTECTED] (Marcos Ramirez)
Date: Thu Jul 10 15:25:17 2008
Subject: EDAC mensajes de alerta
In-Reply-To: [EMAIL PROTECTED]
References: [EMAIL PROTECTED]
Message-ID: [EMAIL PROTECTED]

On Thu, 2008-07-10 at 09:58 -0400, Victor Hugo dos Santos wrote:
 Estimados,
 
 hace unas 2  semanas se mostraba en los logs algunas lineas sobre EDAC 
 e752x..
 busque en google y aparentemente era algo referente a la memoria...
 reinicie el servidor y ejecute memtest durante unas 18 horas y no
 presento ninguna variación/error.

Nunca se me ha presentado el error que mencionas, pero quiza te sirva
esta pagina http://kbase.redhat.com/faq/FAQ_85_7898.shtm

Podrias tratar de determinar si tienes un falso positivo antes de
considerar ocultar los mensajes de error y/o cambiar el hardware.

Saludos
-- 
Marcos Ramirez [EMAIL PROTECTED]





DNS bug

2008-07-10 Por tema Ricardo Utreras Estrella
Marcelo Mujica escribió:
 
 Estimados:

 Desde el dia de ayer a traves de diversos foros y blogs se ha hecho 
 eco sobre problemas que afectan a la mayoria de los servicios DNS.

 El boletin de la US-CERT:
 http://www.kb.cert.org/vuls/id/800113

 El dia 8/julio/2008 MS publico:
 http://support.microsoft.com/kb/953230

 Redhat para sus versiones Red Hat Enterprise Linux 2.1, 3, 4, and 5 
 libero parches el mismo dia 8/7/2008:
 https://rhn.redhat.com/errata/RHSA-2008-0533.html

 Me parece raro que nadie por estos lares hubiese comentado el hecho.

 Saludos!

 Es un error de la mayoria de las implementaciones DNS
 Segun Dan Kaminsky (Quien investiga el problema)  se estaría corrigiendo 
 en forma  secreta para luego ditribuir parches en forma coordinada.
 Mas detalles en http://www.doxpara.com/
 
 Saludos

Yep, pero segun tengo entendido los parches actuales lo unico que hacen 
en aleatorizar (¿asi se dice?) el puerto en la comunicacion 
servidor-cliente.
Por lo pronto mis DNS con RHEL4 ya los actualice con el parche de 
redhat: bind-9.2.4-28.0.1.el4

Saludos!
--
Atte. Ricardo Utreras
From [EMAIL PROTECTED]  Fri Jul 11 17:48:37 2008
From: [EMAIL PROTECTED] (Marcelo Mujica)
Date: Fri Jul 11 17:49:59 2008
Subject: =?utf-8?q?Tr=C3=A1fico?=
Message-ID: [EMAIL PROTECTED]

Será que mi MTA vale hongo o es que estan muy callados?...o me echaron 
por 0 aporte?

Saludos
From [EMAIL PROTECTED]  Fri Jul 11 17:57:58 2008
From: [EMAIL PROTECTED] (Larry Letelier N.)
Date: Fri Jul 11 17:58:03 2008
Subject: =?iso-8859-1?q?Re=3A_Tr=E1fico?=
In-Reply-To: [EMAIL PROTECTED]
References: [EMAIL PROTECTED]
Message-ID: [EMAIL PROTECTED]

El día 11 de julio de 2008 17:48, Marcelo Mujica 
[EMAIL PROTECTED] escribió:

 Será que mi MTA vale hongo o es que estan muy callados?...o me echaron por
 0 aporte?

 Saludos



WTF!


-- 

Larry Letelier N.
[EMAIL PROTECTED]
[EMAIL PROTECTED]
From [EMAIL PROTECTED]  Fri Jul 11 18:20:21 2008
From: [EMAIL PROTECTED] (Renato Covarrubias Romero)
Date: Fri Jul 11 18:20:53 2008
Subject: =?utf-8?q?Tr=C3=A1fico?=
In-Reply-To: [EMAIL PROTECTED]
References: [EMAIL PROTECTED]
Message-ID: [EMAIL PROTECTED]

El Vie 11 Jul 2008, Marcelo Mujica escribió:
 Será que mi MTA vale hongo o es que estan muy callados?...o me echaron
 por 0 aporte?

Si, tu correo es cero aporte. Lamentablemente ya no hay nada que hacer al 
respecto. ;)
Te ganaras el odio de muchos, pero bueno

Si piensas que no recibes todo lo que se envía a la lista, visita:
http://listas.inf.utfsm.cl/pipermail/linux/

Eso

-- 
Renato Covarrubias Romero   -   counter.li.org  #399677
rcovarru [at] alumnos.inf.utfsm.cl  http://rnt.bla.cl
Estudiante Ingenieria Civil Informatica, Casa Central, UTFSM.