Re: Errores extraños luego de reconstruir un array

2007-05-14 Por tema Javier Terceiro

El 11/05/07, Federico Alberto Sayd [EMAIL PROTECTED] escribió:

Listas de correo de erl wrote:
 El vie, 11-05-2007 a las 10:03 -0300, Federico Alberto Sayd escribió:

 Hola a todos

 Resulta ser que tengo un servidor que funciona con samba y ldap para un
 dominio Windows. Todo funcionaba bien hasta que un disco del array por
 hardware nivel 5 que tenía dio errores. Cambié el disco y reconstruí el
 array. Cuando reinicié el booteo dio errores en el filesystem
 (reiserfs). Le pasé un fsck, reinicié y booteó normalmente. El problema
 es que luego de este pequeño problema, el servidor empezó a dar los
 siguientes problemas:

 Mi experiencia en ldap es nula aun así me aventuro a contarte mis
 impresiones por si te son de utilidad. Por lo que cuentas de tus
 problemas no parece que el error se deba al fallo de disco, mas bien
 parece una casualidad. Para mi todo apunta a ficheros de configuración
 que se han cambiado. ¿has hecho recientemente una actualización?

No, el sistema estaba andando sin tocarlo
 * El servidor ldap empezó a dar los problemas de time out.

 A veces es mas fácil detectar los problemas desde el cliente. ¿aparece
 algo en los log en el visor de sucesos?

También probé, puse el cliente en modo verbose y nada. De hecho las
consultas con ldapsearch (cliente) se realizan pero tardan mucho tiempo
(minutos). En el caso de samba daba time out.
 * Los equipos no veían bien el dominio windows (No aparecían bien en el
 entorno de red).

 Igualmente que en el punto anterior.

 * La interfaz de loopback no levantaba automáticamente, lo que me
 extraño mucho. La levanté a mano :-P

 Suena a que se ha roto algo muy malamente en la configuración de red, yo
 trataría de averiguar primero que va mal aquí.

 Después de mirar logs y logs, capturé los paquetes de la interfaz de red
 (eth0) y de loopback con wireshark (sniffer) y encontré una gran
 cantidad de paquetes con errores, todos errores de checksum:

 Checksum: 0x21b5 [incorrect, should be 0x108c (maybe caused by checksum
 offloading?)]

 Checksum offloading es una capacidad de algunas NIC para calcular ellas
 el checksum de las tramas en lugar de hacerlo el SO, no debería usarse
 wireshark[1] con ellas. Si no esta deshabilitado o no tiene esa
 capacidad, tambien se te ha roto la tarjeta de red? Otra casualidad :)

Descarté lo de la placa de red por el hecho de que los errores se veían
tanto en la captura en la interfaz loopback como en la ethernet
 Ya reinstalé el kernel, las libc6, y todos los paquetes base y los que
 no lo son también. Sin embargo el problema persiste. Alguna idea?

 En principio no veo que puede tener que ver con el problema.

Pensé en el kernel porque creo que el control de la pila tcp/ip está ahí
 Me resisto a reinstalar, quisiera agotar todas las posibilidades (además
 de saber qué pasa). Pero ya se me están acabando las ideas.

 Alguien a quién le haya pasado algo similar. Alguna idea?

 Desde ya gracias.

 
 [1] http://www.ethereal.com/lists/ethereal-users/200507/msg00242.html





--
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]




Hola,

me parece muy extraño todo lo que estás a contar a consecuencia de
tener que cambiar un disco. Yo en tu lugar miraría todas las
configuraciones y si tienes copias de seguridad (espero que si)
comprobaría que sean los mismos datos, no vaya ser que la restauración
del array haya modificado algo (aunque muy extraño!!).

La pila si está gestionada a nivel del kernel, pero no creo que sea
problema de eso, comprobaste los log`s de las aplicaciones que usas
(ldap y samba) por si dicen algo fuera de lo común.

--
Power by Debian.

A greeting,

Javier.



Re: Errores extraños luego de reconstruir un array

2007-05-11 Por tema Listas de correo de erl
El vie, 11-05-2007 a las 10:03 -0300, Federico Alberto Sayd escribió:
 Hola a todos
 
 Resulta ser que tengo un servidor que funciona con samba y ldap para un 
 dominio Windows. Todo funcionaba bien hasta que un disco del array por 
 hardware nivel 5 que tenía dio errores. Cambié el disco y reconstruí el 
 array. Cuando reinicié el booteo dio errores en el filesystem 
 (reiserfs). Le pasé un fsck, reinicié y booteó normalmente. El problema 
 es que luego de este pequeño problema, el servidor empezó a dar los 
 siguientes problemas:
Mi experiencia en ldap es nula aun así me aventuro a contarte mis
impresiones por si te son de utilidad. Por lo que cuentas de tus
problemas no parece que el error se deba al fallo de disco, mas bien
parece una casualidad. Para mi todo apunta a ficheros de configuración
que se han cambiado. ¿has hecho recientemente una actualización?
 
 * El servidor ldap empezó a dar los problemas de time out.
A veces es mas fácil detectar los problemas desde el cliente. ¿aparece
algo en los log en el visor de sucesos?
 * Los equipos no veían bien el dominio windows (No aparecían bien en el 
 entorno de red).
Igualmente que en el punto anterior.
 * La interfaz de loopback no levantaba automáticamente, lo que me 
 extraño mucho. La levanté a mano :-P
Suena a que se ha roto algo muy malamente en la configuración de red, yo
trataría de averiguar primero que va mal aquí. 
 
 Después de mirar logs y logs, capturé los paquetes de la interfaz de red 
 (eth0) y de loopback con wireshark (sniffer) y encontré una gran 
 cantidad de paquetes con errores, todos errores de checksum:
 
 Checksum: 0x21b5 [incorrect, should be 0x108c (maybe caused by checksum 
 offloading?)]
Checksum offloading es una capacidad de algunas NIC para calcular ellas
el checksum de las tramas en lugar de hacerlo el SO, no debería usarse
wireshark[1] con ellas. Si no esta deshabilitado o no tiene esa
capacidad, tambien se te ha roto la tarjeta de red? Otra casualidad :)
 
 Ya reinstalé el kernel, las libc6, y todos los paquetes base y los que 
 no lo son también. Sin embargo el problema persiste. Alguna idea?
En principio no veo que puede tener que ver con el problema. 
 
 Me resisto a reinstalar, quisiera agotar todas las posibilidades (además 
 de saber qué pasa). Pero ya se me están acabando las ideas.
 
 Alguien a quién le haya pasado algo similar. Alguna idea?
 
 Desde ya gracias.

[1] http://www.ethereal.com/lists/ethereal-users/200507/msg00242.html


-- 
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]