Re: ip_conntrack, límite de contadores, y kernel 2.4.24

2004-03-21 Por tema José Luis Tallón
At 10:38 21/03/2004, you wrote:
Content-Type: text/plain; charset=
Hola,
Necesito saber si alguien ha tenido un problema con el kernel
(específicamente las series 2.4) y si han tenido alguna solución, les
narro el asunto...
No me ha pasado.
Tengo un servidor que hace de Router con Debian woody stable, gcc
2.95.4, kernel 2.4.24, procesador Intel Petium IV (dual), 512 RAM, NIC
D-Link. El kernel 2.4.24 usuado es el obtenido en kernel.org, lo que ya
he notado es que cada cierto tiempo (aproximadamente entre 8 a 10 días),
el equipo genera un mensaje:
No entiendo... 2 procesadores Pentium4 (espero que sean Xeon), con sólo 
512MB de memoria, y una NIC de $10 ???
Yo usaría una ( ó dos ) Intel e100, al menos.
Para qué tanta potencia de cálculo?? qué servicios presta esa máquina ?

Mar 17 10:13:23 blackmarsh kernel: LIST_DELETE: ip_conntrack_core.c:302
`ct-tuplehash[IP_CT_DIR_REPLY]'(ddf5c414) not in
ip_conntrack_hash[hr].
Después de ello queda completamente congelado y no hace nada, la única
solución es darle reset. Ahora esta situación ha ocurrido en tres
oportunidades y siempre ha sido justo cuando los contadores de
transmisión de paquetes TX o los contadores de recepción de paquetes RX
de la NIC estaban alcanzando el límite (un número bastante grande).
Como dato adicional el tráfico manejado por este equipo es bastante
grande. Por ahora tengo una solución por ortodoxa, y dado que el equipo
es rápido se reinicia una vez por semana, y con eso ese problema parece
haber desaparecido, pero no me parece lo más adecuado.
Es poco ortodoxo, desde luego, pero de momento... habrá que encontrar una 
solución al problema, por si acaso.

Un saludo,
José Luis Tallón



Re: ip_conntrack, límite de contadores, y kernel 2.4.24

2004-03-21 Por tema nmag only
El dom, 21-03-2004 a las 17:40, José Luis Tallón escribió:
 At 10:38 21/03/2004, you wrote:
 Content-Type: text/plain; charset=
 
 Hola,
 
 Necesito saber si alguien ha tenido un problema con el kernel
 (específicamente las series 2.4) y si han tenido alguna solución, les
 narro el asunto...
 
 No me ha pasado.
 
 Tengo un servidor que hace de Router con Debian woody stable, gcc
 2.95.4, kernel 2.4.24, procesador Intel Petium IV (dual), 512 RAM, NIC
 D-Link. El kernel 2.4.24 usuado es el obtenido en kernel.org, lo que ya
 he notado es que cada cierto tiempo (aproximadamente entre 8 a 10 días),
 el equipo genera un mensaje:
 
 No entiendo... 2 procesadores Pentium4 (espero que sean Xeon), con sólo 
 512MB de memoria, y una NIC de $10 ???

Evidentemente poca memoria, tenía hace poco 1 Gb pero el problema ya
existía; venga, no hay problema, se pondrá a sugerencia el Giga ya que
el sistema llega a usar el swap con el paso de los días... (Por si acaso
esta en SMP y con high memory support 4 Gb, este quedo así porque,
repito antes tenía 1 Gb, podría ser ese el problema porque ahora está
con solo 512? de todas formas ocurria con el Giga...)

 Yo usaría una ( ó dos ) Intel e100, al menos.

En realidad tiene 4 Dlinks, muy baratas por cierto, ya se ha sugerido la
adquisición de unas tarjetas de red de mejor calidad, el problema
también se presenta con 3com (3c59x), recomienda alguna además de la
Intel e100?

 Para qué tanta potencia de cálculo?? qué servicios presta esa máquina ?
 

Lo más pesado es el Proxy con aceleración web... y claro el equipo ya
estaba, y se tenía que usar como tal, yo he tenido equipos PII de 500
Mhz con iguales resultados, ni más ni menos, pero el tráfico en estos
nunca fué tan grande, así que este problema no lo he tenido hasta
ahora... En estos momentos estoy poniendo a prueba 3 equipos (que
cumplen la misma función y que siempre han estado en producción en
diferentes lugares) a los cuales se les ha incrementado el tráfico,
veremos como va...

 Mar 17 10:13:23 blackmarsh kernel: LIST_DELETE: ip_conntrack_core.c:302
 `ct-tuplehash[IP_CT_DIR_REPLY]'(ddf5c414) not in
 ip_conntrack_hash[hr].
 
 Después de ello queda completamente congelado y no hace nada, la única
 solución es darle reset. Ahora esta situación ha ocurrido en tres
 oportunidades y siempre ha sido justo cuando los contadores de
 transmisión de paquetes TX o los contadores de recepción de paquetes RX
 de la NIC estaban alcanzando el límite (un número bastante grande).
 
 Como dato adicional el tráfico manejado por este equipo es bastante
 grande. Por ahora tengo una solución por ortodoxa, y dado que el equipo
 es rápido se reinicia una vez por semana, y con eso ese problema parece
 haber desaparecido, pero no me parece lo más adecuado.
 
 Es poco ortodoxo, desde luego, pero de momento... habrá que encontrar una 
 solución al problema, por si acaso.

Si tiene alguna otra sugerencia será bien venida.

Gracias por su ayuda

Saludos

 
 
 Un saludo,
  José Luis Tallón
-- 
nmag only
gnupg 0xA024A03F [pgp.mit.edu]  GNU/Linux Registered User #312624






ip_conntrack, límite de contadores, y kernel 2.4.24

2004-03-21 Por tema nmag only
Hola,

Necesito saber si alguien ha tenido un problema con el kernel
(específicamente las series 2.4) y si han tenido alguna solución, les
narro el asunto...

Tengo un servidor que hace de Router con Debian woody stable, gcc
2.95.4, kernel 2.4.24, procesador Intel Petium IV (dual), 512 RAM, NIC
D-Link. El kernel 2.4.24 usuado es el obtenido en kernel.org, lo que ya
he notado es que cada cierto tiempo (aproximadamente entre 8 a 10 días),
el equipo genera un mensaje:

Mar 17 10:13:23 blackmarsh kernel: LIST_DELETE: ip_conntrack_core.c:302
`ct-tuplehash[IP_CT_DIR_REPLY]'(ddf5c414) not in
ip_conntrack_hash[hr].

Después de ello queda completamente congelado y no hace nada, la única
solución es darle reset. Ahora esta situación ha ocurrido en tres
oportunidades y siempre ha sido justo cuando los contadores de
transmisión de paquetes TX o los contadores de recepción de paquetes RX
de la NIC estaban alcanzando el límite (un número bastante grande).

Como dato adicional el tráfico manejado por este equipo es bastante
grande. Por ahora tengo una solución por ortodoxa, y dado que el equipo
es rápido se reinicia una vez por semana, y con eso ese problema parece
haber desaparecido, pero no me parece lo más adecuado.

He estado investigando en internet sobre este problema específicamente
sobre ip_conntrack_core:302 (302, otros números ya han sido
solucionados) y hay poca información (y hacen alusión a un bug en el
kernel) y la poca información que hay es sobre consultas como esta de si
la nueva versión lo soluciona o si es necesario hacer un downgrade a la
2.4.22, había otra referida al kernel 2.4.23 y que persiste en la 2.4.24
por tanto no ha habido solución...

Ahora me queda la duda tengo adicionalmente otro servidor en debian
totalmente woody es decir con el kernel 2.4.18-bf24 y que hace un
trabajo similar y en este caso el trafico no es elevado, pero este
servidor hace como 3 meses genero un problema similar después de haber
estado trabajando por un lapso de 8 meses sin parar ahora nunca le di
importancia ya que el tiempo de trabajo fue extenso, pero por la
cantidad de meses me he puesto a pensar que los contadores también
habrían alcanzado el límite y el resultado habría sido el mismo...

El problema está en todas las series del kernel 2.4? por si acaso esto
ya lo he consultado en las listas vger.kernel.org y en kerneltrap pero
aun no hay respuesta...

Saludos y Gracias...

-- 
nmag only
gnupg 0xA024A03F [pgp.mit.edu]  GNU/Linux Registered User #312624



signature.asc
Description: Esta parte del mensaje =?ISO-8859-1?Q?est=E1?= firmada	digitalmente