2011/9/22 Alberto Bertogli <[email protected]>: > On Thu, Sep 22, 2011 at 11:33:12AM +0200, Damian Montaldo wrote: >> Esta mañana me encontré con procesos en estado "D" o uninterruptible >> sleep que sí son molestos porque entiendo que pueden retener recursos >> y en especial me interesa que no puedan hacer I/O. Ah y encima están >> colgados del init, malditos! > > Nomas para agregar a lo que dijo Rodrigo, el hecho que esten colgados > del init es pura casualidad y no tiene nada que ver. Ok ese es un dato interesante.
> Es muy comun que los procesos que hagan I/O esten en D, solo que lo > normal es que lo esten por periodos cortos, por eso no suele ser un > problema. Están así hace más de un mes :P > Si tenes un proceso en D por mucho tiempo es o un bug del kernel, o que > tenes algun problema de I/O tipo un disco muy lento o roto que tarda > mucho tiempo en responder, o algun pedo de NFS como dijo Rodrigo. Más que NFS es un file system distribuido en muchos discos (más de 600) y el IO en estas cosas distribuidas es todo un tema. La teoría es una cosa pero la práctica es otra y es la primera vez que le meto mano a algo de este tamaño. > En el caso normal, solo hay que esperar un poquito que termine la > operacion de I/O que los tiene bloqueados y ya, no es que una vez que > entran en D ya no salen mas, eso es anormal. Ahora desde afuera no puedo entrar para ver la fecha pero era más de un mes seguro :P Esto me llevó a armar un script que se fija en todos los nodos de cómputo a ver si tienen procesos "D" haciendo IO y se fija la fecha para ver si colgaron porque suele pasar que el sistema de colas no los puede desalojar y hay veces que hasta se quedan morfando ram o swap. Igual los nodos los reiniciaba por estas cosas cada tanto, pero este guacho me ganó la lucha... > Gracias, > Alberto Gracias a vos. _______________________________________________ Glug mailing list [email protected] http://glugcen.dc.uba.ar/cgi-bin/mailman/listinfo/glug
