Esta mañana entre las 8,30 y las 8.40 volvió a tener el comportamiento recurrente con todas las CPU al 100% de carga System.
http://pastebin.com/c4xL789w Facilito el log de sar, por si se os ocurre algo. Para solucionarlo he parado la BBDD, limpiado la cache de RAM "sync;echo 3>/proc/sys/drop_caches" y arrancado la BBDD. He limpiado la cache porque he visto que así tarda mas en aparecer el problema. Ese limpiado de paginas en memoria en sar aparece claramente. En munin, que tambien lo tengo activo, lo único que si veo es que el numero de locks durante el tiempo de la incidencia, crece considerablemente, voy a ver como puedo haceros llegar las graficas. Muchas gracias. El 11 de septiembre de 2012 18:13, Alvaro Herrera <[email protected]>escribió: > Excerpts from Cesar Martin's message of mar sep 11 12:33:32 -0300 2012: > > > El problema añadido es la aleatoriedad del problema, ya que cuando > pasaba, > > solo ocurria dos o tres de veces al día, siempre coincidiendo por la > > mañana, pero nunca a una misma hora. > > Dijiste que la CPU estaba muy ocupada en %sys si mal no recuerdo, pero > ¿a qué proceso se atribuye eso? ¿tienes datos al respecto? Si no los > tienes, sería buena idea poner algo como sar o munin que monitoree > constantemente el servidor para tener una idea más clara de lo que pasa. > > -- > Álvaro Herrera http://www.2ndQuadrant.com/ > PostgreSQL Development, 24x7 Support, Training & Services > -- César Martín Pérez [email protected]
