Hola Gente, me he encontrado con un problema con unas máquinas y es lo siguientes, lo que pasa es que he visto que en alguna oportunidad las máquinas se quedan sin memoria y no puedo entrar en ellas por que intento entrar por ssh pero el servicio esta muerto, de hecho en algún momento empieza a liberar espacio matando procesos y entre ellos están los servicios. A todo lo anterior yo hago una verificación de PC primero por un PING, después intento conectarme al servidor Postgresql pero como este está abajo, mi Server se marea por que se queda pegado intentando conectarse al Postgresql y no he podido ver la forma de especificar un timeout a la conexión del Postgresql.
Ahora lo que necesito es poder implementar alguna especie de programa que chuequee el estado de la memoria y me genere informes de uso de memoria y que según el estado, si es crítico (ssh down, postgresql down, red down), me reinicie la máquina de forma automática. Lo otro que necesito es saber cómo puedo especifica un timeout a algún intento de conexión desde mi Server(Postgresql) a otro PC(Postgresql) de tal forma que no me lo deje pegado intentando conectarse. Muchas gracias por la ayuda. NOTA: A pesar de que el sistema me empieza a matar todos los servicios por falta de memoria, las interfaces de red siempre están activas o sea, siempre me responden los ping. ¡¡¡¡Que raro!!!!

