On 11/07/2018 19:09, Felipe Salvador wrote:
On Wed, Jul 11, 2018 at 03:33:12PM +0200, Piviul wrote:
Il 11/07/2018 15:25, Giuliano Grandin ha scritto:
non ricordo se se ne era parlato, ma non potrebbero essere interruzioni
della corrente elettrica o è collegato a un ups?
è collegato ad un UPS...
Sempre lo stesso UPS?
si sempre lo stesso ups ma sono attaccati più server a quell'UPS... un server (uso apcupsd) è collegato con la seriale e gli altri colloquiano con questo via rete per conoscere lo stato dell'UPS.


Chi ha accesso a questa macchina? Se non si spiega con un problema
hardware, quali sono le analisi che hai effettuato sul sistema?

Verifica dei log, verifica su cron (anche se si verifica casualmente),
cosa stava facendo la macchina quando si è riavviata, chi c'era
loggato in quel momento, chi ha accesso.
Come ti accorgi che la macchina si sta riavviando? Hai servizi
importanti o hai predisposto un monitoraggio?
Alla macchina ho accesso solo io; non mi spiego come faccia un HD difettoso a riavviare una macchina ma credo non ci siano altre spiegazioni. I log li ho spulciati e rispulciati ma non c'è assolutamente nulla di interessante prima di vedere i messaggi nei log di un nuovo avvio. Mi accorgo che la macchina si è riavviata perché c'è uno script all'avvio che riavvia winbind e crontab (nel crontab c'è una schedulazione di uno script che viene eseguito da utente del dominio e all'avvio il crontab sia avvia prima di winbind sicché non trova l'utente) e mi manda il log via mail.

In effetti per capire veramente cosa succede l'unica sarebbe seguire i consigli di Marco Gaiarin per redirigere la console via seriale su un altro PC ma non sono stato in grado di seguire i suoi consigli...

Mi viene un dubbio: il cavo di collegamento con l'UPS... oggi provo a sotituirlo.

Grazie comunque ancora a tutti

Piviul

Rispondere a