В сообщении от [Сб 2015-09-12 16:37 +0300] Yuriy M. Kaminskiy <[email protected]> пишет:
> Я только что нарвался на неприятный баг: на попытке перезапустить (не > полностью стартовавший) сервис, systemd помер с SIGFPE на целочисленном > делении на 0 (точнее, намерено завис в обработчике сигнала). При этом > systemd не реагирует ни на что [systemctl, kill -INT 1, и т.д.], не > подбирает zombie, систему можно перезапустить только вручную (убив > процессы и перемонтировав fs в read-only; ну, или через > alt-sysrq-e-u-s-b; halt/reboot, естественно, не работают), и.т.д. > > Я нашёл идентичный баг в багтрекире - > https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=774012 > но он помечен как fixed и archived. Хотя, очевидно, в jessie он > присутствует и *не* исправлен. Что с этим можно сделать (и можно ли)? Для повышение надежности системы, в systemd есть функциональность сторожевых таймеров (watchdog [1]). В случае возникновения проблем, systemd пытается привести систему в рабочее состояние, путем перезапуска отдельных сервисов или системы целиком. Здесь об этом подробнее [2]. [1] https://ru.wikipedia.org/wiki/Сторожевой_таймер [2] http://0pointer.de/blog/projects/watchdog.html -- http://google.com/+РусланКоротаев

