Руслан Коротаев <[email protected]> writes: > В сообщении от [Сб 2015-09-12 16:37 +0300] > Yuriy M. Kaminskiy <[email protected]> пишет: > >> Я только что нарвался на неприятный баг: на попытке перезапустить (не >> полностью стартовавший) сервис, systemd помер с SIGFPE на целочисленном >> делении на 0 (точнее, намерено завис в обработчике сигнала). При этом >> systemd не реагирует ни на что [systemctl, kill -INT 1, и т.д.], не >> подбирает zombie, систему можно перезапустить только вручную (убив >> процессы и перемонтировав fs в read-only; ну, или через >> alt-sysrq-e-u-s-b; halt/reboot, естественно, не работают), и.т.д. >> >> Я нашёл идентичный баг в багтрекире - >> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=774012 >> но он помечен как fixed и archived. Хотя, очевидно, в jessie он >> присутствует и *не* исправлен. Что с этим можно сделать (и можно ли)? > > Для повышение надежности системы, в systemd есть функциональность > сторожевых таймеров (watchdog [1]). В случае возникновения проблем, > systemd пытается привести систему в рабочее состояние, путем перезапуска > отдельных сервисов или системы целиком. Здесь об этом подробнее [2]. > > [1] https://ru.wikipedia.org/wiki/Сторожевой_таймер > [2] http://0pointer.de/blog/projects/watchdog.html
Проблема только в том, что в данном случае помер/завис сам systemd (pid=1). Перезапускать его некому.

