master altlinux пишет:
Последние 2 задания в этом списке довольно IO-ёмкие, попробуйте запустить
их вручную.  Если зависнет, то проверьте железо.


Я из запускал несколько раз сразу же после перезагрузки. Ни к чему не привело.
Сегодня вышел в ночь. Все идеально. Ни один сервер не завис. Такое
впечатление, что на это появлияли прикладные программы. В пятницу
начался большой обмен данными и возможно это привело к падению. Сейчас
поставил iozone гоняться. Потом буду память на всякий случай
проверять.
За любые идеи - предложения - респект...
У меня тоже куча серверов под M24. Периодически (похоже, после logrotate) очень странно падает syslog: вроде как по всем признакам живой, но в журналы ничего не пишется. При этом в системе начинаются различные плоходиагностируемые глюки. Помогает вот такой скриптец, пускаемый через cron:

#!/bin/sh

addr=root

# максимально допустимый промежуток времени отсутствия записей в syslog в 
секундах

MAX_DELTA_SEC=3600

/etc/init.d/syslogd status >/dev/null 2>&1

status=$?

if [ $status -eq 0 ]; then

  # Получим дату/время из последней записи в syslog

  last_log_date=`tail -n 1 /var/log/messages | awk '{printf "%s %s 
%s",$1,$2,$3}'`

  if [ -n "$last_log_date" ]; then

     # Преобразуем в секунды с 00:00:00 1970-01-01 UTC

     last_log_date="`date --date="$last_log_date" +%s`"

     current_date="`date +%s`"

     delta=`expr $current_date - $last_log_date`

     if [ $delta -gt $MAX_DELTA_SEC ]; then

        status=2

     fi

  fi

fi

if [ $status -ne 0 ]; then

  echo "syslogd is down. Try restart..." | mail -s "ERROR syslogd" $addr

  /etc/init.d/syslogd restart >/dev/null 2>&1

fi



--
SY, Yura Kalinichenko

_______________________________________________
Sysadmins mailing list
[email protected]
https://lists.altlinux.org/mailman/listinfo/sysadmins

Ответить