On 02/05/14 14:30, Alexey Markov wrote:
RAID: 3ware 9690SA-4I (512 Mb, BBU)
Диски: 2 x WDC WD5002ABYS
Сегодня в процессе подготовки к профилактике понадобилось скопировать
один из небольших разделов (80 Гб) в конец диска. Запустил dd, и почти
сразу сайт отвалился. В /var/log/messages в это время вижу:
twa0: Request 0 timed out!
twa0: INFO: (0x16: 0x1108): Resetting controller...:
twa0: INFO: (0x04: 0x005E): Cache synchronization completed: unit=0
twa0: INFO: (0x04: 0x0001): Controller reset occurred: resets=2
В первую очередь имеет смысл посмотреть SMART на дисках, если данные 3ware
позволяет это делать.
Потом запустить по очереди на кождом из дисков тест (smartctl -t long) и еще раз
посмотреть.
В случае когда диски начинают умирать, RAID контроллеры могут писать в логах
разные непонятные сообщения, от которых мало толку.