On 03/22/2012 01:03 PM, Зеленяк Алексей wrote:
Даже не знаю как "возразить"... И у кого каша...
Давайте же разберемся... В рамках данной переписки обсуждается работа:
1. Исправного RAID контроллера
2. Исправных жестких дисков
3. Построение аппаратных массивов на базе Desktop (Err Ctl > 8 sec) и
RE (Err Ctl меньше или равно 7 сек)
Немного теории о контроллерах:
*Disk Failure Detection (Обнаружение неисправности дисководов)* - RAID
контроллер может автоматически обнаруживать повреждения SCSI
дисководов. Процесс контроля основывается, среди прочего, на анализе
времени выполнения команд, посланных дисководу. Если дисковод в
течении определенного времени не подтверждает выполнение команды,
контроллер осуществляет "сброс" дисковода и посылает команду повторно.
Если команда снова не выполняется за заданное время, дисковод может
быть контроллером отключен (установлен в режим "offline") и его
состояние фиксируется, как "dead" ("мертвый"). Многие RAID контроллеры
также контролируют ошибки четности SCSI шины и другие потенциальные
проблемы.
*Disk Media Error Management (Система Обработки Ошибок Дисководов)* -
RAID контроллеры способны обрабатывать ошибки внутреннего кэша и SCSI
дисководов. Если установлен кэш с ECC, контроллер исправит одиночные и
зафиксирует двойные ошибки. Дисководы могут быть запрограммированы
так, чтобы сообщать об ошибках, даже если это восстанавливаемые
ошибки. Когда дисковод сообщает об ошибке во время чтения, контроллер
считывает соответствующие данные из зеркального дисковода (RAID 1 или
0+1), или восстанавливает данные, используя информацию, хранящуюся в
других блоках (RAID 3, RAID 5), и записывает данные назад на тот
дисковод, который столкнулся с ошибкой. Если произошел сбой при
записи, контроллер пропускает тот блок, в котором возникла ошибка, и
затем записывает данные в следующий блок. Если проблема была успешно
решена, то никакие сообщения об ошибках в систему не передаются.
Теперь о поведении Desktop диска в массиве:
Если происходит ошибка чтения или записи на ИСПРАВНЫЙ диск - он
пытается ее исправить. Это может занять более 8 секунд.
В данном случае RAID выполняет *Disk Failure Detection (Обнаружение
неисправности дисководов)* и "выбрасывает" исправный диск из массива.
Подобная ситуация НЕ происходит если используются RE диски т.к.
контроллер выполняет *Disk Media Error Management (Система Обработки
Ошибок Дисководов)*, а вот *Disk Failure Detection (Обнаружение
неисправности дисководов)* происходит для дисков, которые можно смело
сдавать по гарантии.
То, что вы описали - не имеет никакого отношения к сата. Скази команды -
это собственнос скази или сас, а там _совсем_ другая история. Никаких
дефект листов в ата-8 стандарте нет.
Теперь почему я "приплел" софтовый" райд...
В софтовом массиве работой с дисками занимается ОС, которая может
ждать до 2мин пока диск самостоятельно не исправит ошибку, и потом
либо зависнет либо выкинет его из массива (в данном случае диск так же
можно нести "сдавать")
ОС контроллера (дада, там полноценная ОС) поступит точно также.