Re: [freebsd] Re: RAID и таймауты

Alex Samorukov Thu, 22 Mar 2012 05:34:33 -0700

On 03/22/2012 01:03 PM, Зеленяк Алексей wrote:

Даже не знаю как "возразить"... И у кого каша...

Давайте же разберемся... В рамках данной переписки обсуждается работа:
1. Исправного RAID контроллера
2. Исправных жестких дисков
3. Построение аппаратных массивов на базе Desktop (Err Ctl > 8 sec) иRE (Err Ctl меньше или равно 7 сек)
Немного теории о контроллерах:
*Disk Failure Detection (Обнаружение неисправности дисководов)* - RAIDконтроллер может автоматически обнаруживать повреждения SCSIдисководов. Процесс контроля основывается, среди прочего, на анализевремени выполнения команд, посланных дисководу. Если дисковод втечении определенного времени не подтверждает выполнение команды,контроллер осуществляет "сброс" дисковода и посылает команду повторно.Если команда снова не выполняется за заданное время, дисковод можетбыть контроллером отключен (установлен в режим "offline") и егосостояние фиксируется, как "dead" ("мертвый"). Многие RAID контроллерытакже контролируют ошибки четности SCSI шины и другие потенциальныепроблемы.
*Disk Media Error Management (Система Обработки Ошибок Дисководов)* -RAID контроллеры способны обрабатывать ошибки внутреннего кэша и SCSIдисководов. Если установлен кэш с ECC, контроллер исправит одиночные изафиксирует двойные ошибки. Дисководы могут быть запрограммированытак, чтобы сообщать об ошибках, даже если это восстанавливаемыеошибки. Когда дисковод сообщает об ошибке во время чтения, контроллерсчитывает соответствующие данные из зеркального дисковода (RAID 1 или0+1), или восстанавливает данные, используя информацию, хранящуюся вдругих блоках (RAID 3, RAID 5), и записывает данные назад на тотдисковод, который столкнулся с ошибкой. Если произошел сбой призаписи, контроллер пропускает тот блок, в котором возникла ошибка, изатем записывает данные в следующий блок. Если проблема была успешнорешена, то никакие сообщения об ошибках в систему не передаются.
Теперь о поведении Desktop диска в массиве:
Если происходит ошибка чтения или записи на ИСПРАВНЫЙ диск - онпытается ее исправить. Это может занять более 8 секунд.В данном случае RAID выполняет *Disk Failure Detection (Обнаружениенеисправности дисководов)* и "выбрасывает" исправный диск из массива.
Подобная ситуация НЕ происходит если используются RE диски т.к.контроллер выполняет *Disk Media Error Management (Система ОбработкиОшибок Дисководов)*, а вот *Disk Failure Detection (Обнаружениенеисправности дисководов)* происходит для дисков, которые можно смелосдавать по гарантии.

То, что вы описали - не имеет никакого отношения к сата. Скази команды -это собственнос скази или сас, а там _совсем_ другая история. Никакихдефект листов в ата-8 стандарте нет.

Теперь почему я "приплел" софтовый" райд...
В софтовом массиве работой с дисками занимается ОС, которая можетждать до 2мин пока диск самостоятельно не исправит ошибку, и потомлибо зависнет либо выкинет его из массива (в данном случае диск так жеможно нести "сдавать")

ОС контроллера (дада, там полноценная ОС) поступит точно также.

Re: [freebsd] Re: RAID и таймауты

Ответить