On 03/21/2012 04:56 PM, Зеленяк Алексей wrote:


Простите, я 1 из разработчиков smartmontools, и, в том числе фиксил scterc в os_freebsd.cpp и немного знаю как это работает.


Никоим образом не сомневаюсь в Вашей компетенции.
У меня была ситуация описанная http://www.nix.ru/support/faq/show_articles.php?number=612&faq_topics=RAID
Естественно с потерей всей информации....
И как бы Вы не убеждали в "можно использовать десктопные веники в RAID массивах" - никогда сам не буду и другим не посоветую.


Я не убеждаю )) Просто говорю, что не всё так однозначно.
По пунктам:

1) тлер это вообще специфичная для wd фича никак не описанная в стандарте. Единственный ее плюс - она переживает выключение питания. Если мы говорим о не вд винтах - то это Error Control, в смартмонтулз - команда scterc. Она живёт до выключения питания винта, так что требуется поддержка доступа к smart жесткого диска.

Согласен. А еще эта фича называется TLER / CCTL / ERC... В зависимости от производителя...
Ну ERC описан в последнем ата стандарте. В отличии от всего остального. Кстати, в новом smartmontools появится еще и контроль акустических параметров винта.

2) Проблема не будет "проигнорирована". Вы несколько не разобрались как оно работает. Данный параметр позволяет ограничит время затрачиваемое на запись или на чтение указанного сектора. Если параметр отличен от 0 - то после таймаута винт даст контроллеру ошибку, а не будет пытаться это сделать снова и снова. Рейдам это помогает в основном потому, что они быстрее обнаруживают сбойный диск и перестают с ним работать. Это особенно критично если в прошивке недостаточно хорошо производится обработка таймаутов и на чтении такой массив может надолго уйти в себя. 3) Это достаточно слабо влияет на целостность данных. А вот на стабильность работы - вполне

В слово "проигнорирована" вложена процедура коррекции ошибок именно RAID контроллером, который НЕ "перестает" работать с диском при первой же ошибке, а принимает меры для устранения проблемы...
Вот кстати не уверен, что рейд будет "принимать меры". А что он может сделать-то? Ну при чтении - быстро считать с второго диска и (возможно) перезаписать сбойный сектор. А при записи - ничего, так как скорее всего зона ремапов закончилась или диск поврежден. Никаких специальных команд восстановления в ата5 стандарте нет. Софтрейд скорее всего просто пометит диск как сбойный после нескольких попыток, думаю хард-рейд ничем не отличается.

Собирал. И на 24х7 собирал. И там и там бывали отказы. Критичной разницы не заметил, впрочем у них и цены близкие так что беру рейд-ейдишн обычно. Скорее бывают неудачные серии - помню взял как-то 5 сас дисков и все ушли по RMA через пол года. Поменяли на точно такие-же и живут уже года 2 без проблем. Еще хорошо помню багу у одного из вестернов (кстати рейдовых) который зависал через год аптайма. Смерть всему массиву наступала в течении минуты.

Охотно верю, но "опыт, сын ошибок трудных, и гений - парадоксов друг"...

В продолжение темы. Только что получил два ST2000VX000-9YW164 которые судя по описанию - 24х7. И у них erc таймауты по умолчанию отключены. Выставил в 100,100 в smartctl и добавил в инит скрипт (они в домашнем нас-е будут жить). Ну а винты где scterc не задаётся - к счастью сегодня редкость, хотя мне пару раз попадались.


Еще из забавного - интеловские ssd позволяют выставлять scterc. "Но зачем?!?" спросил я интеловский суппорт. Через недели 2 мне ответили что-то вроде it does not make any practical sense and should never be used - вероятно бит поддержки это copy&paste из сырцов фирмвари винтов )

Ответить