07.01.2018 21:58, Sergey Matveev пишет: > *** artiom [2018-01-07 21:18]: >> - Какой ZRAID лучше использовать: ZRAID2 или достаточно ZRAID? > > Зависит от количества и размера дисков в массиве, режимов > работы/нагрузки на них, в случае с ZFS ещё и recordsize. Почему появился > RAIDZ2 (или RAID6)? Потому-что размеры дисков растут быстрее чем их > скорость работы. Если в массиве RAID5/RAIDZ вылетает диск, но всё > начинает rebuild-ится, находится под бешенной нагрузкой. С маленькими > размерами диска rebuild занимает вменяемое время. С большими дисками > может занимать дни/неделю. Так как диски в основном ставят более-менее > из одной партии, то вероятность что ещё кто-то кокнется из этих же > дисков -- высока. А когда они ещё и под бешеной нагрузкой -- ещё выше. По-идее, у меня диски должны быть по две группы из разных партий (по 2 от разных поставщиков и в разное время заказаны). Понятно, что от указанной проблемы это не сильно спасёт, лишь уменьшит вероятность. Хотя, я пересмотрел: я же не могу сделать RAIDZ2 менее, чем с 6-ю дисками, а у меня их только 4.
> Отсюда и появились RAID6/RAIDZ2 где два диска могут вылететь и ничего > плохого не случится. RAIDZ3 -- аналогичное продолжение, где уже три > диска. В ZFS с RAIDZ ещё добавляются вопросы по эффективности > использования места. В некоторых конфигурациях можно с ним потерять > половину места. Советую вот эту статью посмотреть: > https://www.delphix.com/blog/delphix-engineering/zfs-raidz-stripe-width-or-how-i-learned-stop-worrying-and-love-raidz > И не забывать что можно/стоит использовать не один RAIDZ массив, а > stripe из нескольких. > 3-й - не мой вариант. Слишком велика избыточность, при малой вероятности события, от которого он защищает (плюс, возможно использование дополнительных резервных копий). Страйп - тоже сомнительный вариант, хотя я и думаю про него: дисков-то у меня от 4-х до 8-ми. Статью почитал. Вроде немного, но я так полагаю, что оптимальное решение - просто сделать пул RAIDZ из 4-х дисков (и по скорости будет нормально, и избыточность не 33%, а 25%) и не париться. Не вполне понятно другое: 'To double your read IOPS, you would need to halve the number of "data" disks in the RAID-Z group (e.g. with RAIDZ-2, go from 12 to 7 disks).' Они же не хотят сказать, что при использовании RAIDZ на четырёх дисках, производительность упадёт в четыре раза, по отношению к одному диску? >> - Имеет ли смысл включать сжатие (в приведённой выше конфигурации)? > > Практически всегда не имеет смысла не включать его (compression=lz4). > Если заранее известно что там будет только плохосжимаемые данные, то да, > можно отключить. LZ4 безумно быстрая штука, которая хорошо понимает что > ей суют несжимаемые данные и она оставит их "как есть" -- не будет > overhead-а как от сжатия. Сжатие тут как-правило только ускорит всё: так > как данных между дисков и системой надо просасывать меньше. Ну и просто > приятно видеть как du для MongoDB может показать 20 GB, хотя реально в > ней данных на 60 -- JSON/BSON хорошо сжимаются и получается отличная > экономия RAM, как кэша ФС, ведь в ней сжатые ZFS объекты хранятся. > Ok, вас понял. Сжатие оставляю. Кроме того, серьёзных вычислительных задач, которые загрузят Xeon, там по-идее не будет: оно не должно мешать. P.S.: Нашёл калькуляторы. http://wintelguy.com/zfs-calc.pl https://jsfiddle.net/Biduleohm/paq5u7z5/1/embedded/result/

