Re: Проблема с дисками
On Sat, 11 Sept 2021 at 04:33, spied wrote: > Из моего опыта, чаще всего источником «непонятных» проблем является или > нестабильное питание — умирающий БП или «вспухшие» конденсаторы на > материнской плате; или «битая» память. БП может быть и не умирающий, а просто недостаточно мощный. Ещё бывают глючные контроллеры SATA (или их драйвера). Не знаю, насколько это применимо к SAS, но на одном сервере с PCIe SATA контроллером опция ядра libata.force=noncq,8:3.0 (число перед ":3.0" в другой конфигурации железа будет своё, а может и не одно) помогла перевести один сыпавший ошибками BTRFS RAID1-массив, подключенный к такому контроллеру, в состояние супер-стабильности. Причём ключевым параметром стало ограничение скорости до SATA 3.0; noncq сам по себе помог, но не до конца. Кусок вывода lspci, чтобы в поиске всплывало: 01:00.0 USB controller: ASMedia Technology Inc. ASM1142 USB 3.1 Host Controller 02:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI Bridge (rev 04) 05:00.0 SATA controller: ASMedia Technology Inc. ASM1062 Serial ATA Controller (rev 01) -- ...Bye..Dmitry.
Re: Проблема с дисками
On Sat, 11 Sept 2021 at 23:05, Артём Н. wrote: > Контроллер - маловероятно: работало же ранее. Как вариант, проблема могла вскрыться при изменившемся профиле нагрузки и/или новой версии ядра. -- ...Bye..Dmitry.
Re: Проблема с дисками
8 дисков, но: - БП рассчитывался с запасом, и это Gold. - Ранее система работала стабильно года с 2018. Возможно, что подох блок, конечно... Контроллер - маловероятно: работало же ранее. Плата тоже ASRock, кстати. 11.09.2021 14:53, Dmitry Semyonov пишет: On Sat, 11 Sept 2021 at 04:33, spied wrote: Из моего опыта, чаще всего источником «непонятных» проблем является или нестабильное питание — умирающий БП или «вспухшие» конденсаторы на материнской плате; или «битая» память. БП может быть и не умирающий, а просто недостаточно мощный. Ещё бывают глючные контроллеры SATA (или их драйвера). Не знаю, насколько это применимо к SAS, но на одном сервере с PCIe SATA контроллером опция ядра libata.force=noncq,8:3.0 (число перед ":3.0" в другой конфигурации железа будет своё, а может и не одно) помогла перевести один сыпавший ошибками BTRFS RAID1-массив, подключенный к такому контроллеру, в состояние супер-стабильности. Причём ключевым параметром стало ограничение скорости до SATA 3.0; noncq сам по себе помог, но не до конца. Кусок вывода lspci, чтобы в поиске всплывало: 01:00.0 USB controller: ASMedia Technology Inc. ASM1142 USB 3.1 Host Controller 02:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI Bridge (rev 04) 05:00.0 SATA controller: ASMedia Technology Inc. ASM1062 Serial ATA Controller (rev 01)