Re: 100% iowait

2018-10-25 Пенетрантность Aleksey



04.09.2018 00:02, Геннадий Ковалёв пишет:

В Чт, 30/08/2018 в 14:54 +0300, Геннадий Ковалёв пишет:

В Чт, 30/08/2018 в 13:06 +0300, Alexander Gerasiov пишет:

На стабильное ядро откатиться посмотреть не вариант?
Больше ничего в dmesg подозрительного нет? smartctl -a?


Откатываться совсем на старое ядро рассматриваю как самый запасной
вариант. Погнались за модой, за nftables, который в ядрах до 4.14 не


Короче для истории... Не победил, откатился. Со старым ядром всё ок.
Заменил nftables обратно на iptables.



В общем, вдруг кому-то поможет:
Я не уверен, что причина в этом, но проблема исчезла сразу, как только я 
отключил apparmor для thunderbird. Перевести в  complain режим у меня не 
вышло, просто отключил, может позже разберусь. Вот уже несколько дней 
проблема не проявляется а до этого было пару раз за день. А если учесть, 
что "From Linux 4.13.10-1, AppArmor is enabled by default", то 
становится понятным почему помогает откат на более старую версию ядра. 
Скорее всего проблема проявляется только с md разделами.


Что еще заметил: если система заморозилась, то достаточно из консоли 
сделать smartctl -a /dev/sdX , где sdX один из физических дисков в 
составе md раздела.




Re: 100% iowait

2018-09-06 Пенетрантность Aleksey

Аналогичная ерунда сразу обновления до buster.

$ uname -a
Linux main01 4.17.0-3-amd64 #1 SMP Debian 4.17.17-1 (2018-08-18) x86_64 
GNU/Linux


04.09.2018 00:02, Геннадий Ковалёв пишет:

В Чт, 30/08/2018 в 14:54 +0300, Геннадий Ковалёв пишет:

В Чт, 30/08/2018 в 13:06 +0300, Alexander Gerasiov пишет:

На стабильное ядро откатиться посмотреть не вариант?
Больше ничего в dmesg подозрительного нет? smartctl -a?


Откатываться совсем на старое ядро рассматриваю как самый запасной
вариант. Погнались за модой, за nftables, который в ядрах до 4.14 не


Короче для истории... Не победил, откатился. Со старым ядром всё ок.
Заменил nftables обратно на iptables.





Re: 100% iowait

2018-09-03 Пенетрантность Геннадий Ковалёв
В Чт, 30/08/2018 в 14:54 +0300, Геннадий Ковалёв пишет:
> В Чт, 30/08/2018 в 13:06 +0300, Alexander Gerasiov пишет:
> > На стабильное ядро откатиться посмотреть не вариант?
> > Больше ничего в dmesg подозрительного нет? smartctl -a?
> 
> Откатываться совсем на старое ядро рассматриваю как самый запасной
> вариант. Погнались за модой, за nftables, который в ядрах до 4.14 не

Короче для истории... Не победил, откатился. Со старым ядром всё ок.
Заменил nftables обратно на iptables.


Re: 100% iowait

2018-08-31 Пенетрантность Aleksandr Sytar
чт, 30 авг. 2018 г. в 9:56, Геннадий Ковалёв :

> Здоровья всем побольше!
>
> Подскажите, пожалуйста, где копать. Периодически возникает загрузка
> iowait 100%.
>
>
>
 IO-wait говорит о том что проц ждет когда диски прочихаются. Смотреть на
диски, на ядерную статистику по ним в /sys/block/sda/stat

Если система с флешки грузится - то и по ней тоже надо смотреть


Re: 100% iowait

2018-08-30 Пенетрантность Alexander Gerasiov
Hello Геннадий,

On Thu, 30 Aug 2018 00:12:08 +0300
Геннадий Ковалёв   wrote:

> Здоровья всем побольше!
> 
> Подскажите, пожалуйста, где копать. Периодически возникает загрузка
> iowait 100%.
> 
> Debian stretch + backports.
> 
> > uname -a  
> Linux wide 4.17.0-0.bpo.3-amd64 #1 SMP Debian 4.17.17-1~bpo9+1 (2018-
> 08-27) x86_64 GNU/Linux
> 
...
> Задачи разные. Ну это понятно io-подсистема зависла, у процессов
> сложности.
> 
> 
> Куда копать?

На стабильное ядро откатиться посмотреть не вариант?
Больше ничего в dmesg подозрительного нет? smartctl -a?



-- 
Best regards,
 Alexander Gerasiov

 Contacts:
 e-mail: g...@cs.msu.su  WWW: http://gerasiov.net  TG/Skype: gerasiov
 PGP fingerprint: 04B5 9D90 DF7C C2AB CD49  BAEA CA87 E9E8 2AAC 33F1



100% iowait

2018-08-30 Пенетрантность Геннадий Ковалёв
Здоровья всем побольше!

Подскажите, пожалуйста, где копать. Периодически возникает загрузка
iowait 100%.

Debian stretch + backports.

> uname -a
Linux wide 4.17.0-0.bpo.3-amd64 #1 SMP Debian 4.17.17-1~bpo9+1 (2018-
08-27) x86_64 GNU/Linux

В машине 4 винта: sda, sdb, sdc и nvme0 (SSD). Последние два не
используются.

Поверх sda и sdb заведёны три md (0 - root, 1 - boot, 2 - lxc). Поверх
md2 заведён lvm, который используется для контейнеров lxc. Всего три
контейнера.

> smartctl -a /dev/sda | egrep "(^Device\sMo|Sector\sSize)"
Device
Model: WDC WD5000AAKX-001CA0
Sector Size:  512 bytes
logical/physical

> smartctl -a /dev/sdb | egrep "(^Device\sMo|Sector\sSize)"
Device Model: WDC WD5003ABYX-01WERA2
Sector Size:  512 bytes logical/physical

После установки ядра из backports (понадобилось для поддержки фикса mtu
в nftables), периодически (раз в 1-2 часа) началось 100% iowait, фризы
в системе. Через несколько минут отлагивает.

Если в момент фризов запустить iostat, то везде видны нули, кроме:

Device   aqu-sz   %util
nvme0n10,000,00
sda0,000,00
sdb0,000,00
sdc0,000,00
md20,000,00
md00,000,00
md10,000,00
dm-0   0,000,00
dm-1   0,000,00
dm-2   0,000,00
dm-3   0,000,00
dm-4   0,000,00
dm-5   2,00  100,00
dm-6   3,00  100,00
dm-7   1,00  100,00

dm-5,6,7 - это как раз контейнеры lxc на lvm. Контейнеры пересоздал,
даже fs на ext3 там пересоздал на всякий случай.

Без фризов статистика адекватная, везде есть разумные цифири.

В логах иногда сыпится 

INFO: task kworker/u8:5:196 blocked for more than 120 seconds.
Not tainted 4.17.0-0.bpo.3-amd64 #1 Debian 4.17.17-1~bpo9+1

Задачи разные. Ну это понятно io-подсистема зависла, у процессов
сложности.


Куда копать?