On Tue, 12 Mar 2013, Jacek Konieczny wrote:

On Tue, 12 Mar 2013 14:37:25 +0100 (CET)
Jacek Osiecki <[email protected]> wrote:

Od jakiegoś czasu walczę z niekończącymi się alertami o wysokim
loadzie na różnych serwerach. Konkretniej - to na dwóch, które
działają w tandemie i mają spięte bazy mysql (replikacja) oraz
filesystemy /home (DRBD+OCFS2).

'Load' mówi ile procesów w jednej chwili che coś od systemu.
Jeżeli masz file-system na DRBD+OCFS, to wystarczy, że file-system
przez chwilę będzie zatrzymany przez problemy z siecią, a już wszystkie
procesy, które cokolwiek chcą tam zapisać (czy nawet odczytać, jeśli
masz włączone atime) się zatrzymają w stanie 'D' i zaczną być wliczane
do tego 'loadu'.

 coś takiego chodzi? (wynik vps aux):

USER       PID CONTEXT             %CPU %MEM    VSZ   RSS TTY      STAT START   
TIME COMMAND
root      1370     0 MAIN           0.0  0.0      0     0 ?        D    Jan21  
45:53 [md2_raid1]
root      4799     0 MAIN           0.0  0.0      0     0 ?        D    Jan21   
7:15 [jbd2/drbd0-37]
http      5227    38 srv-oldwww1    0.2  0.2 732748 55124 ?        DN   09:44   
0:00 /usr/sbin/httpd.prefork
http      6792    38 srv-oldwww1    0.0  0.1 729888 38792 ?        DN   09:47   
0:00 /usr/sbin/httpd.prefork
http      7038    38 srv-oldwww1    0.2  0.2 742920 59508 ?        DN   09:48   
0:00 /usr/sbin/httpd.prefork

Stawiam na problemy z siecią i DRBD/OCFS.

Wydaje mi się mało prawdopodobne by sieć była tu przyczyną. Statystyki pokazują niewielki ruch sieciowy - w porywach do 20Mbps, zaś serwery to dwie maszyny w OVH stojące w sąsiednich szafach, obie z łączem 1Gbit...

Jak rozumiem używasz DRBD w konfiguracji active-active. W takim

W sensie double primary? Tak.

- spróbować montować z noatime,nodiratime, żeby ograniczyć ilość
 zapisów/blokad

Mount pokazuje mi takie parametry:

/dev/drbd0 on /home type ocfs2 (rw,noatime,_netdev,heartbeat=local,nointr,data=ordered,errors=remount-ro,
atime_quantum=60,localalloc=59,coherency=full,user_xattr,noacl)

– pogmerać z parametrami DRBD

Coś więcej poza ustawieniem max. przepustowości (syncer { rate 50M; })?

– sprawdzić połączenie sieciowe, o ile możliwe zrobić dedykowane dla
 DRBD i/lub dla klastra/DLM
– poustawiać priorytety ruchu tak, żeby łącze nigdy nie było wysycone

Tak jak pisałem, nie wygląda na to by ruch sieciowy choćby dążył ku wartościom przy których jakakolwiek priorytetyzacja by była potrzebna...

Pozdrawiam,
--
Jacek Osiecki [email protected] GG:3828944
I don't want something I need. I want something I want.
_______________________________________________
pld-devel-pl mailing list
[email protected]
http://lists.pld-linux.org/mailman/listinfo/pld-devel-pl

Odpowiedź listem elektroniczym