Apache child STATE ufs

Miroslav Lachman Thu, 15 Oct 2009 14:34:40 -0700

Mam tu takovy problem s procesy Apache (2.2.13) na FreeBSD 7.2 amd64.

Pred par dny jsme presouvali webaplikaci na novy HW a dnes se opakovanevyskytnul problem, ktery jsem predtim nezaznamenal.

Stoupne load asi an trojnasobek (z 0.7 na 2.5) a nekolik procesu (childuApache s MPM prefork) v topu setrvava pomerne dlouhy cas (sekundy azdesitky sekund) na prvni pricce a ve sloupci STATE maji "ufs" (a PRI -4).

Tech childu tam takhle je cca 5 - 10, celkove ma Apache okolo 200-300childu (je to pomerne hodne navstevovany web)

last pid: 93489; load averages: 2.36, 2.35, 2.00 up4+22:08:16 21:27:57

460 processes: 7 running, 452 sleeping, 1 zombie
CPU:  9.9% user,  0.0% nice, 19.6% system,  0.7% interrupt, 69.8% idle
Mem: 1340M Active, 3410M Inact, 768M Wired, 147M Cache, 399M Buf, 247M Free
Swap: 12G Total, 24K Used, 12G Free

  PID USERNAME  THR PRI NICE   SIZE    RES STATE  C   TIME   WCPU COMMAND
92718 www         1  -4    0   127M 24924K RUN    3   0:22 16.36% httpd
92557 www         1  -4    0   126M 23468K ufs    6   0:23 13.77% httpd
92694 www         1  -4    0   127M 24908K CPU1   1   0:28 13.57% httpd
91147 www         1  -4    0   127M 24840K ufs    3   0:12 11.77% httpd
91849 www         1  -4    0   127M 24956K ufs    0   0:22  9.86% httpd
93323 www         1  -4    0   127M 24924K ufs    2   0:02  9.86% httpd
91748 www         1  -4    0   127M 25660K ufs    3   0:20  9.18% httpd
91859 www         1  44    0   127M 24412K select 0   0:30  2.39% httpd
98563 mysql      12  44    0   850M   282M ucond  4   0:00  0.88% mysqld
91603 www         1  44    0   127M 25408K select 2   0:02  0.39% httpd
92556 www         1  44    0   127M 25040K select 3   0:01  0.29% httpd
93231 www         1  44    0   127M 25308K select 7   0:01  0.29% httpd
93227 www         1  44    0   127M 24776K select 7   0:01  0.29% httpd
93374 www         1  44    0   127M 24808K select 0   0:00  0.29% httpd

Podle iostat, systat, gstat a tak dale, nejsou disky (gmirror) zatizenyna vice nez 50% a podle grafu v MRTG v teto situaci nedochazi ke zvysenizadnych jinych velicin, nez load (CPU usage "sys"). Ostatni veci, jakoje sitovy provoz, pocet diskovych operaci, obsazene RAM atd. je stalestejny - v normalu - takze nevidim zadny duvod, proc by melo dojit ktakovemu zaseku ve stavu "ufs".Na serveru je nasazeny mod_proctitle, takze vidim i to, ze tytoproblemove childy obsluhuji zcela bezne requesty, ktere na ostatnichchildech prochazeji okamzite a bez problemu.

Web jako celek bezi normalne. Stale zustava dostatek volnehoprocesoroveho casu pro ostatni childy, takze to neni nijak kritickyproblem. Jde zkratka o to, ze me znervoznuje takovehle nahodne anevysvetlitelne chovani.Normalni load na serveru je okolo 0.7, ale v pripade skokoveho narustutech nekolika problematickych childu vyleze treba na 2.5-3. V tomtostavu vse setrvava, dokud se neprovede restart Apache. Pak je zase nanekolik hodin klid. V zadnem logu se nenechazeji zadne zajimave zpravy.

Takze otazka na zaver - napada nekoho, cim to muze byt / jak zjistit,proc je child tak dlouho ve stavu "ufs"? (pripadne proc tyto procesymaji PRI -4 a ostatni cca 44 - 50?)


Mirek
--
FreeBSD mailing list ([email protected])
http://www.freebsd.cz/listserv/listinfo/users-l

Apache child STATE ufs

Odpovedet emailem