Re: bsnmp a RAM

Dan Lukes Sun, 29 Dec 2013 13:41:39 -0800

On 29.12.2013 18:32, Miroslav Prýmek:

Jde mi o jakoukoli "rozumnou" metriku --
tj. vytahnout ze snmp nejaky cislo, ktery by melo smysl sledovat - tj.
napr. za normalnich okolnosti by to cislo melo treba oscilovat kolem
nejake hodnoty, ale nemelo by neustale rust - to by znamenalo memory
leak nebo nejaky jiny problem.

Otazka "co sakra vlastne sledovat" je zajimavy problem sam o sobe,nezavisle na otazce jak/cim to pak sledovat.

Alokaci realne pameti smysl sledovat nema, ta by se mela neustale tocitokolo 100%, protoze co nepouziji aplikace, to by mely pouzivat cachediskoveho subsystemu.

Sledovat celkove mnozstvi alokovane pameti (linearni) je problematickepokud neni zatizeni toho stroej velice konstantni. Vetsina verejnychserveru bude v zavislosti na zatizeni alokovat dost rozdilna mnozstvipameti a tyhle vykyvy budou typicky vetsi pomale vykyvy zpusobene memoryleakem. Obzvlast, kdyz to sledujeme poscitane pres cely server.

To uz je mozna lepsi mit natypovanou pametovou narocnost konkretnichdaemonu a nastavit jim podle toho ulimit. Pak uz jen staci sledovat, kdobyl systemem zastrelen pro prekroceni limitu. Ale to je dost narocny a itak je to jen heuristika.

To o cem mluvis by se tak podle me dalo sledovat snad jedine v podobetrendu dlouhodovych prumeru. Neco jako - zaznamenavat prumerne alokovanemnozstvi pameti za 24 hodin (to eliminuje intradenni vykyvy zpusobeneruznym pouzivanim) a sledovat v delsim horizontu nekolika tydnu trendtechto hodnot (do eliminuje vykyvy v ramci pracovniho tydne). A pokudtahle krivka vykazuje trvaly rust (po zignorovani lokalnich kratkodobychpoklesu) tak vis, ze je neco spatne.


Na tom poznas, ze je neco v neporadku.

Ale je to pomerne slozitej zpusob. Sleduju ukazatel, kterej ma trochupodobny vlastnosti jako to co jsem popsal, je pro sledovani jednodussi,za cenu toho, ze nezachyti to problem dokud se nedobere do dost velkejchrozmeru.


Sleduju vyuziti swapu.

Postupne rostouci vyuziti swapu ukazuje na memory-leak, ale v podstatejakekoliv netrivialni vyuziti swapu ukazuje na problemy systemu ...

Proste neco na zpusob metriky "pocet procesu" nebo "pocet navazanych
spojeni" -- nejaky vesmes libovolny cislo, na kterym by se poznalo ze
"neco neni v poradku"

Pocet procesu a pocet navazanejch spojeni je dalsi mozna vec kesledovani, ale i tady musis sledovat dlouhodoby trend, nikoliv hodnotu vkonkretnim okamziku nebo kratkem obdobi.

Sledovani kazdy z tech veci te upozorni na jinej typ problemu. Nadevsechnu miru rostouci pocet procesu nemusi zpusobit podstatny rustalokovany pameti, pocet navazanych spojeni (ja bych to ale spis videl napocet otevrenejch handlu, jakejkoliv) nemusi bejt spojenej s velkymmnozstvim procesu.

No, a taky lze zvolit uplen jinej pristup - takovej Apachovskej (alepouzivaji to i jine servery). Oni proste vedi, ze bez ohledu natestovani k necemu takovymu obcas stejen dojde. Apachovske synovskeprocesy proto obslouzi jen urcity pocet pozadavku a pak se ukonci.System tak uvolni vsechny zdroje toho procesu, vcetne "zapomenutych" aserverovy manager nastartuje novy, "cisty" proces.

Tim chci rict, ze nekdy muze bejt nejlepsi ten celej server prostepreventivne jednou za cas otocit ...


Dan



--
FreeBSD mailing list ([email protected])
http://www.freebsd.cz/listserv/listinfo/users-l

Re: bsnmp a RAM

Odpovedet emailem