Hi,

wir betreiben ein Distributed Monitoring. Die meisten Server sind mittlerweile 
auf einem aktuellen Linux (18.04 LTS) mit aktuellstem Patchlevel. Speziell bei 
einem Server kommt es mittlerweile aller max. 12 Stunden dazu, dass der CMC 
beendet wird mit entsprechendem Eintrag in der kern.log:
Out of memory: Kill process 1357 (cmc) score 916 or sacrifice child

Eckdaten (für diesen speziellen Server):
110 Hosts zu überwachen
5500 Services
12 GB RAM
1.5.0p16 Enterprise

Das System wurde im Laufe der Jahre immer wieder über die im Manual 
beschriebenen Wege migriert, war initial auf einem Debian installiert und wurde 
damals ausschließlich über Config-Files konfiguriert (und heute eigentlich nur 
noch über die Weboberfläche).

Interessanter Weise saugt sich der "/omd/sites/mysite/bin/cmc 
/omd/sites/mysite/var/check_mk/core_config" immer weiter mit Speicher voll (und 
2-6% CPU).
Parallel dazu gibt es einen einzelnen Prozess "pyhton /omd/sites/mysite/bin/cmk 
-notify -keepalive", der immer mindestens 96% CPU verbraucht. Daneben laufen 
noch ganz paar "pyhton /omd/sites/mysite/bin/cmk -keepalive"-Prozesse, welche 
bzgl. CPU immer bei 0,0-0,3% CPU vor sich hin dümpeln.

Vergleichbare Server haben im Schnitt 2-3GB RAM in Beschlag.

Wie könnte ich dem Problem auf den Grund gehen? Mir gehen langsam die Optionen 
aus. Das Problem begleitet mich jetzt schon seit längerer Zeit. Allerdings 
unabhängig vom OS (war auch beim 16.04 immer mal wieder so) und auch schon bei 
der 1.4er-Version.


Grüße
Thomas
_______________________________________________
checkmk-de mailing list
checkmk-de@lists.mathias-kettner.de
Verwaltung & Abmeldung unter
https://lists.mathias-kettner.de/cgi-bin/mailman/listinfo/checkmk-de

Antwort per Email an