Sziasztok!

Van egy 5 node-os clusterem CentOS 5.2-vel, egy darab gfs shared
filesystem van mint szolgaltatas. Legyenek a node-ok app1-5 az
egyszeruseg kedvvert. Minden node-nak van rendes fence eszkoze (apc
pdu) is es be van allitva masodik kornek manual_fence is.

Tegnap ejjel app5 gep lefagyott (valoszniuleg tulterhelodott), szepen
kis is dobta a cluster, logokban latszanak az openais sorai, clustat a
tobbi node-on offline statuszunak mutatja.

Eddig ez szep is lenne, de megsem maradt elerheto a gfs share.

A maradek negy gepbol ketton (app3 es app4) talaltam ezt a logban
kozvetlenul az openais sora utan:

Feb  4 22:29:33 app03 fenced[4546]: fencing deferred to app01

'Normalis' esetben ha a fencing nem jon ossze valamiert akkor a
manual_fence sorait latom a logban es a reboot utan 'szepen' (mar
amennyire a manual fencing szep lehet) tovabb tudom lokni a rendszert.
Most _csak_ ez az egy sor van.

Kerdeseim:
- Mi tortent / tortenhetett? :)
- Mit akar nekem mondani vajon ez a log? (forrast meg megnezem, de
elkepzelheto, hogy attol en nem leszek okosabb)
- Miert csak ket gepen van ez a logsor es nem mind a harmon-negyen?
- Barmi modszer hasonlo esetet elkerulni?

Elore is koszonom, udv
_________________________________________________
linux lista      -      [email protected]
http://mlf2.linux.rulez.org/mailman/listinfo/linux

válasz