Sziasztok! Van egy 5 node-os clusterem CentOS 5.2-vel, egy darab gfs shared filesystem van mint szolgaltatas. Legyenek a node-ok app1-5 az egyszeruseg kedvvert. Minden node-nak van rendes fence eszkoze (apc pdu) is es be van allitva masodik kornek manual_fence is.
Tegnap ejjel app5 gep lefagyott (valoszniuleg tulterhelodott), szepen kis is dobta a cluster, logokban latszanak az openais sorai, clustat a tobbi node-on offline statuszunak mutatja. Eddig ez szep is lenne, de megsem maradt elerheto a gfs share. A maradek negy gepbol ketton (app3 es app4) talaltam ezt a logban kozvetlenul az openais sora utan: Feb 4 22:29:33 app03 fenced[4546]: fencing deferred to app01 'Normalis' esetben ha a fencing nem jon ossze valamiert akkor a manual_fence sorait latom a logban es a reboot utan 'szepen' (mar amennyire a manual fencing szep lehet) tovabb tudom lokni a rendszert. Most _csak_ ez az egy sor van. Kerdeseim: - Mi tortent / tortenhetett? :) - Mit akar nekem mondani vajon ez a log? (forrast meg megnezem, de elkepzelheto, hogy attol en nem leszek okosabb) - Miert csak ket gepen van ez a logsor es nem mind a harmon-negyen? - Barmi modszer hasonlo esetet elkerulni? Elore is koszonom, udv _________________________________________________ linux lista - [email protected] http://mlf2.linux.rulez.org/mailman/listinfo/linux
