Il giorno mer 22 ago 2018 alle ore 11:03 Alessandro Baggi < [email protected]> ha scritto:
> Il 20/08/2018 13:11, Marco Bertorello ha scritto: > > Buongiorno a tutti, > > > > ho due macchine identiche, rispettivamente con 1 disco SSD per OS e > > cache di LVM e 2 dischi da 3TB. > > > > Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD : > > > > └─sda4 8:4 0 45.9G 0 part > > ├─VG01-LV01_cache_meta 253:0 0 8M 0 lvm > > ├─VG01-LV01_cache_cdata 253:3 0 40M 0 lvm > > │ └─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated > > └─VG01-LV01_cache_cmeta 253:4 0 8M 0 lvm > > └─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated > > sdb 8:16 0 2.7T 0 disk > > └─sdb1 8:17 0 2.7T 0 part > > └─VG01-LV01_corig 253:5 0 5.5T 0 lvm > > └─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated > > sdc 8:32 0 2.7T 0 disk > > └─sdc1 8:33 0 2.7T 0 part > > └─VG01-LV01_corig 253:5 0 5.5T 0 lvm > > └─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated > > > > Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un > > raspberry) il volume tra i due nodi. > > > > Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe > > vorrei sostituirlo. > > Qual'è secondo voi la procedura migliore per evitare di perdere dati (va > > benissimo ricostruire dal nodo sano di gluster)? > > > > grazie molte, > > > > -- > > Marco Bertorello > > System Administrator > > > > Buongiorno Marco, > premetto che non ho mai avuto una problematica del genere. > Da quanto hai scritto non ci sono dischi in raid. Con il raid > probabilmente avresti avuto meno problemi. > Corretto, in fase di setup ho pensato di sfruttare i lo spazio disco il più possibile affidando la ridondanza a gluster > > Non avendo mai usato gluster in produzione ma solo in ambiente di test > non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1 > (arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore. > Potresti degradare (scollegare dalla rete credo basti) il nodo (brick) > di gluster dove hai il problema, sostituire il disco danneggiato (magari > se hai abbastanza spazio sposta i dati sul disco rimanente del volume > LVM) e poi ricollegare il brick a gluster in modo tale che il nodo > master risincronizzi quello appena collegato. Durante questa operazione > gluster dovrebbe comunque funzionare e garantire l'accesso ai dati. > Ho spento il nodo problematico e tutto è rimasto in piedi, il punto è proprio questo: come sostituisco il disco. Mi spiego meglio: devo distruggere il brick, i LV e il VG? Come scollego il brick morto dall'altro nodo? Dopo aver ricreato VG e LV, come ricollego il brick al cluster? > Penso che questo servizio sia funzionante in un'azienda per cui non > stopperei tutte e due le macchine primo perche con gluster non avrebbe > senso, se ha un problema su un host disattivare tutti gli host equivale > ad avere solo un host. In secondo luogo lo eviterei per evitare, nel > In realtà si tratta di un laboratorio, niente di critico. Comunque vorrei sperimentare come comportarmi in questo caso in una situazione reale > momento in cui riavvii gluster e nel caso in cui il primo brick sia > desincronizzato rispetto al secondo, che si generino dei problemi nel > mantenere i brick sincronizzati magari prende il brick meno aggiornato > come master e rischi di perdere qualcosa. > > > Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche > prova su macchine virtuali onde evitare disastri. > > > Magari qualche utente con più esperienza potrà fornirti maggiori > indicazioni. > > Un saluto. > > Grazie! -- Marco Bertorello System Administrator http://bertorello.ns0.it

