Il giorno mer 22 ago 2018 alle ore 11:03 Alessandro Baggi <
[email protected]> ha scritto:

> Il 20/08/2018 13:11, Marco Bertorello ha scritto:
> > Buongiorno a tutti,
> >
> > ho due macchine identiche, rispettivamente con 1 disco SSD per OS e
> > cache di LVM e 2 dischi da 3TB.
> >
> > Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD :
> >
> > └─sda4                      8:4    0 45.9G  0 part
> >    ├─VG01-LV01_cache_meta  253:0    0    8M  0 lvm
> >    ├─VG01-LV01_cache_cdata 253:3    0   40M  0 lvm
> >    │ └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> >    └─VG01-LV01_cache_cmeta 253:4    0    8M  0 lvm
> >      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> > sdb                         8:16   0  2.7T  0 disk
> > └─sdb1                      8:17   0  2.7T  0 part
> >    └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
> >      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> > sdc                         8:32   0  2.7T  0 disk
> > └─sdc1                      8:33   0  2.7T  0 part
> >    └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
> >      └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
> >
> > Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un
> > raspberry) il volume tra i due nodi.
> >
> > Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe
> > vorrei sostituirlo.
> > Qual'è secondo voi la procedura migliore per evitare di perdere dati (va
> > benissimo ricostruire dal nodo sano di gluster)?
> >
> > grazie molte,
> >
> > --
> > Marco Bertorello
> > System Administrator
> >
>
> Buongiorno Marco,
> premetto che non ho mai avuto una problematica del genere.
> Da quanto hai scritto non ci sono dischi in raid. Con il raid
> probabilmente avresti avuto meno problemi.
>

Corretto, in fase di setup ho pensato di sfruttare i lo spazio disco il più
possibile affidando la ridondanza a gluster


>
> Non avendo mai usato gluster in produzione ma solo in ambiente di test
> non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1
> (arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore.
> Potresti degradare (scollegare dalla rete credo basti) il nodo (brick)
> di gluster dove hai il problema, sostituire il disco danneggiato (magari
> se hai abbastanza spazio sposta i dati sul disco rimanente del volume
> LVM) e poi ricollegare il brick a gluster in modo tale che il nodo
> master risincronizzi quello appena collegato. Durante questa operazione
> gluster dovrebbe comunque funzionare e garantire l'accesso ai dati.
>

Ho spento il nodo problematico e tutto è rimasto in piedi, il punto è
proprio questo: come sostituisco il disco.
Mi spiego meglio: devo distruggere il brick, i LV e il VG?
Come scollego il brick morto dall'altro nodo?
Dopo aver ricreato VG e LV, come ricollego il brick al cluster?


> Penso che questo servizio sia funzionante in un'azienda per cui non
> stopperei tutte e due le macchine primo perche con gluster non avrebbe
> senso, se ha un problema su un host disattivare tutti gli host equivale
> ad avere solo un host. In secondo luogo lo eviterei per evitare, nel
>

In realtà si tratta di un laboratorio, niente di critico.
Comunque vorrei sperimentare come comportarmi in questo caso in una
situazione reale


> momento in cui riavvii gluster e nel caso in cui il primo brick sia
> desincronizzato rispetto al secondo, che si generino dei problemi nel
> mantenere i brick sincronizzati magari prende il brick meno aggiornato
> come master e rischi di perdere qualcosa.
>
>
> Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche
> prova su macchine virtuali onde evitare disastri.
>
>
> Magari qualche utente con più esperienza potrà fornirti maggiori
> indicazioni.
>
> Un saluto.
>
>
Grazie!


-- 
Marco Bertorello
System Administrator
http://bertorello.ns0.it

Rispondere a