Re: Errori ripetuti di FS su VM...

2018-11-14 Per discussione Marco Gaiarin
Mandi! Felipe Salvador
  In chel di` si favelave...

> sicuramente vecchi ma sorprendentemente specifici[¹].
> Anche se in quel report si parla di 3.13/3.16 e Proxmox 3.4, io valuterei la
> possibilità di contattare quelli di Proxmox per illustrargli il
> problema. Potrebbe esserci una regressione.
> [¹] https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1423672

...ho seguito una delle indicazioni, ho aumentato la RAM della VM e il
problema sembra sparito.

Quindi, si, il baco sembra proprio quello...

-- 
  ...un ministro occidentale ha evocato il debito rwandese ``che e` bene
  che il Rwanda paghi un giorno''. Si`, signor ministro, se qualcuno tra
  noi sopravvivera` ... vi rimborsera` le armi...   (Yolande Mukagasana)




Re: Errori ripetuti di FS su VM...

2018-11-13 Per discussione Felipe Salvador
On Sat, Nov 10, 2018 at 07:24:02PM +0100, Marco Gaiarin wrote:
> 
> Situazione: cluster Proxmox 4.4, diverse VM jessie e stretch, in particolare
> due VM stretch praticamente identiche (stessa configurazione di CPU e
> RAM). Spazio disco condiviso in una SAN.
> 
> Alcune settimane fa la SAN ha avuto qualche problema, e ho dovuto ammazzare
> un po' di macchine; poi alcune anno avuto bisogno di qualche sistemazione
> manuale dei filesystem, ma nulla di più.
> 
> Ma una... continua a dare errori ripetuti nei FS, del tipo:
> 
>   Nov  9 14:59:58 vdmsv1 kernel: [82836.170296] EXT4-fs error (device 
> sda6): ext4_mb_generate_buddy:758: group 900, block bitmap and bg descriptor 
> inconsistent: 32732 vs 32768 free clusters
>   Nov  9 14:59:58 vdmsv1 kernel: [82836.565545] JBD2: Spotted dirty 
> metadata buffer (dev = sda6, blocknr = 0). There's a risk of filesystem 
> corruption in case of system crash.
> 
> Lo da su due partizioni EXT4. Altre 2 partizioni EXT4 non hanno problemi.
> Altre due partizioni XFS non hanno problemi.
> Trattandosi di una VM posso escludere problemi di RAM e disco (li avrebbero
> anche tutte le altre VM e container in quel nodo).
> 
> Ovviamnete posso fare 'fsck' delle partizioni, per qulalche ora/giorno
> smette, poi ricomincia.
> 
> 
> Una delle due partizioni problematiche è lo spool di squid, quindi ho anche
> provato a riformattarla, ma (anche se meno) il problema si ripresenta.
> 
> 
> Internet dice poco, nel senso che fa riferimento a vecchi bachi di vecchi
> kernel, ma nulla che riesco a correlare.

Ciao,
sicuramente vecchi ma sorprendentemente specifici[¹].
Anche se in quel report si parla di 3.13/3.16 e Proxmox 3.4, io valuterei la
possibilità di contattare quelli di Proxmox per illustrargli il
problema. Potrebbe esserci una regressione.

[¹] https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1423672

Ciao

> Esistono problemi e corruzioni di FS così ''cattive'' che le utility di
> check non riescono a risolvere? E, soprattutto, non se ne accorgono?
> 
> 
> O qualcuno ha una qualche idea?
> 
> 
> 
> Grazie.
> 
> -- 
>   ``... La memoria conta veramente solo se tiene insieme l'impronta del
>   presente e il progetto del futuro, se permette di fare senza dimenticare
>   quel che si voleva fare, di diventare senza smettere di essere,
>   di essere senza smettere di diventare...''  (Italo Calvino)
> 

-- 
Felipe Salvador



Errori ripetuti di FS su VM...

2018-11-10 Per discussione Marco Gaiarin


Situazione: cluster Proxmox 4.4, diverse VM jessie e stretch, in particolare
due VM stretch praticamente identiche (stessa configurazione di CPU e
RAM). Spazio disco condiviso in una SAN.

Alcune settimane fa la SAN ha avuto qualche problema, e ho dovuto ammazzare
un po' di macchine; poi alcune anno avuto bisogno di qualche sistemazione
manuale dei filesystem, ma nulla di più.

Ma una... continua a dare errori ripetuti nei FS, del tipo:

Nov  9 14:59:58 vdmsv1 kernel: [82836.170296] EXT4-fs error (device 
sda6): ext4_mb_generate_buddy:758: group 900, block bitmap and bg descriptor 
inconsistent: 32732 vs 32768 free clusters
Nov  9 14:59:58 vdmsv1 kernel: [82836.565545] JBD2: Spotted dirty 
metadata buffer (dev = sda6, blocknr = 0). There's a risk of filesystem 
corruption in case of system crash.

Lo da su due partizioni EXT4. Altre 2 partizioni EXT4 non hanno problemi.
Altre due partizioni XFS non hanno problemi.
Trattandosi di una VM posso escludere problemi di RAM e disco (li avrebbero
anche tutte le altre VM e container in quel nodo).

Ovviamnete posso fare 'fsck' delle partizioni, per qulalche ora/giorno
smette, poi ricomincia.


Una delle due partizioni problematiche è lo spool di squid, quindi ho anche
provato a riformattarla, ma (anche se meno) il problema si ripresenta.


Internet dice poco, nel senso che fa riferimento a vecchi bachi di vecchi
kernel, ma nulla che riesco a correlare.


Esistono problemi e corruzioni di FS così ''cattive'' che le utility di
check non riescono a risolvere? E, soprattutto, non se ne accorgono?


O qualcuno ha una qualche idea?



Grazie.

-- 
  ``... La memoria conta veramente solo se tiene insieme l'impronta del
  presente e il progetto del futuro, se permette di fare senza dimenticare
  quel che si voleva fare, di diventare senza smettere di essere,
  di essere senza smettere di diventare...''(Italo Calvino)