On 03/01/2011 10:10 AM, Piero Cavina wrote:
> Forse avrete sentito parlare del bug di GMail che ha causato la
> cancellazione di qualche migliaio di mailbox. E' uscito un comunicato
> di Google che spiega come il bug abbia innescato una cancellazione
> delle repliche dei dati degli utenti (ma non c'era un "sanity check"
> contro le repliche distruttive anomale?),

Qualsiasi sanity check può essere buggato. Considerando la mole di dati
trattati dal servizio e la quantità di utenti che lo utilizzano un
evento di questa portata rientra nella normalità e nell'errore comune.
Personalmente mi stupisce di più la rarità di tali situazioni che nelle
installazioni comunemente trovate nelle aziende avviene con frequenza
almeno annuale :-)

> per cui hanno dovuto
> ricorrere ai backup su nastro per il ripristino
> (http://gmailblog.blogspot.com/2011/02/gmail-back-soon-for-everyone.html).
> Non avevo mai sentito parlare dell'uso di nastri da parte di Google
> per il backup dei dati utente (loro stesso hanno sempre messo in
> evidenza l'architettura replicata).

La replica non necessariamente è un backup, anzi, in genere non lo è
proprio perché è una replica. Al più è funzionale al backup nel senso
che fare un backup da una replica consente di sfruttare funzionalità di
snapshotting senza intaccare la produzione da un punto di vista delle
performance. In ogni caso nessuno strumento continuamente online può
essere considerato un backup degno di tale nome.

> A voi sembra una cosa credibile, considerata la mole di dati sviluppata?

Il costo per TB di un nastro è ancora considerevolmente inferiore al
costo del disco, e le caratteristiche sia di robustezza che di durata
del nastro sono ancora di molto superiori a quelle ottenibili con
storage a disco. Da sempre lo strumento elettivo per il backup è il
tape, specie quando la mole di dati da salvare è considerevole, quindi
non solo mi sembra credibile che Google lo utilizzi, ma mi sembra anche
l'unica soluzione intelligente da implementare in strutture di questo
tipo e lo prova il fatto che il backup abbia assolto il proprio dovere
egregiamente.

> Quale tipo di hardware possono utilizzare?

La tecnologia molto probabilmente sarà varia e includerà LTO5 che ad
oggi è la tecnologia ampiamente diffusa con le performance migliori sia
in termini di velocità che di densità (1TB/h e 1.6TB netti a nastro).
Poi di hardware che la implementano ce ne sono decine...

P.es. IBM offre la 3500 che arriva a 30PB di dati non compressi
http://www-03.ibm.com/systems/it/storage/tape/ts3500/index.html

HP offre le storagework ESL
http://h10010.www1.hp.com/wwpc/us/en/sm/WF25a/12169-304612-304631-304631-304631-392031.html

Quantum propone la Scalar i6000
http://www.quantum.com/Products/TapeLibraries/Scalari6000/Index.aspx

E ovviamente essendo Google distribuita avrà gli stessi dati in librerie
situate in datacenter diversi.

Ricordo che quando lavoravo in IBM c'era un reparto incaricato della
gestione dei backup e oltre a due librerie di una decina di metri di
lunghezza c'era una stanza ricoperta di scaffalature porta nastri... non
dovrebbe essere molto dissimile da quel che immagino ci sia in Google.

-- 
Flavio Visentin
GPG Key: http://www.zipman.it/gpgkey.asc

There are only 10 types of people in this world:
those who understand binary, and those who don't.
________________________________________________________
http://www.sikurezza.org - Italian Security Mailing List

Rispondere a