On 03/01/2011 10:10 AM, Piero Cavina wrote: > Forse avrete sentito parlare del bug di GMail che ha causato la > cancellazione di qualche migliaio di mailbox. E' uscito un comunicato > di Google che spiega come il bug abbia innescato una cancellazione > delle repliche dei dati degli utenti (ma non c'era un "sanity check" > contro le repliche distruttive anomale?),
Qualsiasi sanity check può essere buggato. Considerando la mole di dati trattati dal servizio e la quantità di utenti che lo utilizzano un evento di questa portata rientra nella normalità e nell'errore comune. Personalmente mi stupisce di più la rarità di tali situazioni che nelle installazioni comunemente trovate nelle aziende avviene con frequenza almeno annuale :-) > per cui hanno dovuto > ricorrere ai backup su nastro per il ripristino > (http://gmailblog.blogspot.com/2011/02/gmail-back-soon-for-everyone.html). > Non avevo mai sentito parlare dell'uso di nastri da parte di Google > per il backup dei dati utente (loro stesso hanno sempre messo in > evidenza l'architettura replicata). La replica non necessariamente è un backup, anzi, in genere non lo è proprio perché è una replica. Al più è funzionale al backup nel senso che fare un backup da una replica consente di sfruttare funzionalità di snapshotting senza intaccare la produzione da un punto di vista delle performance. In ogni caso nessuno strumento continuamente online può essere considerato un backup degno di tale nome. > A voi sembra una cosa credibile, considerata la mole di dati sviluppata? Il costo per TB di un nastro è ancora considerevolmente inferiore al costo del disco, e le caratteristiche sia di robustezza che di durata del nastro sono ancora di molto superiori a quelle ottenibili con storage a disco. Da sempre lo strumento elettivo per il backup è il tape, specie quando la mole di dati da salvare è considerevole, quindi non solo mi sembra credibile che Google lo utilizzi, ma mi sembra anche l'unica soluzione intelligente da implementare in strutture di questo tipo e lo prova il fatto che il backup abbia assolto il proprio dovere egregiamente. > Quale tipo di hardware possono utilizzare? La tecnologia molto probabilmente sarà varia e includerà LTO5 che ad oggi è la tecnologia ampiamente diffusa con le performance migliori sia in termini di velocità che di densità (1TB/h e 1.6TB netti a nastro). Poi di hardware che la implementano ce ne sono decine... P.es. IBM offre la 3500 che arriva a 30PB di dati non compressi http://www-03.ibm.com/systems/it/storage/tape/ts3500/index.html HP offre le storagework ESL http://h10010.www1.hp.com/wwpc/us/en/sm/WF25a/12169-304612-304631-304631-304631-392031.html Quantum propone la Scalar i6000 http://www.quantum.com/Products/TapeLibraries/Scalari6000/Index.aspx E ovviamente essendo Google distribuita avrà gli stessi dati in librerie situate in datacenter diversi. Ricordo che quando lavoravo in IBM c'era un reparto incaricato della gestione dei backup e oltre a due librerie di una decina di metri di lunghezza c'era una stanza ricoperta di scaffalature porta nastri... non dovrebbe essere molto dissimile da quel che immagino ci sia in Google. -- Flavio Visentin GPG Key: http://www.zipman.it/gpgkey.asc There are only 10 types of people in this world: those who understand binary, and those who don't.
________________________________________________________ http://www.sikurezza.org - Italian Security Mailing List
