On 15/11/2017 23:57, Olivier Calzi wrote:
Bonsoir à tous,
Après l'OVHGATE qui pour moi semble ne pas avoir été au infos (pour ma
part je n'ai rien vu sur mon journal télévisé du soir), je voulais
sonder vos réflexion.
Pouvons nous dire qu'il y a un avant et un après OVHGATE dans le monde
de l'entreprise FR ? ou la technique de l'autruche es-t’elle en
application ?
Les dossiers de DRP/PRA sont'ils remis en avant dans les SI ?
Comment parler vous de cet incident ?
Je me pose ces question après avoir observer par mois même ou à distance
via les réseau l'application de la stratégie de l'autruche.
Je ne veux ici n'attaquer nullement les équipes d'OVH qui ont fais un
boulot énorme avec ce qui leurs est tombée dessus, je sais qu'une merde
cela arrive à tout le monde.
Pour moi cela est juste une bonne piqûre de rappel de certains
principes/faits :
- la loi de murphy existe, le pire scénario arrivera toujours.
- OVH reste un hébergeur low-cost. Je m'explique :
- la panne de SBG est "normale". Deux câbles d'arrivés électriques
n'assurent pas une redondance. Ceci est clairement expliqué d'ailleurs
dans le mail d'Octave. Une vrai redondance c'est deux chaînes
d'alimentations (cables, onduleurs, groupes) complètement séparés qui
vont jusqu'aux serveurs.
- la panne de RBX était prévisible. Une seule infra optique, sans
OOB, avec du matos d'un seul constructeur pas spécifiquement réputé pour
ces matériels de réseaux optiques, c'était un choix low-cost/simple.
- il n'y a pas de miracle les prix bas d'OVH se ressentent
nécessairement sur l'infra.
Ceci dit on peut quand même admirer la transparence dans la
communication, ce qui pour moi n'a pas de prix.
- héberger toutes son infra chez un seul acteur (qu'il soit OVH, AWS ou
autre) même sur du multi-DC/région, c'est prendre un risque. C'est un
calcul financier à faire, car un DRP/PRA cela coûte cher (et cela ne
marche pas forcement le jour ou on en a besoin). Si ton buisness ne
supporte pas d'avoir 2H de coupure tous les 4 ans c'est tendu, car les
vrais archis multi providers qui résistent ne sont pas évidente à mettre
en place (shared nothing).
Ce genre d'incident réveille peut être les décideurs coupé de la
technique ? qui auront oublié dans deux semaines.
--
Raphael Mazelier
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/