> Le 14 oct. 2021 à 11:15, Renaud Chaput <renchap+fr...@gmail.com> a écrit :
> 
> Il y a eu un post-mortem et une timeline de publiée :
> http://travaux.ovh.net/?do=details&id=53798&;
> 
> En gros la route-map était celle qui redistribuait BGP dans OSPF, et les
> 850k routes de l'internet se sont retrouvées dans leur OSPF, ce qui a fait
> exploser un peu tous les routeurs, et une grosse partie des routeurs se
> sont mis à prendre le routeur en question comme default route.
> 

Une seule zone OSPF pour un réseau de cette taille ? 

Pas de technicien sur site 24/24 pour un DC qui héberge des milliers de 
serveurs ?

Pas d’accès OOB avec des simples adsl d’un provider tiers sur des routers de 
bordure ?

Pas de gestion des déploiements avec un outil comme Ansible?

Et quoi encore ? On éteint un incendie de data center avec des extincteurs? Ah 
oui c’est le cas 😂

> Il n'y avait pas de staff OVH sur place, ils ont demandé au remote hands
> local d'intervenir, déjà en débranchant tous les uplinks du routeurs, puis
> au final en demandant à le débrancher électriquement. 10 minutes pour
> décider de faire ça, puis 30 minutes avant que le remote hands ne soit sur
> place, ça va encore.
> 
> Après peut-être qu'il y a des moyens plus propres de changer une conf Cisco
> que de copier/coller une config ligne par ligne hein ;)
> 
>> On Thu, Oct 14, 2021 at 11:07 AM Toussaint OTTAVI <t.ott...@bc-109.com>
>> wrote:
>> 
>> 
>> 
>>> Le 14/10/2021 à 09:47, David Ponzone a écrit :
>>> C’est un peu facile à dire tant que tu gères pas un réseau de ce type.
>> 
>> Justement, je n'ai aucune idée de la façon dont on gère un réseau de ce
>> type ! Je cherche juste à augmenter ma culture générale, pour le jour où
>> mon réseau atteindra cette taille :D
>> 
>>> Erreur sur la route-map, tous les subnets internes se retrouvent router
>> vers l’anti-DDoS.
>> 
>> Cà veut dire qu'un seul mec sur un seul routeur peut changer sur une
>> seule instruction toutes les routes de la planète ? Bon, si j'ai bien
>> compris, c'est pas de bol, un phénomène en cascade, et une accumulation
>> de mauvaises routes qui a saturé tous les autres routeurs... Le truc
>> assez imprévisible tant qu'il ne s'est pas produit au moins une fois...
>> 
>> --
>> Et le mec qui a fait la boulette, il ne s'en est pas aperçu de suite
>> pour revenir en arrière ? Même moi, à mon petit niveau, j'ai plein de
>> voyants "OVH" qui sont tous passés du vert au rouge en même temps...
>> 
>> Ou bien, c'est comme FB, il a perdu la main et n'avait pas d'OOB ?
>> 
>> --
>> C'est pas encore Vendredi, mais entre çà, FB, les numéros d'urgence il y
>> a quelques mois, je suis assez pessimiste sur l'avenir de cette
>> civilisation hyper-connectée... Et encore, ce n'étaient que des
>> pannes/erreurs... Qu'est-ce que çà serait si des "puissances ennemies"
>> avaient la mauvaise idée de cyber-attaquer ???
>> 
>> 
>> 
>> ---------------------------
>> Liste de diffusion du FRnOG
>> http://www.frnog.org/
>> 
> 
> ---------------------------
> Liste de diffusion du FRnOG
> http://www.frnog.org/


---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à