On Thu, 14 Oct 2021 11:14:57 +0200
Renaud Chaput <renchap+fr...@gmail.com> wrote:
>| En gros la route-map était celle qui redistribuait BGP dans OSPF, et les
>| 850k routes de l'internet se sont retrouvées dans leur OSPF, ce qui a fait
>| exploser un peu tous les routeurs, et une grosse partie des routeurs se
>| sont mis à prendre le routeur en question comme default route.

Ca veut dire qu'au niveau design, on a un seul OSPF pour tout le réseau OVH ?

Avec de l'OSPF par site et des échanges inter-sites plutôt en BGP, avec donc
possibilité de filtrage à la fois en OUT sur un routeur et en IN sur le
routeur en face, ce genre de boulette n'aurait pas eu d'impact (global), non ?


>| Il n'y avait pas de staff OVH sur place, ils ont demandé au remote hands
>| local d'intervenir, déjà en débranchant tous les uplinks du routeurs, puis
>| au final en demandant à le débrancher électriquement. 10 minutes pour
>| décider de faire ça, puis 30 minutes avant que le remote hands ne soit sur
>| place, ça va encore.

D'où l’intérêt d'avoir un accès OOB complet  (serial over ssh + possibilité
de off/on/reboot à distance autonome via PDU).

Mais c'est clair que dans ce genre de situation les minutes passent très vite
(sauf celles ou on attend que l'intervenant arrive sur place, celles là sont
très très longues). Difficile de faire beaucoup beaucoup mieux en terme de
temps sur ce cycle décision-execution-convergence..

Manuel, qui retourne gérer son tout petit réseau :)

--
______________________________________________________________________
Manuel Guesdon - OXYMIUM


---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à