Bonjour,

Je penses être au bon endroit pour poser ma question mais si ce n'est pas le 
cas j'en suis désolé.

Nous avons un routeur cœur de réseau Juniper MX80 sur le quel nous avons un 
transit 10G, deux interfaces de collecte de lien en 10G et quelques 
périphériques de la baie connectés en 1G.

Depuis quelques mois nous constatons des pics de latences tous les jours, 
toutes les 5-10 minutes d'une durée de 600ms à quelques secondes vers et depuis 
internet, vers et depuis la collecte, vers et depuis les autres équipement de 
la baie.
Ces pics font passer d'une latence habituelle de 4ms à 200ms, pouvant atteindre 
800ms dans de rares cas.

Jeudi dernier, nous avons rencontré un épisode de crise où les latences 
faisaient le yoyo entre 400 et 2000ms quasiment toute la journée.
Ça a commencé doucement vers 1h30 et devenu impraticable pour l'ensemble des 
clients à partir de 8h40. La situation est revenue à la normale vers 18h.
Depuis ce jour, nous avons au moins un événement de yoyo par jour pendant 5 à 
10 de minutes.
Au moment de ces pics ou crises, j'ai des messages tels que les suivants dans 
les logs :
- tfeb0 LUCHIP(0) Congestion Detected, Active Zones 
f:f:7:e:3:f:e:f:1:f:c:f:9:b:f:f
- tfeb0 Failed to send non-PEC pfe TOD update to other PFEs. Error code: 29.
- tfeb0 LUCHIP(0) cntx_single_step_timeout PPE0 cntx_id 18


Les diagnostiques que j'ai consultés ne révèlent rien de particulier ou en tout 
cas rien qui me saute aux yeux.
J'ai deux théories :
- Attaques DDoS
- Fatigue de carte TFEB

Avant de vous noyer avec plus d'infos si vous en voulez, je fais appel à votre 
expérience collective.
Avez-vous déjà rencontré ce genre de problématiques ?
L'une des mes théorie peut-elle être prouvée / réfutée ?
Avez-vous une autre théorie selon votre vécu ?

D'avance un grand merci pour vos retours.
Aurélien Dieval

---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à