> Au moment de ces pics ou crises, j'ai des messages tels que les suivants dans 
> les logs :
> - tfeb0 LUCHIP(0) Congestion Detected, Active Zones 
> f:f:7:e:3:f:e:f:1:f:c:f:9:b:f:f
> - tfeb0 Failed to send non-PEC pfe TOD update to other PFEs. Error code: 29.
> - tfeb0 LUCHIP(0) cntx_single_step_timeout PPE0 cntx_id 18

LU = lookup unit. c'est le composant qui va réaliser le lookup d'un
paquet pour voir ce qu'il doit en faire, vers où il doit être envoyé
etc.

chaque luchip a 16 packet processing engine (PPE) sur lesquels seront
distribués en round-robin les paquets, et chaque ppe a 20 contextes
pour paralléliser les opérations.

Si tu as de la congestion + timeout à cet endroit là c'est assez
mauvais comme tu as pu le constater. il faudrait essayer de voir en
effet si c'est à cause d'un soucis hardware ou d'un niveau de trafic
trop élevé.

Passe en shell sur la tfeb :

juniper@router> start shell pfe network tfeb0

de là, les premières choses à vérifier s'il y a des trucs sales :
MX104-ABB-0(router vty)# show syslog messages
MX104-ABB-0(router vty)# show nvram

(j'ai pas de mx80 sous la main pour vérifier mais ça doit être assez proche)

De même à vérifier :
MX104-ABB-0(router vty)# show luchip 0
MX104-ABB-0(router vty)# show luchip 0 errors
MX104-ABB-0(router vty)# show luchip 0 ppe 0 trap_info

en fonction du message d'erreur tu devrais pouvoir essayer de
déterminer si c'est plus hardware ou lié aux conditions.

Eventuellement à vérifier aussi mais moins convaincu que ça affiche
quelque chose de significatif dans ton cas :
MX104-ABB-0(router vty)# show cmerror module brief
=> voir s'il y a des active errors, et si oui :
MX104-ABB-0(router vty)# show cmerror module <module du luchip(0)>

s'il y a des erreurs au niveau des liens de fabrique (hsl2) ça devrait
être visible là.

Une fois tous ces logs relevés tu devrais y voir un poil plus clair
avant d'aller causer à Junipackard.


---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à