> Au moment de ces pics ou crises, j'ai des messages tels que les suivants dans > les logs : > - tfeb0 LUCHIP(0) Congestion Detected, Active Zones > f:f:7:e:3:f:e:f:1:f:c:f:9:b:f:f > - tfeb0 Failed to send non-PEC pfe TOD update to other PFEs. Error code: 29. > - tfeb0 LUCHIP(0) cntx_single_step_timeout PPE0 cntx_id 18
LU = lookup unit. c'est le composant qui va réaliser le lookup d'un paquet pour voir ce qu'il doit en faire, vers où il doit être envoyé etc. chaque luchip a 16 packet processing engine (PPE) sur lesquels seront distribués en round-robin les paquets, et chaque ppe a 20 contextes pour paralléliser les opérations. Si tu as de la congestion + timeout à cet endroit là c'est assez mauvais comme tu as pu le constater. il faudrait essayer de voir en effet si c'est à cause d'un soucis hardware ou d'un niveau de trafic trop élevé. Passe en shell sur la tfeb : juniper@router> start shell pfe network tfeb0 de là, les premières choses à vérifier s'il y a des trucs sales : MX104-ABB-0(router vty)# show syslog messages MX104-ABB-0(router vty)# show nvram (j'ai pas de mx80 sous la main pour vérifier mais ça doit être assez proche) De même à vérifier : MX104-ABB-0(router vty)# show luchip 0 MX104-ABB-0(router vty)# show luchip 0 errors MX104-ABB-0(router vty)# show luchip 0 ppe 0 trap_info en fonction du message d'erreur tu devrais pouvoir essayer de déterminer si c'est plus hardware ou lié aux conditions. Eventuellement à vérifier aussi mais moins convaincu que ça affiche quelque chose de significatif dans ton cas : MX104-ABB-0(router vty)# show cmerror module brief => voir s'il y a des active errors, et si oui : MX104-ABB-0(router vty)# show cmerror module <module du luchip(0)> s'il y a des erreurs au niveau des liens de fabrique (hsl2) ça devrait être visible là. Une fois tous ces logs relevés tu devrais y voir un poil plus clair avant d'aller causer à Junipackard. --------------------------- Liste de diffusion du FRnOG http://www.frnog.org/
