Le ven. 13 févr. 2026 à 17:41, Aurelien Dieval <[email protected]> a écrit :
>
> En effet, je crois qu'on est sur quelque chose.
> A peine connecté en shell sur la tfeb0 que popent les messages suivants au 
> rythme de 1 par seconde :
> [Feb 13 16:07:19.147 LOG: Info] PPE Thread Timeout Trap:  Count 5720824, PC 
> 369,     0x0369:  ktree_nh_launch
> [Feb 13 16:07:21.147 LOG: Info] PPE Thread Timeout Trap:  Count 5720832, PC 
> 7ec,     0x07ec:  KTree_Terminate_With_Default_Route
> [Feb 13 16:07:23.147 LOG: Info] PPE Thread Timeout Trap:  Count 5720839, PC 
> 4c,     0x004c:  KT4Way_ARS01_trap
> [Feb 13 16:07:25.147 LOG: Info] PPE Thread Timeout Trap:  Count 5720844, PC 
> 7ee,     0x07ee:  KT4Way_BTT0_ARS00
>
> Et d'autres. Sans même demander à voir les messages syslog. Et en les 
> consultant j'ai évidemment ces mêmes messages.
>
> Le nvram m'indique parmis d'autres LOG: Emergency avec un numéro de frame et 
> des adresses matériel (apriori ?) en hex pour "sp" et "pc" :
> [Feb  5 09:02:28.129 LOG: Emergency] <160>Free interrupt violation!
> Et fini par conclure :
> MPC: Reset reason (0x80): Software initiated CPU reset
>
> Ceci se répète a priori 5 fois.
>
> luchip 0 error m'indique qu'il n'y a pas d'enregistrement alors que luchip 0 
> ppe 0 trap_info m'indique
> PPE Thread Timeout Trap:  Count 5723096, PC 7fd,     0x07fd:  
> KT4Way_update_with_secondary_and_continue
>
> cmerror brief m'indique une valeur dont je ne comprend pas la cohérence.
> Le MX est à 0 active errors sur l'ensemble des module sauf LUCHIP(0) qui est 
> à 4 278 032 188
> Ce qui je trouve en soit est énorme mais d'autant plus mis en rapport avec le 
> cmerror du module LUCHIP(0)
> Ce dernier m'indique que tout les éléments sont à 0 erreurs, sauf le dernier 
> dont l'id est 0x040008 qui m'indique :
> Occured 94, Cleared 94 et last-occurred il y a 10881595ms soit il y a à peu 
> près 1h30.

jamais vu ces erreurs en particulier, mais ça semble faire penser à un
bon gros soucis sur la tfeb. Vu que tu dis qu'il n'y a qu'une default
et pas une full table, je sèche sur les raisons du timeout.

> Vu tout ça, j'ai l'impression que le ticket JTAC devient inévitable.
> Merci pour ces pistes détaillées, pourrais-tu me dire ce que tu penses de ce 
> retour ?

jtac oui, mais en attendant une extinction / démarrage des familles.
Pas juste un reboot, une vraie extinction où tout est bien éteint et
débranché. Et ensuite jtac.


---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à