Re: [gull] Above Meltdown & Spectre

Daniel Cordey Thu, 08 Feb 2018 03:11:57 -0800

On 08. 02. 18 07:05, Dominik Madon wrote:


Le pipeline du Cortex-M15 de l’ARM, par exemple, compte 15 étages et permet 
d’exécuter 3 instructions en parallèle par cycle au maximum. Il peut en théorie 
traiter simultanément jusqu’à 59 instructions à différentes étapes de leur 
exécution. Voici un morceau de code que je viens d’extraire d’un de mes 
programmes en ligne de commande que j’utilise régulièrement (ce n’est _pas_ du 
benchmark):

Merci pour cette analyse très détaillée et intéressante. C'est justementla taille du BHT qui est intéressante. Tout ceci est très efficace pourdes pattern que l'on retrouve justement dans des programmes de calculintensif. Ce qui fait que ces techniques sont très utiles lorsque l'onfait des boucles, mais a un impact beaucoup plus limité sur desbranchements "one shot". L'impact est alors de 50% inférieur à lasituation idéale et se trouve noyé dans le reste; ce qui fait qu'à uncertain point on ne peux plus "mesurer" l'impact.

On fait des hypothèse sur la base de l'examen du code source. C'est bienmais ça fonctionne rarement comme ça, hélas. Le BHT est utilisé pourd'autres process, de même que les caches (L1 à L3). On peut bien sûr semettre dans une situation qui va minimiser l'impact des autres process,mais nous sommes sur des machines avec des process systemes qui tournentquoi que l'on fasse. En enlevant un max de process on se remet dans unesituation de toy benchmark qui nous permet d'obtenir des valeurs quepersonne n'arrivera à reproduire en situation réelle.

J'ai fait un jour l'expérience suivante : J'ai écrit un programme (enasembleur) allant lire le registre des clock tick sur un CPU. Puis, dansmon programme C appelant la fonction, j'ai essayé de déterminerl'overhead de cet appel, afin de le soustraire de mes calculs lorsque jevoulais mesurer une courte période de temps. A ma grande surprise, encollectant les valeurs, j'ai obtenu de grandes variations dans mesmesures. Donc, à un moment on est confronté au choix d'utiliser lavaleur minimum, ou une valeur moyenne... C'est ce jour là que j'aivéritablement saisi l'impact que les autres process peuvent avoir sur uncode même très court. Et encore... je ne faisais pas appel à des valeursen mémoires (caches), ni de stresse du BHT...


Maintenant... on peut aborder ce que tu dis :

permet d’exécuter 3 instructions en parallèle par cycle au maximum.

C'est justement dans le mot permet que ça devient intéressant. Donc,selon cette théorie, on devrait avoir un CPI de 0.33...Je me trompe où on en est loin ? Je n'ai pas de valeur pour l'ARM, maisles dernières valeurs que j'ai vu passées sont supérieures à 1. Bien quele CPI ne dise pas tout, c'est une indication. De plus, 3instructions... mais lesquelles ? Tout ceci est fantastique si toutesles instructions ne s'exécute qu'en un seul cycle. Or, beaucoupd'instructions nécessitent bien plus de cycle. Certains mode d'adressagesont d'ailleurs des tueurs dans ce domaine, de même que les opérationsde calcul, dont la division est un gros point noir. Alors, que cepasse-t-il dans ce cas dans le CPU ? Le CPU est-il en attente de la finde toutes les instructions, ou est-il capable de shifter une partie desinstructions dans le pipe (j'en doute). Qui plus est, si une instructionfait appel à une valeur qui ne se trouve pas dans la cache L1 ? Là leprocesseur est en "stall"...

Les techniques que tu décris pour l'ARM ne sont pas nouvelles, car ellessont toutes issues de ce qui a été introduit avec les processeurs RISCdans les années 80. C'est aussi là que l'on s'est rendu compte qu'il y aloin de la théorie à la pratique. Les techniques d'optimisation ontpermit de minimiser l'impact des pipe-flush, sans arriver à les éliminercomplètement.

La théorie et les hypothèses c'est bien et passionnant, mais c'estlorsque l'on fait véritablement des mesures que l'on se rend compte quecertaines choses ne sont pas ce que l'on croit.


dc



        

_______________________________________________
gull mailing list
[email protected]
http://forum.linux-gull.ch/mailman/listinfo/gull

Re: [gull] Above Meltdown & Spectre

Répondre à