On 28/01/2014 15:42, Philippe STRAUSS wrote:
non, là il s'agit simplement de démontrer une manière de générer du C pour aboutir en terme de génération de code avec un algo "cache oblivious".
Oui, je sais, mais il me semble que cela sous-entend une extrapolation vers d'autres cas d'application plus complexe. L'exemple de la FFT n'est là que pour démontrer le concept de base en laissant penser que cel peut s'étendre à des problèmes beaucoup plus complexes. Et c'est là que je ne suis plus d'accord. Toutefois, si on se limite à ce qui se fait aujourd'hui en VHDL... d'accord.
as-tu fais de l'assembleur SIMD? entre la profondeur du pipeline, les branch mis-prediction, les interactions entre cache L1 et L2, je peux t'assurer que tu te tires une balle vite fait, à la pogne.
PA-RISC et HP-PA, ou plus précisemment le paralellisme avec des "prédicats"... Comme tu dis... t'as vraiment pas envie de faire ça à la mano. Même une multiplication de matrice te prends la tête. Néanmoins, Il y plein d'autres choses liées au passage des parametres, au nombreuses techniques d'optimisation et il n'est pas possible d'écrire une fonction de transfert qui fasse tout en une passe, hélas. L'optimisation du code "executable" ne semble pas pouvoir se passer de plusieurs passes. O{1-3} des compilateurs n'étant que la partie visible de l'iceberg.
des outils au dessus de asm SIMD, c'est une nécessité, pas de la branlette d'universitaire arrivé là par über bachotage aux p'tit tas de coco, à la ritaline bien bien dosée et qui fondamentalement ne sais rien faire de pragmatique.
Exellent :-) dc _______________________________________________ gull mailing list [email protected] http://forum.linux-gull.ch/mailman/listinfo/gull
