Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision Les deux révisions suivantes
developpement:activites:qualification:30ans1code [2019/11/27 17:36]
equemene [Parallélisation avec OpenCL]
developpement:activites:qualification:30ans1code [2019/11/27 17:58]
equemene [Parallélisation avec OpenCL]
Ligne 329: Ligne 329:
 Regardons ces performances maintenant en intégrant les temps de transferts Regardons ces performances maintenant en intégrant les temps de transferts
  
-{{ :​developpement:​activites:​qualification:​cpu_compute_bb.png?500 |}}+{{ :​developpement:​activites:​qualification:​cpu_elapsed_mono.png?500 |}} 
 + 
 +En Mono, le Threadripper se retrouve au même niveau en OpenCL qu'en OpenMP. Seul le dernier Skylake Intel W-2145 gagne un facteur 2.5x entre OpenCL et OpenMP. Les autres gagnent timidement de 80% à quelques dizaines de %. Le Silver déçoit en étant moins performant en OpenCL qu'en OpenMP. 
 + 
 +{{ :​developpement:​activites:​qualification:​cpu_elapsed_bb.png?​500 |}} 
 + 
 +En BB, nous réalisons quasiment les mêmes constats : Threadripper de second à cinquième, meilleur en OpenMP que OpenCL ; les Skylake bien meilleurs d'un facteur presque 3 en OpenCL ; le Silver et les deux Broadwell avec quelques % de mieux. Le système E5-2680v4  
 + 
 +Quelles conclusions tirer de ces comparaisons ? 
 + 
 +Tout d'​abord qu'​Intel a très bien travaillé son OpenCL pour ses propres processeurs... Sans les Skylake, essentiellement le Gold et le W-2145, les gains seraient substantiels pour la partie **Compute** mais fondent dès que les temps de transfert sont intégrés. Puis que le Threadripper "​résiste",​ mais pas pour tous les usages : un test trop sommaire peut donc rapidement induire en erreur quant à la performance d'un processeur. Ensuite que les processeurs anciens, dès lors que l'​implémentation Intel est exploitable (donc après la génération Nehalem), l'​OpenCL reste une bonne option. Enfin que, avec OpenCL, notre ratio de performances de calcul frise les 100 millions en BB et 35 millions en Mono. En intégrant les transferts, ces ratios tombent à 81 millions en BB et 17 millions en Mono : 8 ordres de grandeurs séparent des processeurs séparés de 30 ans. 
 + 
 +=== Intégration des accélérateurs en OpenCL ===
  
-Pour Mono, le Threadripper se retrouve au même niveau en OpenCL qu'en OpenMP. Seul le dernier Skylake Intel W-2145 gagne un facteur 2.5x entre OpenCL et OpenMP. Les autres gagnent timidement de 80% à quelques dizaines de %. Le Silver déçoit en  
  
  
  
developpement/activites/qualification/30ans1code.txt · Dernière modification: 2019/12/17 15:34 par equemene