developpement:activites:qualification:30ans1code

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- developpement:activites:qualification:30ans1code [2019/11/27 17:58]
equemene [Parallélisation avec OpenCL]
+++ developpement:activites:qualification:30ans1code [2019/12/16 11:28]
equemene [Parallélisation avec OpenCL]
@@ Ligne 317: / Ligne 317: @@
 === Les performances sur tous les processeurs en OpenCL ===
-Focalisons nous sur la capacité de calcul, donc le "Compute Time" pour les simulations **Mono** ou **BB*.
+Focalisons nous sur la capacité de calcul, donc le "Compute Time" pour les simulations **Mono** ou **BB**.
 {{ :developpement:activites:qualification:cpu_compute_mono.png?500 |}}
@@ Ligne 343: / Ligne 343: @@
 === Intégration des accélérateurs en OpenCL ===
+== Première comparaison avec la première Tesla ==
+En 2008, Nvidia titre [[https://www.nvidia.com/docs/IO/43395/NV_DS_Tesla_PSC_US_Mar09_LowRes.pdf|Tesla Personal Supercomputer]]. Dans une machine au format "station de travail", de 3 à 4 Nvidia Tesla C1060. Avec un puissance estimée à 4 TFlops, l'article précise que cette station équivaut à 250 ordinateurs personnels.
+La première étape consiste donc à comparer cette machine avec une station de travail gonflée ou un serveur bisocket équivalent. A l'époque, le processeur "fer de lance" de Intel est le Harpertown, un assemblage de 2 Core2 Duo Penryn.
+{{ :developpement:activites:qualification:c1060_harpertown.png?500 |}}
+En Mono, la Tesla C1060 est 3.5x plus rapide que le serveur bi-socket en OpenCL, l'OpenMP étant très légèrement inférieur en performances. En BB, c'est une toute autre affaire : l'OpenCL de la Tesla est à peine supérieure à la version OpenMP du serveur bi-socket. La version OpenCL d'AMD, exploitée ici, est dramatiquement inefficace face à l'OpenMP. Ainsi, déjà, nous constatons que, poiur notre première exploitation de GPU, son comportement n'est pas du tout éauivalent en fonction de la "charge" que nous portons à chaque processus élémentaire.
+== AMD : les trois dernières générations ==
+Nous nous propulsons en 2019. Face aux meilleurs de nos processeurs (le Threadripper 1950X et l'Intel C4145), nous opposons les trois dernières générations AMD : Nano Fury, Vega 64 et Radeon 7 (ou Vega 2).
+{{ :developpement:activites:qualification:amdvsbestcpu.png?500 |}}
+Nous constatons que ce n'est "que" pour la dernière génération de GPU que AMD dépasse sensiblement nos meilleurs CPU. Avec la Radeon 7, les performances sont entre 2 et 3 fois supérieures en BB et en Mono. Le ratio de performances entre Mono et BB passe de presque 10 à moins de 4, preuve que AMD, dans ses dernières générations adopte un comportement à la charge comparable à celui d'un processeur.
+== Nvidia : 5 générations de "Gaming" ==

developpement/activites/qualification/30ans1code.txt · Dernière modification: 2019/12/17 15:34 par equemene

Rechercher

Translations

Navigation

Piste:

Boîte à outils