Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | Prochaine révision Les deux révisions suivantes | ||
developpement:activites:qualification:30ans1code [2019/11/27 17:58] equemene [Parallélisation avec OpenCL] |
developpement:activites:qualification:30ans1code [2019/12/16 11:28] equemene [Parallélisation avec OpenCL] |
||
---|---|---|---|
Ligne 343: | Ligne 343: | ||
=== Intégration des accélérateurs en OpenCL === | === Intégration des accélérateurs en OpenCL === | ||
+ | == Première comparaison avec la première Tesla == | ||
+ | En 2008, Nvidia titre [[https://www.nvidia.com/docs/IO/43395/NV_DS_Tesla_PSC_US_Mar09_LowRes.pdf|Tesla Personal Supercomputer]]. Dans une machine au format "station de travail", de 3 à 4 Nvidia Tesla C1060. Avec un puissance estimée à 4 TFlops, l'article précise que cette station équivaut à 250 ordinateurs personnels. | ||
+ | |||
+ | La première étape consiste donc à comparer cette machine avec une station de travail gonflée ou un serveur bisocket équivalent. A l'époque, le processeur "fer de lance" de Intel est le Harpertown, un assemblage de 2 Core2 Duo Penryn. | ||
+ | |||
+ | {{ :developpement:activites:qualification:c1060_harpertown.png?500 |}} | ||
+ | |||
+ | En Mono, la Tesla C1060 est 3.5x plus rapide que le serveur bi-socket en OpenCL, l'OpenMP étant très légèrement inférieur en performances. En BB, c'est une toute autre affaire : l'OpenCL de la Tesla est à peine supérieure à la version OpenMP du serveur bi-socket. La version OpenCL d'AMD, exploitée ici, est dramatiquement inefficace face à l'OpenMP. Ainsi, déjà, nous constatons que, poiur notre première exploitation de GPU, son comportement n'est pas du tout éauivalent en fonction de la "charge" que nous portons à chaque processus élémentaire. | ||
+ | |||
+ | == AMD : les trois dernières générations == | ||
+ | |||
+ | Nous nous propulsons en 2019. Face aux meilleurs de nos processeurs (le Threadripper 1950X et l'Intel C4145), nous opposons les trois dernières générations AMD : Nano Fury, Vega 64 et Radeon 7 (ou Vega 2). | ||
+ | |||
+ | {{ :developpement:activites:qualification:amdvsbestcpu.png?500 |}} | ||
+ | |||
+ | Nous constatons que ce n'est "que" pour la dernière génération de GPU que AMD dépasse sensiblement nos meilleurs CPU. Avec la Radeon 7, les performances sont entre 2 et 3 fois supérieures en BB et en Mono. Le ratio de performances entre Mono et BB passe de presque 10 à moins de 4, preuve que AMD, dans ses dernières générations adopte un comportement à la charge comparable à celui d'un processeur. | ||
+ | |||
+ | == Nvidia : 5 générations de "Gaming" == | ||