Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | Dernière révision Les deux révisions suivantes | ||
formation:insa2020gpu [2020/12/07 04:53] equemene [De BLAS aux xGEMM : les différentes implémentations] |
formation:insa2020gpu [2020/12/07 04:54] equemene [Exploitations de xGEMM] |
||
---|---|---|---|
Ligne 403: | Ligne 403: | ||
Nous avons alors 12 exécutables de la forme ''xGEMM_SP_<version>'' ou ''xGEMM_DP_<version>'' : | Nous avons alors 12 exécutables de la forme ''xGEMM_SP_<version>'' ou ''xGEMM_DP_<version>'' : | ||
- | * ''fblas'' utilisant la librairie ATLAS, pour CPU | ||
* ''openblas'' utilisant la librairie OpenBLAS, pour CPU | * ''openblas'' utilisant la librairie OpenBLAS, pour CPU | ||
* ''gsl'' utilisant la librairie GSL (pour //GNU Scientific Librairies//) | * ''gsl'' utilisant la librairie GSL (pour //GNU Scientific Librairies//) | ||
+ | * ''fblas'' utilisant la librairie OpenBLAS mais pour des appels fortran, pour CPU | ||
* ''cublas'' utilisant la librairie cuBLAS avec une gestion externe de la mémoire | * ''cublas'' utilisant la librairie cuBLAS avec une gestion externe de la mémoire | ||
* ''thunking'' utilisant la librairie cuBLAS avec une gestion interne de la mémoire | * ''thunking'' utilisant la librairie cuBLAS avec une gestion interne de la mémoire |