* [[developpement:activites:integration|Integration]] ====== Stream SDK ATI sur une Debian Wheezy à partir de 0 ====== ===== Pourquoi cette page ? ===== La distribution Wheezy intègre dans son archive //non-free// les pilotes propriétaires et les librairies permettant d'exploiter les cartes graphiques pour le calcul scientifique, mais seulement pour sa version 12.6 : les cartes graphiques récentes ne sont pas supportées. Rappelons que l'API ATI.AMD dispose d'un avantage sur son concurrent Nvidia : l'intégration d'une librairie OpenCL permettant aussi bien d'utiliser son processeur généraliste que son processeur graphique. ===== Installation du SDK 2.8 ===== Contrairement à Nvidia, ATI utilise son pilote standard pour sa couche GPU. Le lien suivant défini les différents paquets à installer : * le pilote : la version 13.1 pour [[http://www2.ati.com/drivers/linux/amd-driver-installer-catalyst-13.1-linux-x86.x86_64.zip|32 ou 64 bits]] * le pilote : la version 13.2 pour [[http://www2.ati.com/drivers/beta/amd-driver-installer-catalyst-13.2-beta7-linux-x86.x86_64.zip|32 ou 64 bits]] # Pour le pilote "stable" wget http://www2.ati.com/drivers/linux/amd-driver-installer-catalyst-13.1-linux-x86.x86_64.zip # Pour le pilote "beta" : indispensable pour la HD 7340 à disposition wget http://www2.ati.com/drivers/beta/amd-driver-installer-catalyst-13.2-beta7-linux-x86.x86_64.zip * la boîte à outils : la version 2.8 pour [[http://developer.amd.com/wordpress/media/files/AMD-APP-SDK-v2.8-lnx32.tgz|32 bits]] et [[http://developer.amd.com/wordpress/media/files/AMD-APP-SDK-v2.8-lnx64.tgz|64 bits]]. Pas de ''wget'' possible puisqu'une validation est indispensable ! * La version future de OpenCL 1.2 [[http://developer.amd.com/Downloads/OpenCL1.2-Static-Cplus-preview-drivers-Linux.tgz|OpenCL 1.2]] http://developer.amd.com/Downloads/OpenCL1.2-Static-Cplus-preview-drivers-Linux.tgz ==== Installation du pilote ==== Pour commencer, plus grand chose sinon que le pilote AMD/ATI utilise ''dkms'' et plus ''module-assistant'' :apt-get install dkms # arret de GDM s'il est lancé /etc/init.d/gdm stop Le paquet ''scidavis'' installe ses plugins dans ''/usr/lib64'' ce qui ''casse'' le script d'installation des composants en les plaçant dans ''/usr/lib64'' au lieu de ''/usr/lib/x86_64-linux-gnu''. Le redémarrage semble nécessaire pour que le pilote ''radeon'' ne soit pas chargé. Puis, même lancement de l'installation du pilote, version 32 ou 64 bits : unzip amd-driver-installer-catalyst-13.1-linux-x86.x86_64.zip CC=/usr/bin/gcc-4.6 amd-driver-installer-catalyst-13.1-linux-x86.x86_64.run --force Au 1er mars 2013, le composant graphique intégré à l'AMD E2-1800 est un HD7340 : le pilote 13.1 ne fonctionne pas. Il faut donc passer sur le pilote beta, le 13.2-beta7 à cette date : unzip amd-driver-installer-catalyst-13.2-beta7-linux-x86.x86_64.zip CC=/usr/bin/gcc-4.6 amd-driver-installer-catalyst-13.2-beta7-linux-x86.x86_64.run --force ==== Installation de la boîte à outils ==== Pour le SDK, toujours aussi simple, par une simple décompression de l'archive à l'endroit idoine, soit ''/opt'' (il est supposé que l'archive se trouve dans ''/root'') : # Renommage d'un /opt/AMDAPP précédent [ -d /opt/AMDAPP ] && mv /opt/AMDAPP /opt/AMDAPP.old mkdir /tmp/AMDSDK-2.8 cd /tmp/AMDSDK-2.8 # En 32 bits, décompresser l'archive tar xzf /root/AMD-APP-SDK-v2.8-lnx32.tgz # En 64 bits, décompresser l'archive tar xzf /root/AMD-APP-SDK-v2.8-lnx64.tgz # Lancer le script d'installation ./Install-AMD-APP.sh # Etablir un lien pour pointer de manière générique les pilotes cd /opt mv AMDAPP AMDAPP-2.8 ln -s AMDAPP-2.8 AMDAPP # Generation du ld ldconfig ===== Installation de librairies scientifiques ===== ==== Téléchargement des sources et des exemples ==== Les éléments : * http://developer.amd.com/wordpress/media/files/clAmdBlas1.8.291.tar.gz * http://developer.amd.com/wordpress/media/files/LUDOpenCLBLAS-Linux.zip * http://developer.amd.com/wordpress/media/files/clAmdBlasREADME1.txt * http://developer.amd.com/wordpress/media/files/clAmdFft1.8.291.tar.gz * http://developer.amd.com/wordpress/media/files/clAmdFftREADME1.txt * http://developer.amd.com/wordpress/media/files/ObjectDetection-Linux.zip ==== Installation des librairies BLAS et FFT ==== mkdir /tmp/CLAMD cd /tmp/CLAMD tar xzf /root/clAmdBlas1.8.291.tar.gz ./install-clAmdBlas-1.8.291.sh # Taper accept pour accepter les conditions d'utilisation # Taper pour valider l'installation par défaut dans /opt/clAmdBlas-1.8.291 tar xzf /root/clAmdFft1.8.291.tar.gz ./install-clAmdFft-1.8.291.sh # Taper accept pour accepter les conditions d'utilisation # Taper pour valider l'installation par défaut dans /opt/clAmdFft-1.8.291 cd /opt ln -s clAmdBlas-1.8.291 clAmdBlas ln -s clAmdFft-1.8.291 clAmdFft # chown -R root.root /opt/clAmdBlas /opt/clAmdFft # Pour une architecture 64 bits echo -e "/opt/clAmdBlas/lib64\n/opt/clAmdFft/lib64" > /etc/ld.so.conf.d/clAmd.conf # Pour une architecture 32 bits echo -e "/opt/clAmdBlas/lib32\n/opt/clAmdFft/lib32" >> /etc/ld.so.conf.d/clAmd.conf # ldconfig ==== Installation des librairies aparapi ==== cd /opt mkdir aparapi cd /opt/aparapi wget http://aparapi.googlecode.com/files/Aparapi_2013_01_23_linux_x86_64.zip unzip Aparapi_2013_01_23_linux_x86_64.zip ==== Compilation des exemples du SDK ==== Ensuite, la compilation des exemples : ceux de CAL ont disparus, il reste ceux d'OpenCL : apt-get -y install libxi-dev libxmu-dev freeglut3-dev # Cet export de variable est indispensable pour la compilation correcte des exemples parapi export LIBAPARAPI=/opt/aparapi/ cd /opt/AMDAPP/samples make ==== Exécution des exemples du SDK ==== Enfin, l'exécution des exemples OpenCL : # pour une architecture 64 bits cd /opt/AMDAPP/samples/opencl/bin/x86_64 # pour une architecture 32 bits cd /opt/AMDAPP/samples/opencl/bin/x86 # lancer tous les exemples find . -executable ! -iname "*.cl" -exec {} \; ==== Compilation des exemples des librairies ClBlas et ClFft ==== apt-get install cmake export AMDAPPSDKROOT=/opt/AMDAPP cd /opt/clAmdBlas/samples cmake . make cd /opt/clAmdFft/samples # Ces gros nuls n'ont pas verifie leur CMake : il plante ! sed -i "s/\.\.\/\.\.\/\.\.\\//common//g" CMakeLists.txt # (le cmake pointe pour quelques sources au mauvais endroit !) cmake . make ==== Exécution des exemples des librairies ClBlas et ClFft ==== ===== Installation de PyOpenCL ===== Téléchargement des sources sur : http://mathema.tician.de/software/pyopencl ==== Préparation de la compilation ==== apt-get -y install libboost-thread-dev python-setuptools cd /opt git clone http://git.tiker.net/trees/pyopencl.git cd pyopencl git submodule init git submodule update ==== Compilation et installation de PyOpenCL ==== Il est supposé que le dossier d'installation du SDK ATI se trouve dans ''/opt/AMDAPP'' : ./configure.py --boost-inc-dir=/usr/include --boost-lib-dir=/usr/lib --boost-python-libname=boost_python-py27 --cl-inc-dir=/opt/AMDAPP/include --cl-lib-dir=/opt/AMDAPP/lib/x86_64 --boost-compiler=/usr/bin/g++-4.7 CC=/usr/bin/gcc-4.7 CXX=/usr/bin/g++-4.7 make make install python setup.py build python setup.py install ==== Exécution des exemples ==== Pour l'exemple standard, très intéressant parce que permettant de visualiser autant processeur graphique que générique : cd examples python benchmark-all.py Sur un ASUS X55U avec un processeur AMD E2-1800 équipée d'une carte Radeon HD 7340 : Execution time of test without OpenCL: 0.287725925446 s =============================================================== Platform name: AMD Accelerated Parallel Processing Platform profile: FULL_PROFILE Platform vendor: Advanced Micro Devices, Inc. Platform version: OpenCL 1.2 AMD-APP (1113.2) --------------------------------------------------------------- Device name: Loveland Device type: GPU Device memory: 192 MB Device max clock speed: 523 MHz Device compute units: 2 Device max work group size: 256 Device max work item sizes: [256, 256, 256] Data points: 8388608 Workers: 256 Preferred work group size multiple: 32 Execution time of test: 0.022523 s Results OK =============================================================== Platform name: AMD Accelerated Parallel Processing Platform profile: FULL_PROFILE Platform vendor: Advanced Micro Devices, Inc. Platform version: OpenCL 1.2 AMD-APP (1113.2) --------------------------------------------------------------- Device name: AMD E2-1800 APU with Radeon(tm) HD Graphics Device type: CPU Device memory: 3547 MB Device max clock speed: 850 MHz Device compute units: 2 Device max work group size: 1024 Device max work item sizes: [1024, 1024, 1024] Data points: 8388608 Workers: 256 Preferred work group size multiple: 1 Execution time of test: 0.0759986 s Results OK ===== Précautions d'usage ===== Pour une utilisation du GPU à distance, il est nécessaire de procéder à quelques modifications de son système, sans quoi, l'usage du GPU n'est pas possible ==== Modification du GDM3 ==== A la fin de ''/etc/gdm3/Init/Default'', avant le ''exit 0'', rajouter les deux lignes suivantes : xhost + chmod uog+rw /dev/dri/card* Les talibans de la sécurité me diront que c'est permettre à quiconque d'afficher ce qu'il veut sur l'écran, malheureusement il n'y a pas le choix ! ==== Connexion sans redirection X11 ==== De plus, lors d'une connexion distante, demander à ce que le X11 ne soit pas rediriger avec l'option ''-x'' associée au SSH. --- //[[emmanuel.quemener@ens-lyon.fr|Emmanuel Quemener]] 2013/03/21 10:25//