Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
ressources:gridengine4cbp [2017/07/06 11:37] equemene [Utilisation du Cluster (et GridEngine) au Centre Blaise Pascal] |
ressources:gridengine4cbp [2021/09/24 16:05] (Version actuelle) equemene [Introduction] |
||
---|---|---|---|
Ligne 27: | Ligne 27: | ||
dispose d'une infrastructure de production]]. | dispose d'une infrastructure de production]]. | ||
- | Les équipements mis à disposition derrière le soumissionneur GridEngine se composent de 20 noeuds dans 3 groupes différents pour un total de 176 coeurs et 640 Go de RAM. | + | Les équipements mis à disposition derrière le soumissionneur GridEngine se composent de 166 noeuds dans 8 groupes différents pour un total de 1416 coeurs et 6016 Go de RAM. |
- | Sur les 72 noeuds R410 arrivés entre le printemps 2014 et l'automne 2015, seuls 8 sont disponibles via le gestionnaire GridEngine. Les noeuds C6100 sont des équipements de prêt connectés un chassis hôte de GPGPU C410X. | + | Sur les 52 noeuds R410 arrivés entre le printemps 2014 et l'automne 2015, tous sont disponibles via le gestionnaire GridEngine. |
| **Cluster** | **Marque** | **Modèle** | **Noeuds** | **Coeurs /Noeud** |**RAM /Noeud**|**Réseau GE**|**Réseau IB**|**Total Coeurs**|**Total RAM**| | | **Cluster** | **Marque** | **Modèle** | **Noeuds** | **Coeurs /Noeud** |**RAM /Noeud**|**Réseau GE**|**Réseau IB**|**Total Coeurs**|**Total RAM**| | ||
- | | **r410ddr** | Dell | R410 | 8 | 8 | 24Go | GE | IB DDR | 64 | 192 Go | | + | | **r410qdr** | Dell | R410 | 32 | 8 | 24 Go | GE | IB QDR | 256 | 1536 Go | |
- | | **r410qdr** | Dell | R410 | 64 | 8 | 24Go | GE | IB QDR | 512 | 1536 Go | | + | | **r410ddr** | Dell | R410 | 4 | 8 | 24 Go | GE | IB DDR | 32 | 96 Go | |
- | | **x41z** | Sunfire | x41z | 8 | 8 | 32Go | GE | IB | 64 | 256 Go | | + | |
- | | **c6100** | Dell | C6100 | 4 | 12 | 48Go | GE | IB | 48 | 192 Go | | + | |
Ces clusters partagent exactement la même image de système, [[developpement:productions:sidus|Sidus]] (pour Single Instance Distributing Universal System), un système complet Debian intégrant tous les paquets scientifiques ainsi que de nombreux paquets de développement. | Ces clusters partagent exactement la même image de système, [[developpement:productions:sidus|Sidus]] (pour Single Instance Distributing Universal System), un système complet Debian intégrant tous les paquets scientifiques ainsi que de nombreux paquets de développement. | ||
Ligne 50: | Ligne 48: | ||
===== Dossiers personnels ===== | ===== Dossiers personnels ===== | ||
- | Sur la passerelle ''lethe'', chaque utilisateur dispose de 3 espaces utilisateurs : | + | Sur la passerelle ''lethe'', chaque utilisateur dispose de 4 espaces utilisateurs : |
* un local dans ''/home/<login>'' | * un local dans ''/home/<login>'' | ||
* un général dans ''/cbp/<login>'' | * un général dans ''/cbp/<login>'' | ||
Ligne 56: | Ligne 54: | ||
* un projet dans ''/projects'' | * un projet dans ''/projects'' | ||
- | Le second correspond à l'espace utilisateur de ressources informatiques du CBP lorsqu'il se connecte : | + | Le second, ''/cbp/<login>/'' correspond à l'espace utilisateur de ressources informatiques du CBP lorsqu'il se connecte : |
- | * aux 21 stations de travail de la salle libre service | + | * aux 28 stations de travail de la salle libre service |
* à la station graphique 3D de la petite salle de réunion | * à la station graphique 3D de la petite salle de réunion | ||
* aux machines à la demande SIDUS (Single Instance Distributing Universal System) | * aux machines à la demande SIDUS (Single Instance Distributing Universal System) | ||
Ligne 316: | Ligne 314: | ||
La commande d'examen des tâches en cours ''qstat'' permet ensuite de savoir que le job a bien été pris en compte. | La commande d'examen des tâches en cours ''qstat'' permet ensuite de savoir que le job a bien été pris en compte. | ||
+ | === Récupérer les informations sur ses jobs exécutés === | ||
+ | Dans le fichier de batch (celui qui définit les commandes à exécuter avec la queue, l'environnement, etc...) apparait le paramètre préfixé de ''-N''. Ce paramètre est très utile parce que, comme le précise les exemples ci-dessus, les sorties POSIX ''stdout'' et ''stderr'' sont sauvegardées dans ces fichiers. | ||
+ | |||
+ | Ainsi, en exécutant l'exemple ci-dessus, si son numéro de job était le 528491, les fichiers de sortie seraient les suivants : | ||
+ | * ''MyJob.o528491'' pour la sortie standard ''stdout'', l'ensemble des messages du terminal | ||
+ | * ''MyJob.e528491'' pour l'erreur standard ''stderr'', l'ensemble des messages en erreur du terminal | ||
+ | |||
+ | En fouillant dans ces fichiers, il est possible de voir l'évolution de l'exécution de son job et ses erreurs au besoin. |