Calcul haute performance (HPC) de Pytheas

Le cluster de calcul de Pytheas est un ensemble de machines, sévèrement « gonflées » en processeur (bi processeurs hexacore ou octo core) et mémoire (48Go, 64Go) , connectées sur un réseau à haut débit Infiniband, et dédiées au calcul intensif.

Ce cluster a été financé à son origine (2008) par des fonds provenant  du Centre d’Océanologie de Marseille et de l’Université de la Méditerranée, puis par des fonds Feder (2014-2015) lors de la construction du bâtiment Oceanomed.

Depuis la constitution de l’Observatoire Pytheas, ce cluster est mutualisé, et  mis à la disposition de chacune des unités de Pytheas moyennant une participation éventuelle, selon l’importance des ressources de calcul nécessaires.

1. Charte d’utilisation du cluster

2. Une présentation du cluster de calcul

3. Composition du Cluster

  • Le cluster actuel est un ensemble de 39 noeuds de calcul (Juil.  2015) reliés sur un réseau à faible latence Infiniband,
    • 22  Noeuds bi processeurs quadcore avec 24 Go de RAM
    • 7 Noeuds bi processeurs hexacore avec 48Go de RAM
    • 10 noeuds bi processeurs octocore avec 64Go de RAM
  • 1 réseau à faible latence de type Infiniband QDR (40Gb/s) permettant de faire du calcul parallélisé (le cluster possede la librairie Intel-MPI)
  • 1 espace de stockage composé de 100 To utiles avec un file system de type GPFS
  • Système d’exploitation Linux CentOS 7.1  (Juil. 2015)

4. Logiciels et librairies installées

5. Logiciels de bioinformatique et  génétique des Populations

  • BEASTv1.7.4.tgz
  • ima2-8.27.12.tar.gz
  • mrbayes-3.2.1.tar.gz
  • phyml_v3.0.tar.gz
  • phyml-20120412.tar.gz
  • mono-2.11.4.tar
  • phyml-20120412.tar.gz
  • RASP_Linux_20120316.zip
  • OBITools
  • Mothur
    • etc… liste non exhaustive, voir le wiki du cluster pour le complément

6. Comment  avoir accès au cluster de calcul ?

  • il faut tout d’abord faire une demande d’ouverture d’un compte sur le cluster au SIP
  • Prendre contact avec le SIP Pytheas http://annuaire.osupytheas.fr
    • afin de discuter de vos besoins de calcul et d’analyser les ressources nécessaires
    • cette étape est nécessaire et importante afin de pouvoir gérer au mieux les ressources de calcul entre les différents utilisateurs
  • Après création de votre compte spécifique sur le cluster,  vous pouvez alors vous connecter directement sur le cluster depuis les sites de Pytheas avec le programme « ssh »
  • sous Linux:
      • ssh cluster.osupytheas.fr
  •  Sous Windows :
    • il vous faut télécharger le programme « putty » (pour la connexion) et winscp (pour le transfert de fichiers)
    • ou le programme : SecureShell (ce programme fait à la fois la connexion et le transfert de fichiers)

7. Coût d’entrée

Après analyse de vos besoins de calcul, et des ressources disponibles dans le cluster, 2 cas se présentent :

    • si les besoins de calcul sont modestes (e.g quelques heures de calcul pendant quelques jours, espace disque consommé faible) et qu’ils peuvent être pris en charge aisément par les ressources actuelles du cluster, sans perturber l’ensembles des utilisateurs actuels, alors l’utilisation peut se faire rapidement sans quote part à l’architecture du cluster
    • en revanche si les besoins sont importants en terme d’espace disque consommé, de machines de calcul mobilisées pendant une longue période  et perturbent les jobs de calcul en cours d’exécution,  alors il sera demandé d’investir dans l’achat de quelques machines de calcul ou de disques supplémentaires

8. Pour lancer des jobs de calcul – Que faut-il savoir ?

Le cluster est en accès protégé et n’est accessible que depuis les sites de Pytheas (a moins d’utiliser le VPN du M.I.O) . Pour utiliser le cluster, il faut transférer tous vos programmes dans votre répertoire personnel du cluster… par scp ou winscp et l’installer (compiler) sur ce dernier.

Le cluster de calcul  utilise un gestionnaire (ordonnanceur) de « jobs » de calcul appelé  « OAR ».

L’ ordonnanceur OAR est un logiciel permettant de lancer vos travaux de longue durée sur le cluster de machines. Ils permettent l’équilibrage de charge harmonieux  et le partage équitable (fair sharing) entre les machines ainsi que la gestion optimale des ressources critiques des machines (mémoire…)

Ce programme permet de prendre en charge tous les jobs de calcul qui sont lancés par les utilisateurs et d’en gérer leur exécution au fil du temps sur les machines les plus appropriées du cluster…

Du point de vue de l’utilisateur, il est donc nécessaire :

  • d’apprendre a se servir des principales commande OAR pour lancer, arrêter des jobs de calcul… Ci dessous quelques documentations sur OAR
  • apprendre à compiler votre programme soit en mode séquentiel, soit avec les librairies de parallélisation « MPI »

 

9. Surveillance du cluster

Vous pouvez avoir accès aux statistiques d’utilisation du cluster (logiciel ganglia), qui vous permettent de voir de manière graphique quel est le taux d’utilisation du cluster, ou encore de voir la consommation de ressources (mémoire, disque, réseau) de votre programme en cours d’exécution.

10. Pour avoir des informations plus précises : le « wiki » du cluster

Le Wiki est un espace de documentation sur l’utilisation du cluster qui est réservé aux utilisateurs du cluster…

11.  Disponibilité

Le cluster est accessible 24/24h et 365/365j,  hormis les périodes de maintenance… Les périodes d’arrêt sont annoncés plusieurs jours à l’avance. Compter environ 99% de disponibilité

 

 

Ce contenu a été publié dans Accueil, avec comme mot(s)-clé(s) . Vous pouvez le mettre en favoris avec ce permalien.