CalcULCO - Plateforme de calcul scientifique de l’ULCO

En septembre 2014, l’ULCO a remanié son service du Système d’Information et créé un nouveau pôle de compétences destiné aux chercheurs, dédié au calcul scientifique. Le but étant d’accompagner les unités de Recherche dans ce domaine. Le pôle Calcul Scientifique était né. Dès lors une politique de rationalisation et de mutualisation des moyens de calcul a été menée afin de créer une plateforme commune à l’ensemble des unités de Recherche de notre établissement.

Le socle de la plateforme et son centre névralgique ont été financés par l’ULCO en 2015 et les premières ressources de calcul y ont été greffées. Ces premières ressources ont été apportées par les laboratoires LISIC*, LMPA et LOG qui disposaient chacun de leurs propres serveurs de calcul. La première mouture de la plateforme baptisée CalcUlco a été mise en production fin 2015 et les premiers utilisateurs ont été naturellement les chercheurs des premiers laboratoires contributeurs.

La plateforme a été conçue pour accueillir des calculs concurrents par un système de réservation octroyant des ressources aux différents projets hébergés sur la plateforme. Son architecture sous forme de grappe de calcul lui permet de garantir son évolutivité.

Un vecteur de cohésion et de fédération

Au fil du temps, il est apparu qu’elle est même devenue un vecteur de cohésion et de fédération : des projets plus ambitieux, des collaborations pluridisciplinaires entre des unités distantes parfois d’une centaine de kilomètres au sein de notre établissement multi-sites ou des collaborations avec des partenaires extérieurs ont germé, la plateforme de calcul commune étant souvent la pierre angulaire pour ces nouveaux projets.

Un étoffement s’imposait. L’ULCO a financé de nouvelles ressources et d’autres ont été apportées via des appels à projets : 3 Bonus Qualité Recherche (BQR) – issus de projets impliquant les laboratoires LISIC, LMPA et LPCA – et un Contrat de plan État-Région (CPER) du LOG. Cette montée en puissance accompagnée d’une politique de mutualisation de logiciels propriétaires (MATLAB, Intel cluster, Gaussian, Comsol, Molpro…) a permis, dans un premier temps, de répondre aux attentes des unités de Recherche.

Fin 2019, la plateforme disposait de 548 cœurs répartis sur 14 nœuds de calcul, 2,4To de RAM et 130To d’espace de stockage. La puissance de calcul totale cumulée avoisinait les 24 TéraFlops.

Avec l’arrivée d’autres laboratoires utilisateurs, les besoins croissants en ressources numériques, qu’elles soient de nature calculatoire ou de stockage ont explosé. Courant 2020 une large campagne de recensement de ces besoins a été menée, ce qui a permis d’établir un schéma directeur pour les évolutions futures.

Il s’est avéré qu’une nouvelle salle ainsi qu’une nouvelle architecture étaient indispensables pour accompagner la montée en charge. L’ULCO a pris la mesure de ces enjeux et a investi dans une nouvelle salle, en cours d’aménagement, ainsi que dans la refonte de la plateforme.

Limiter au maximum l’impact environnemental

L’aménagement de cette salle en véritable datacenter s’inscrit dans la politique de développement durable et de transition énergétique (Projet ENERULCO). Elle se traduit par le souci de limiter au maximum son impact environnemental, en proposant des solutions de refroidissement, certes plus onéreuses, mais innovantes et performantes.

La production du froid allie 2 technologies, l’une plus classique par détente directe et l’autre indirecte en freecooling (utilisation du froid extérieur) dès que la température de l’air ambiant le permet.

Dans la zone de Calais, cette technologie est en mesure de déployer au mieux ses avantages en termes d’économie d’énergie, puisque la température moyenne locale sur l’année se situe autour de 10°, sans amplitude prononcée. La réduction de la consommation électrique moyenne pour la climatisation de la salle sera ainsi d’environ 50%.

La refonte et l’évolution de la plateforme en centre de calcul a nécessité un investissement exceptionnel de 250k€ afin de repenser l’architecture et les nouvelles fonctionnalités : 3 grappes de calcul dont une dédiée aux travaux pré- et post- traitements avec visualisation déportée, un réseau interne 100Gb/s de faible latence, un espace de stockage conséquent de l’ordre d’1 Pétaoctets destiné aux données de la Recherche et un autre distribué pour les simulations nécessitant des entrées/sorties intensives.

La nouvelle version de CalcUlco devrait voir le jour fin 2021 après la livraison de la 1ère tranche du datacenter. 2 autres laboratoires (BPA et MABLab) le rejoindront.

À ce jour, CalcUlco héberge 37 projets issus de 8 laboratoires (LISIC, LMPA, LOG, LPCA, UDSMM, UCEIV, LEM, TVES). Les travaux ont été valorisés sous forme de communications. 36 articles de revues et 21 articles de conférences internationales avec présentation orale y sont référencés. La plateforme a
également permis la réalisation des développements et expérimentations menées dans 8 thèses soutenues et 22 autres sont en cours.

On peut ainsi citer, sans être exhaustif, des travaux en cours (ou à venir) liés à l’agriculture de précision (LISIC), l’étude et la modélisation de phénomènes atmosphériques, l’analyse de spectres à haute résolution (LPCA), l’étude de la mobilité urbaine associée à la propagation de la COVID-19 (LEM, TVES, LISIC), la caractérisation de matériaux pour des applications dans le domaine de l’énergie ou de l’environnement (UDSMM), le séquençage génomique (UCEIV, BPA), la détermination des paramètres physiques, biologiques et environnementaux du milieu côtier (LOG, LISIC), des travaux nécessitant l’analyse ou le traitement de certaines données volumineuses qui requièrent le recours à des phases de visualisation des différentes données et/ou résultats obtenus (LISIC, LPCA, LMPA, LOG, MABLab).

Objectif un million d’heures.coeurs de calcul par mois

Le pôle Calcul Scientifique a également mis en place d’autres services collaboratifs en ligne dédiés à la recherche en complément de la plateforme de calcul. Un cloud, une forge de développement et un éditeur LaTeX. L’ensemble de ces outils internes permet de centraliser, sécuriser et préserver la souveraineté des documents des chercheurs et leur caractère collaboratif contribue à renforcer la synergie entre les unités partenaires.

La prochaine phase d’évolution sera entièrement consacrée à l’accroissement des ressources purement calculatoires du centre de calcul avec l’acquisition d’autres nœuds de calcul multi CPU et de nouveaux nœuds dotés de cartes GPGPU, bien adaptées au traitement « vectoriel » de données volumineuses, à l’apprentissage profond (réseaux de neurones multicouches) et dont certains logiciels libres ou déjà acquis (MATLAB, Gaussian, Molpro) pourraient tirer parti.

L’ambition affichée est de faire partie intégrante du maillage régional de mésocentres en décuplant les ressources de calcul disponibles, avec pour objectif un million d’heures.cœurs de calcul par mois.

En fonction de l’utilisation des chercheurs de l’ULCO, une puissance de calcul conséquente et diversifiée permettrait la mise à disposition tarifée d’une partie de ces ressources à des contrats industriels.

Magazine Empreinte

Retrouvez plus d'articles dans le numéro 5 d'Empreinte

Couverture du magazine Empreinte 5

CONTACT

Site web : www-calculco.univ-littoral.fr