Doctorat (H/F) Ordonnancement HPC tenant compte de l'énergie
Les systèmes de calcul à haute performance (HPC) sont généralement gérés par un RJMS (Système de Gestion des Ressources et des Tâches) qui décide quand et sur quel serveur exécuter les applications soumises par les utilisateurs. Ce RJMS est crucial car la qualité de celui-ci a un impact direct sur les performances de l’infrastructure dans son ensemble. En règle générale, cette performance est mesurée par le nombre de tâches terminées chaque jour ou par le temps d’exécution. Dans notre contexte, nous optimiserons également l’impact CO2 de ces tâches (par exemple, la planification des tâches lorsque l’empreinte carbone est minimale). Nous exploiterons également la capacité des applications à fonctionner en utilisant un nombre différent de serveurs pour optimiser nos métriques.
Les infrastructures HPC sont des superordinateurs exascale avec une surveillance de l’utilisation des ressources, de l’énergie consommée.
Les applications HPC sont généralement décrites par un DAG (Graphe Oriente Acyclique) de tâches. Un autre levier est que les différentes tâches ont un impact différent en termes de puissance et de ressources. L’exécution d’applications consommant moins d’énergie lorsque l’énergie produit beaucoup de CO2 est plus efficace.
Les retours d’utilisateurs (métriques montrant les impacts de la demande d’exécution) sont de plus en plus nécessaires pour atteindre la soutenabilité de ces plates-formes.
Le doctorant se concentrera sur l’étude des ordonnacements des applications HPC tenant compte de l’énergie.
Les objectifs du doctorat sont les suivants :
- Ordonnancement de tâches multi-objectifs (énergie, temps) avec comme entrées une prévision du mix énergétique, de l’énergie renouvelable disponible, du prix de l’énergie
- Utilisation de prédictions IA pour la consommation d’applications. Ces prédictions seront utilisées par les algorithmes de planification pour optimiser l’efficacité de la plateforme
- Évaluer l’impact de différents leviers (capacité d’adaptation des ressources requises par les applications, hétérogénéité des différentes exigences en applications, hétérogénéité des ressources (CPU/GPU)…)
- Proposer différents retours d’utilisateurs co
- Expérimentations utilisant une infrastructure HPC réelle (en utilisant les ressources et le système de gestion des tâches OAR)
La structure du doctorat sera la suivante :
- État de l’art sur l’ordonnancement de tâches HPC
- Proposition d’un ordonnanceur de tâches multi-objectifs (énergie, temps)
- Expérimentations pour valider les algorithmes et les comparer avec l’état de l’art
- Un démonstrateur utilisant OAR et les algorithmes de planification proposés pour réduire la consommation d’énergie des plateformes HPC
Des logiciels de surveillance seront utilisés (tels que MojitO/S) pendant le doctorat, et certaines contributions pourront être apportées à ceux-ci. Une plateforme d’expérimentation à grande échelle sera utilisée (Grid'5000).
Contexte de travail
Le doctorat aura lieu à IRIT, le plus grand institut de recherche en informatique de Toulouse, en France. Notre équipe SEPIA travaille sur la gestion des ressources dans divers systèmes distribués (centres de données cloud, centres HPC, architectures edge, IoT…) et s’intéresse tout particulièrement à la transition écologique, en réduisant notamment la consommation d’énergie et les émissions de CO2, en utilisant l’énergie renouvelable.
Le doctorat sera supervisé par Georges Da Costa et Patricia Stolf.
Le doctorat sera financé par le projet collaboratif NumPEx.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.