Soutenance HDR : « Contributions à la Gestion de l’Hétérogénéité dans les Environnements Distribués et Pervasifs »
Ce vendredi, Luiz-Angelo Steffenel maître de conférences au CReSTIC a soutenu son HDR. Nous adressons toutes nos félicitations.
Titre : Contributions à la Gestion de l’Hétérogénéité dans les Environnements Distribués et Pervasifs
Jury :
- Christophe CÉRIN – Professeur des Universités, Université Paris 13 – Rapporteur
- Emmanuel JEANNOT – Directeur de Recherche, INRIA Bordeaux Sud-Ouest – Rapporteur
- Philippe ROOSE – Maître de Conférences HDR, Université de Bayonne – Rapporteur
- Carine SOUVEYET – Professeur des Universités, Université Paris 1 Panthéon Sorbonne – Examinateur
- Massimo VILLARI – Professeur, Università degli Studi di Messina, Italie – Examinateur
- Michaël KRAJECKI – Professeur des Universités, Université de Reims Champagne-Ardenne – Examinateur
- Olivier FLAUZAC – Professeur des Universités, Université de Reims Champagne-Ardenne – Directeur
Résumé :
La définition du mot hétérogénéité donnée par le Dictionnaire Larousse (« Manque d’unité, composé d’éléments de nature diverse ») n’est pas suffisamment développée pour qualifier les différents défis liés à l’hétérogénéité dans les systèmes et les applications distribués. Afin de mieux comprendre ces défis, il est important d’identifier et de cataloguer les différents mécanismes liés à l’hétérogénéité. Une première catégorie représente les variations des équipements composant un système informatique. À l’hétérogénéité matérielle s’ajoutent les problèmes de l’hétérogénéité des tâches et de l’hétérogénéité des communications. Il faut également assurer l’hétérogénéité issue de la dynamique de l’exécution, qui impacte le fonctionnement d’un système distribué au travers les variations qu’il subit pendant toute la durée de son exécution. Finalement, d’un point de vue applicatif, on peut également rencontrer des difficultés avec une tout autre catégorie d’hétérogénéité, transversale aux trois précédentes : l’hétérogénéité de l’accès aux données.
Mes travaux de recherche s’inscrivent donc dans la gestion de l’hétérogénéité, sous ses différentes facettes. Durant cet présentation, j’exposerai une partie de ces contributions, développées au fil des différents projets dans lesquels je me suis engagé et des thèses de doctorat que j’ai co-encadré. Ainsi, dans un premier moment, je présent des algorithmes visant la compréhension des facteurs qui impactent les opérations de communication collective dans les grids. Dans un deuxième moment je présente les efforts faits pour gérer l’hétérogénéité des tâches lors de la parallélisation et de la gestion de l’exécution distribuée d’une application en biochimie, ce qui a été accompagné par le développement d’une plateforme de déploiement capable de gérer l’exécution des tâches distribuées sur un cluster HPC ou sur un ensemble de nœuds volontaires. Une troisième partie de mon travail se consacre à la dynamique des ressources et aux stratégies pour sa prise en charge, illustrés par une expérience visant à améliorer le comportement de la plateforme big data Apache Hadoop dans les environnements hétérogènes et dynamiques. En s’aidant d’un mécanisme de collecte d’informations sur le contexte des ressources, il a été possible de modifier ce framework et ainsi d’adapter la gestion des tâches aux ressources disponibles à chaque instant. La quatrième partie présente la spécification d’une base documentaire construite sur un réseau hiérarchique permettant l’accès transparent aux sources de données, peu importe leur nature (fichiers, flux, bases de données, etc.). Finalement, la cinquième partie introduit la plateforme de calcul distribué CloudFIT, développée afin de permettre le prototypage et le test de techniques pour les environnements de calcul très hétérogènes, allant des dispositifs IoT aux data centers et infrastructures sur le cloud.
Mon travail de recherche s’inscrit ainsi dans la gestion de l’hétérogénéité, sous ses différentes facettes. En naviguant entre ces aspects, j’ai pu travailler à la fois sur la tolérance aux fautes, la modélisation des performances, l’adaptation au contexte et l’ordonnancement, et même la spécification et le développement d’intergiciels (middlewares) pour le calcul distribué. De ces travaux de recherche, il en résulte de multiples perspectives notamment dans le cadre du fog computing et de l’Internet des Objets (Internet of Things – IoT), ce qui conclura ma présentation.