HPC Application Parameter Autotuning on Edge Devices: A Bandit Learning Approach
Hossain, Badawy, Islam et al.
The growing necessity for enhanced processing capabilities in edge devices with limited resources has led us to develop effective methods for improving high-performance computing (HPC) applications. In this paper, we introduce LASP (Lightweight Autotuning of Scientific Application Parameters), a novel strategy designed to address the parameter search space challenge in edge devices. Our strategy employs a multi-armed bandit (MAB) technique focused on online exploration and exploitation. Notably, LASP takes a dynamic approach, adapting seamlessly to changing environments. We tested LASP with four HPC applications: Lulesh, Kripke, Clomp, and Hypre. Its lightweight nature makes it particularly well-suited for resource-constrained edge devices. By employing the MAB framework to efficiently navigate the search space, we achieved significant performance improvements while adhering to the stringent computational limits of edge devices. Our experimental results demonstrate the effectiveness of LASP in optimizing parameter search on edge devices.
academic
Autoréglage des Paramètres des Applications HPC sur les Appareils Edge : Une Approche par Apprentissage par Bandit
Face à la demande croissante de capacités de traitement accrues sur les appareils edge, cet article développe des méthodes efficaces pour améliorer les applications de calcul haute performance (HPC). L'article présente LASP (Lightweight Autotuning of Scientific Application Parameters), une stratégie novatrice conçue pour résoudre les défis de l'espace de recherche de paramètres sur les appareils edge. Cette stratégie emploie la technique des bandits multi-bras (MAB), en se concentrant sur l'exploration et l'exploitation en ligne. LASP adopte une approche dynamique capable de s'adapter de manière transparente aux environnements changeants. Les auteurs ont testé LASP sur quatre applications HPC (Lulesh, Kripke, Clomp et Hypre). Sa nature légère la rend particulièrement adaptée aux appareils edge aux ressources limitées. En adoptant le cadre MAB pour naviguer efficacement dans l'espace de recherche, des améliorations de performance significatives ont été réalisées tout en respectant les contraintes informatiques strictes des appareils edge.
Le problème fondamental que cette recherche vise à résoudre est l'autoréglage efficace des paramètres des applications HPC sur les appareils edge aux ressources limitées. Les méthodes traditionnelles d'autoréglage des paramètres sont principalement conçues pour les systèmes HPC conventionnels, qui nécessitent eux-mêmes des ressources informatiques considérables et ne conviennent pas aux environnements contraints des appareils edge.
Croissance rapide de l'informatique edge: Selon les rapports, le marché des applications de traitement des données en edge devrait croître de 75% d'ici 2026
Complexité des applications HPC: Les applications HPC impliquent des configurations de paramètres complexes qui affectent significativement les performances et peuvent même entraîner des défaillances d'exécution
Défis des contraintes de ressources: Les capacités informatiques limitées des appareils edge et les ressources distribuées hétérogènes présentent des défis uniques pour l'exécution HPC
Méthodes traditionnelles: L'autoréglage manuel basé sur les connaissances d'experts est chronophage et non évolutif; les méthodes basées sur l'heuristique manquent de flexibilité et sont susceptibles de converger vers des optima locaux
Méthodes d'apprentissage automatique: Bien qu'efficaces, elles introduisent une surcharge supplémentaire inadaptée aux appareils edge
Optimisation bayésienne: Performances médiocres dans les relations complexes, nécessite de nombreuses itérations, manque d'exploitation des connaissances historiques
Proposer une approche innovante qui exploite les appareils edge pour exécuter les applications HPC à faible fidélité (LF) afin de déterminer les paramètres d'application optimaux, puis transférer ces paramètres vers les plates-formes HPC traditionnelles pour une exécution à haute fidélité (HF), réduisant ainsi significativement le temps et la consommation d'énergie de l'autoréglage des paramètres sur les systèmes HPC traditionnels.
Première proposition de l'algorithme LASP: Méthode légère d'autoréglage des paramètres HPC spécialement conçue pour les appareils edge
Application innovante de la technique MAB: Première application des bandits multi-bras à l'autoréglage sur les appareils edge
Capacité d'adaptation dynamique: L'algorithme peut s'adapter en temps réel aux changements d'environnement, adapté aux environnements edge volatiles
Optimisation multi-objectifs: Optimise simultanément le temps d'exécution et la consommation d'énergie, offrant un équilibre d'optimisation personnalisable par l'utilisateur
Portabilité inter-plates-formes: L'approche des paramètres au niveau de l'application basée sur des techniques stochastiques est portable entre diverses plates-formes edge et HPC
Étant donné l'espace de configuration des paramètres d'une application HPC χ = {1, ..., x}, sélectionner la configuration optimale sur T itérations pour maximiser la fonction de récompense pondérée:
freward(x) = α × (1/μ(τx)) + β × (1/μ(ρx))
où τx est le temps d'exécution normalisé, ρx est la consommation d'énergie normalisée, et α et β sont des paramètres de poids définis par l'utilisateur.
LASP est basé sur le modèle stochastique des bandits multi-bras, supposant K actions (configurations) exécutées sur T itérations. Chaque configuration x correspond à une distribution de récompense Dx initialement inconnue.
Conception légère: Consommation CPU et mémoire significativement inférieure par rapport aux méthodes ML traditionnelles
Apprentissage en ligne: S'adapte en temps réel aux changements d'environnement, sans nécessité de pré-entraînement
Approche multi-fidélité: Exploite l'exécution à faible fidélité sur les appareils edge pour identifier les paramètres optimaux pour les systèmes HPC à haute fidélité
Participation de l'utilisateur: Permet aux utilisateurs de personnaliser les objectifs d'optimisation via les paramètres α et β
Sous des erreurs synthétiques de 5%, 10% et 15%, LASP maintient de bonnes performances, démontrant sa capacité d'adaptation aux problèmes réels tels que les fluctuations réseau.
Le regret cumulatif de toutes les applications tend à saturer après un certain nombre d'itérations, prouvant la convergence efficace de l'algorithme. L'effet d'optimisation du temps d'exécution surpasse celui de l'optimisation de la consommation d'énergie, ce qui est dû aux caractéristiques de saturation de la consommation d'énergie dans les applications HPC intensives en calcul.
Les méthodes traditionnelles incluent les approches basées sur la recherche (telles que l'optimisation bayésienne) et les méthodes d'apprentissage automatique. L'avantage de cet article par rapport aux travaux existants réside dans sa conception légère spécialement adaptée aux appareils edge et sa capacité d'adaptation en ligne.
Les projets connexes incluent la plate-forme de capteurs Waggle, Sage Continuum, etc. Cet article est le premier travail spécialement dédié à l'autoréglage des paramètres HPC sur les appareils edge.
La technique MAB a des applications dans l'autoréglage des hyperparamètres, mais cet article est le premier à l'appliquer au scénario d'autoréglage HPC sur les appareils edge.
Limites d'Évolutivité: À mesure que le nombre de configurations augmente, l'algorithme UCB doit explorer de nombreuses options, devenant inefficace sur les appareils aux ressources limitées
Problèmes de Coordination Réseau: La communication à faible bande passante entre plusieurs appareils edge volatiles affecte l'efficacité du système
Défis des Appareils Hétérogènes: La gestion d'appareils avec des capacités informatiques différentes nécessite une conception d'algorithme adaptatif
Efficacité de l'Optimisation de la Consommation d'Énergie: L'optimisation de la consommation d'énergie est moins efficace que l'optimisation du temps d'exécution
Expériences de Comparaison Limitées: Comparaison principalement avec BLISS et la configuration par défaut, manque de comparaison avec d'autres méthodes légères
Analyse Théorique Insuffisante: Bien que fournissant une limite de regret, manque d'analyse théorique détaillée de la convergence
Vérification Insuffisante des Appareils Hétérogènes: Les expériences sont principalement menées sur un seul appareil edge, manquant de vérification de la coopération multi-appareils
Analyse de Sensibilité des Paramètres: L'analyse de sensibilité des paramètres α et β est relativement simple
L'article cite 48 références connexes, couvrant plusieurs domaines importants tels que l'informatique edge, l'autoréglage HPC et les bandits multi-bras, fournissant une base théorique solide pour la recherche.
Évaluation Globale: Ceci est un article de recherche de haute qualité proposant une solution innovante dans le domaine interdisciplinaire de l'informatique edge et HPC. L'algorithme LASP est bien conçu, la vérification expérimentale est complète et possède une bonne valeur pratique et des perspectives de promotion. Bien qu'il y ait de la place pour l'amélioration en termes de profondeur théorique et d'expériences de comparaison, la contribution globale est significative et fournit une référence précieuse pour la recherche dans les domaines connexes.