2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li
Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.
academic

Adaptation Autonome Distillée et Perpétuelle pour Systèmes Configurables

Informations Fondamentales

  • ID de l'article: 2501.00840
  • Titre: Distilled Lifelong Self-Adaptation for Configurable Systems
  • Auteurs: Yulong Ye, Tao Chen, Miqing Li (Université de Birmingham)
  • Classification: cs.SE (Génie Logiciel), cs.AI
  • Date de publication: 1er janvier 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2501.00840

Résumé

Les systèmes configurables modernes offrent d'énormes opportunités pour l'ingénierie des futurs systèmes logiciels intelligents. L'un des défis clés consiste à adapter efficacement les configurations d'un système en cours d'exécution pour optimiser les performances (telles que le temps d'exécution et le débit) sous des charges de travail variables dans le temps. Les méthodes existantes ignorent soit les connaissances historiques disponibles, soit s'appuient sur une utilisation statique des connaissances historiques sans tenir compte de leur utilité, ce qui ne résout pas adéquatement ce problème. Cet article propose le cadre DLiSA pour relever ce défi. DLiSA possède deux caractéristiques distinctives : premièrement, il supporte la planification perpétuelle, où le processus de planification s'exécute continuellement tout au long du cycle de vie du système, permettant l'exploitation dynamique des connaissances accumulées pour une adaptation rapide ; deuxièmement, il améliore la planification pour les nouvelles charges de travail par distillation et ensemencement des connaissances, purifie dynamiquement les connaissances et n'ensemence que les configurations historiques utiles si nécessaire, réduisant ainsi les informations trompeuses. Des expériences approfondies démontrent que DLiSA surpasse significativement les méthodes de pointe, avec des améliorations de performance atteignant 229% et une accélération des ressources jusqu'à 2,22 fois.

Contexte et Motivation de la Recherche

Définition du Problème

Le problème fondamental abordé par cette recherche est l'optimisation adaptative de la configuration des systèmes configurables sous des charges de travail variables dans le temps. Plus précisément :

  1. Complexité de l'espace de configuration : Les systèmes logiciels modernes (tels que la base de données H2, le compresseur de fichiers KANZI, etc.) possèdent de nombreuses options configurables, formant un espace de configuration à croissance exponentielle
  2. Dynamique des charges de travail : Les charges de travail auxquelles le système fait face varient dans le temps et sont imprévisibles, ce qui entraîne des modifications correspondantes de la configuration optimale
  3. Exigences de temps réel : Le système doit trouver rapidement la configuration optimale adaptée aux nouvelles charges de travail sous des contraintes budgétaires limitées

Analyse de l'Importance

L'importance de ce problème se manifeste par :

  • Valeur pratique : Dans les scénarios modernes d'informatique en nuage et informatique en périphérie, les systèmes doivent s'adapter dynamiquement à différents types et tailles de charges de travail
  • Impact sur les performances : Le choix de configuration affecte directement les indicateurs de performance critiques du système (temps d'exécution, débit, etc.)
  • Efficacité des ressources : Une stratégie d'adaptation appropriée peut améliorer significativement l'efficacité de l'utilisation des ressources

Limitations des Méthodes Existantes

Par l'analyse des méthodes existantes, les auteurs identifient les insuffisances de deux grandes catégories de méthodes :

  1. Méthodes d'adaptation statique (telles que FEMOSAA) :
    • Recommencent la recherche à partir de zéro à chaque changement de charge de travail
    • Ignorent l'expérience d'optimisation historique, causant du travail répétitif
    • Gaspillent les précieuses informations historiques
  2. Méthodes d'adaptation dynamique (telles que Seed-EA, D-SOGA, LiDOS) :
    • Adoptent une stratégie statique d'utilisation des connaissances
    • Utilisent aveuglément toutes les configurations de la charge de travail la plus récente pour l'ensemencement
    • Rejettent les informations utiles des charges de travail antérieures
    • Ne peuvent pas distinguer les configurations utiles des configurations trompeuses

Découvertes de Caractéristiques Clés

Par l'analyse empirique de systèmes tels que KANZI et H2, les auteurs découvrent une caractéristique clé des systèmes configurables :

Les configurations de performance optimale entre différentes charges de travail peuvent être très similaires ou très différentes, selon le type de système et la charge de travail spécifique

Cette découverte révèle le défaut fondamental des stratégies statiques d'utilisation des connaissances et pose les fondations théoriques pour la distillation dynamique des connaissances.

Contributions Principales

  1. Proposition du cadre DLiSA : Premier cadre supportant l'adaptation autonome perpétuelle avec distillation pour les systèmes configurables, combinant planification perpétuelle et distillation dynamique des connaissances
  2. Conception de l'analyse de similarité des charges de travail par classement : Méthode de mesure de similarité basée sur la perte de classement pour déterminer quand effectuer l'ensemencement des connaissances
  3. Développement d'une stratégie d'ensemencement de configuration pondérée : Extraction dynamique des configurations historiques les plus utiles tout en filtrant les informations trompeuses
  4. Vérification expérimentale complète : Validation sur 9 systèmes réels et 93 cas de test, avec une amélioration de performance jusqu'à 2,29 fois et une amélioration d'efficacité jusqu'à 2,22 fois

Explication Détaillée de la Méthode

Définition de la Tâche

Entrées :

  • Système configurable S, espace de configuration X = (x₁, x₂, ..., xₙ)
  • Séquence de charges de travail variables dans le temps W₁, W₂, ..., Wₜ
  • Contrainte budgétaire Rₜ (nombre maximal d'évaluations de configuration par étape temporelle)

Sorties :

  • Configuration optimale x* pour chaque étape temporelle, optimisant l'objectif de performance fₜ(x)

Contraintes :

  • Budget de ressources : rₜ ≤ Rₜ
  • Exigences de temps réel : réponse rapide aux changements de charge de travail

Architecture du Modèle

DLiSA adopte l'architecture MAPE-K (Monitor-Analyze-Plan-Execute-Knowledge), contenant deux composants spécialisés :

1. Composant de Distillation des Connaissances (Analyseur)

Responsable de l'analyse dynamique et de l'extraction des connaissances historiques utiles :

Analyse de Similarité des Charges de Travail par Classement :

  • Calcul de la perte de classement entre charges de travail adjacentes :
    L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))
    
  • Score de similarité :
    S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
    
  • Similarité moyenne : S_sav utilisée pour déterminer si l'ensemencement doit être déclenché

Ensemencement de Configuration Pondéré :

  • Phase locale : sélection des 50% meilleures configurations de chaque charge de travail
  • Phase globale : calcul des poids basé sur la robustesse et l'actualité
    • Poids de robustesse : w_(c,r) = O_c / H
    • Poids d'actualité : w_(c,t) = S_c / H
    • Poids total : w_c = w_(c,r) + w_(c,t)

2. Composant de Planification Évolutionnaire (Planificateur)

Optimisation de configuration basée sur l'algorithme génétique :

  • Utilisation des configurations ensemencées comme population initiale
  • Évolution vers de meilleures configurations par opérations de croisement et mutation
  • Évaluation des performances de configuration dans l'environnement Cyber-Twin

Points d'Innovation Technique

  1. Utilisation Dynamique des Connaissances :
    • Contrairement aux méthodes statiques, DLiSA décide dynamiquement d'effectuer l'ensemencement en fonction de la similarité des charges de travail
    • Évite les effets négatifs potentiels d'un ensemencement aveugle
  2. Exploitation des Connaissances Historiques Complètes :
    • Ne se limite pas aux charges de travail récentes, extrait les configurations utiles de toutes les charges de travail historiques
    • Équilibre la robustesse et l'actualité des configurations par un mécanisme de pondération
  3. Paradigme d'Apprentissage Perpétuel :
    • Le processus de planification s'exécute continuellement, l'état étant maintenu entre différentes charges de travail
    • Réalise une véritable optimisation dynamique plutôt qu'un redémarrage statique

Configuration Expérimentale

Ensemble de Données

L'expérience utilise 9 systèmes configurables réels provenant de différents domaines :

SystèmeLangageDomaineMétrique de PerformanceNombre d'OptionsNombre de Charges
JUMP3RJavaEncodeur AudioTemps d'exécution166
KANZIJavaCompresseur de FichiersTemps d'exécution249
H2JavaBase de DonnéesDébit168
XZC/C++Compresseur de FichiersTemps d'exécution3313
Z3C/C++Solveur SMTTemps d'exécution1212

Total de 93 cas de test, couvrant différents langages de programmation, domaines d'application et objectifs de performance.

Métriques d'Évaluation

  1. Efficacité : Classement du test Scott-Knott, valeurs de performance finales
  2. Rendement : Nombre d'évaluations de configuration nécessaires pour atteindre les mêmes performances, ratio d'accélération s = b/m

Méthodes de Comparaison

  • FEMOSAA : Adaptation statique, recherche recommencée à partir de zéro à chaque fois
  • Seed-EA : Adaptation dynamique, ensemencement de toutes les configurations de la charge de travail la plus récente
  • D-SOGA : Adaptation hybride, 80% historique + 20% configurations aléatoires
  • LiDOS : Adaptation dynamique, conservation des configurations basée sur les relations de non-domination multi-objectifs

Détails d'Implémentation

  • Taille de la population : 20
  • Contrainte budgétaire : 80 évaluations de configuration
  • Taux de croisement : 0,9, Taux de mutation : 0,1
  • Paramètre de seuil : α = 0,3
  • Exécutions indépendantes : 100, ordre de charge de travail aléatoire

Résultats Expérimentaux

Résultats Principaux

DLiSA surpasse significativement les méthodes de comparaison sur les deux dimensions d'efficacité et de rendement :

Résultats d'Efficacité :

  • Parmi les 93 cas de test, DLiSA se classe au premier rang dans 69 cas (74%)
  • En comparaison, le nombre de cas au meilleur classement pour les autres méthodes : FEMOSAA (11), Seed-EA (33), D-SOGA (29), LiDOS (10)
  • Amélioration maximale de performance : 2,29 fois (système KANZI, charge de travail W8)

Résultats de Rendement :

  • Par rapport à FEMOSAA : DLiSA est plus efficace dans 88 cas, accélération maximale de 2,16 fois
  • Par rapport à Seed-EA : DLiSA est plus efficace dans 57 cas, accélération maximale de 2,22 fois
  • Par rapport à D-SOGA : DLiSA est plus efficace dans 58 cas, accélération maximale de 2,05 fois
  • Par rapport à LiDOS : DLiSA est plus efficace dans 79 cas, accélération maximale de 2,05 fois

Expériences d'Ablation

Deux variantes sont conçues pour vérifier la contribution de chaque composant :

  1. DLiSA-I : Remplacement de l'ensemencement de configuration pondéré par un ensemencement aléatoire
    • Résultat : DLiSA gagne dans 50 cas, 43 égalités, 0 défaites
    • Prouve l'efficacité de l'ensemencement de configuration pondéré
  2. DLiSA-II : Désactivation de l'analyse de similarité des charges de travail, déclenchement aléatoire de l'ensemencement
    • Résultat : DLiSA gagne dans 39 cas, 53 égalités, 1 défaite
    • Prouve l'importance de l'analyse de similarité

Analyse de Sensibilité des Paramètres

Analyse de sensibilité du paramètre de seuil α ∈ {0, 0,1, ..., 0,9} :

  • Performance optimale à α = 0,3, obtenant le plus de classements au premier rang au test Scott-Knott
  • α trop petit : ensemencement excessif, introduction d'informations trompeuses
  • α trop grand : ensemencement insuffisant, gaspillage des connaissances historiques
  • La dégradation de performance avec α plus grand est plus grave qu'avec α plus petit

Découvertes Expérimentales

  1. Rôle de la similarité des charges de travail : L'analyse de similarité identifie efficacement les moments favorables pour l'ensemencement, évitant l'ensemencement nuisible lorsque les paysages de configuration diffèrent considérablement
  2. Effet de l'ensemencement pondéré : Les configurations à poids élevé fonctionnent généralement mieux sous les nouvelles charges de travail, validant la rationalité de la conception des poids de robustesse et d'actualité
  3. Spécificité du système : Différents systèmes présentent des modèles de similarité de charge de travail différents, par exemple le système KANZI a plus de chevauchement entre charges de travail, tandis que le système H2 présente des différences plus importantes

Travaux Connexes

Méthodes d'Adaptation Statique

Les méthodes traditionnelles telles que FEMOSAA se concentrent principalement sur les problèmes d'optimisation unique, recommençant la recherche à chaque changement de charge de travail. Ces méthodes simplifient le processus d'optimisation mais ignorent l'expérience historique précieuse.

Méthodes d'Adaptation Dynamique

Les méthodes telles que PLATO et Seed-EA supportent la planification continue et la préservation d'état, mais adoptent des stratégies statiques d'utilisation des connaissances, incapables d'ajuster dynamiquement la stratégie d'ensemencement en fonction des caractéristiques des charges de travail.

Méthodes de Théorie du Contrôle

Les méthodes basées sur le filtrage de Kalman, le contrôle prédictif de modèle, etc. montrent un potentiel dans la planification adaptative, mais font face aux défis de la modélisation dynamique de systèmes non-linéaires complexes.

Méthodes d'Apprentissage de Performance

Les méthodes utilisant les machines à vecteurs de support, les réseaux de neurones, l'apprentissage d'ensemble, etc. se concentrent sur la modélisation de la relation entre configuration et performance, formant un complément à la perspective d'optimisation de DLiSA.

Conclusion et Discussion

Conclusions Principales

  1. Efficacité de DLiSA : Par la distillation dynamique des connaissances, DLiSA surpasse significativement les méthodes existantes dans la plupart des cas de test
  2. Amélioration Significative du Rendement : L'amélioration de l'efficacité des ressources atteint 2,22 fois, prouvant la valeur de la réutilisation des connaissances historiques
  3. Contribution des Composants Clarifiée : Les expériences d'ablation valident les contributions indépendantes de l'analyse de similarité par classement et de l'ensemencement pondéré
  4. Paramétrage Approprié : α = 0,3 offre les meilleures performances en équilibrant les bénéfices de l'ensemencement et les risques de désinformation

Limitations

  1. Ajustement des Paramètres : Le seuil α peut nécessiter un ajustement spécifique au système pour obtenir les meilleures performances
  2. Portée du Système : Bien que couvrant 9 systèmes, l'extension à davantage de types de systèmes peut nécessiter une validation supplémentaire
  3. Dépendance du Cyber-Twin : L'expérience dépend des tests de référence existants comme Cyber-Twin, la déploiement réel peut nécessiter une modélisation plus complexe

Directions Futures

  1. Méthodes d'Analyse du Paysage : Développer des techniques d'analyse du paysage de configuration plus raffinées pour mieux gérer l'évolution des charges de travail
  2. Mécanismes de Rétroaction : Explorer les mécanismes de rétroaction pour identifier plus précisément les informations de planification bénéfiques
  3. Extension Multi-Objectif : Étendre le cadre aux scénarios d'optimisation multi-objectif
  4. Analyse Théorique : Fournir une analyse théorique plus approfondie pour guider le paramétrage et la conception du système

Évaluation Approfondie

Points Forts

  1. Définition du Problème Claire : Identification précise des défauts fondamentaux des méthodes existantes dans l'utilisation des connaissances
  2. Conception de Méthode Rationnelle : L'analyse de similarité par classement et la stratégie d'ensemencement pondéré sont ingénieusement conçues avec une base théorique solide
  3. Conception Expérimentale Complète : Couvre plusieurs systèmes et scénarios variés, avec une vérification statistique suffisante
  4. Valeur Pratique Élevée : Les améliorations significatives de performance et d'efficacité prouvent la valeur d'application pratique de la méthode
  5. Écriture Claire : Structure de l'article rationnelle, description technique précise

Insuffisances

  1. Analyse Théorique Limitée : Manque de garanties théoriques sur la convergence et l'optimalité de la méthode
  2. Sensibilité aux Paramètres : Le choix du paramètre α peut nécessiter un ajustement pour différents types de systèmes
  3. Complexité Computationnelle : Analyse insuffisante des frais généraux computationnels du processus de distillation des connaissances
  4. Comportement à Long Terme : Manque d'analyse du comportement du système lors d'une exécution prolongée

Impact

  1. Contribution Académique : Fournit un nouveau paradigme d'utilisation des connaissances pour le domaine des systèmes adaptatifs
  2. Valeur Pratique : Peut être directement appliqué aux scénarios réels tels que l'informatique en nuage et l'informatique en périphérie
  3. Reproductibilité : Fournit le code complet et les données, supportant la reproduction des résultats
  4. Signification Inspirante : Fournit de nouvelles perspectives pour l'application de l'apprentissage perpétuel dans l'optimisation des systèmes

Scénarios Applicables

  1. Plateformes d'Informatique en Nuage : Optimisation de la configuration des systèmes dans les environnements de charges de travail dynamiques
  2. Informatique en Périphérie : Adaptation rapide de la configuration dans les environnements aux ressources limitées
  3. Systèmes de Base de Données : Ajustement des performances orienté vers différents modèles de requête
  4. Systèmes Distribués : Gestion de la configuration dans les environnements multi-locataires

Références Bibliographiques

L'article cite 76 références connexes, couvrant les systèmes adaptatifs, l'ingénierie logicielle basée sur la recherche, l'optimisation dynamique et d'autres domaines, fournissant une base théorique solide et une analyse comparative complète.


Évaluation Globale : Ceci est un article de recherche de haute qualité en génie logiciel, proposant une solution innovante au problème important de l'optimisation adaptative de la configuration des systèmes configurables. La conception de la méthode est rationnelle, la vérification expérimentale est complète et la valeur pratique est significative. Bien qu'il y ait encore de la place pour amélioration dans l'analyse théorique et la recherche sur le comportement à long terme, la contribution globale est remarquable et a un impact important sur les domaines connexes.