2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li
Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.
academic

Adaptación Automática Destilada de por Vida para Sistemas Configurables

Información Básica

  • ID del Artículo: 2501.00840
  • Título: Distilled Lifelong Self-Adaptation for Configurable Systems
  • Autores: Yulong Ye, Tao Chen, Miqing Li (University of Birmingham)
  • Clasificación: cs.SE (Ingeniería de Software), cs.AI
  • Fecha de Publicación: 1 de enero de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2501.00840

Resumen

Los sistemas configurables modernos ofrecen enormes oportunidades para la ingeniería de futuros sistemas de software inteligentes. Uno de los desafíos clave es cómo adaptar efectivamente la configuración de sistemas en ejecución para optimizar el rendimiento (como tiempo de ejecución y rendimiento) bajo cargas de trabajo que varían en el tiempo. Los métodos existentes ignoran el conocimiento histórico disponible o dependen de la utilización estática del conocimiento histórico sin considerar su utilidad, por lo que no resuelven bien este problema. Este artículo propone el marco DLiSA para abordar este desafío. DLiSA tiene dos características: primero, admite planificación de por vida, donde el proceso de planificación se ejecuta continuamente durante el ciclo de vida del sistema, permitiendo la utilización dinámica del conocimiento acumulado para adaptación rápida; segundo, mejora la planificación para nuevas cargas de trabajo mediante siembra de conocimiento destilado, purificando dinámicamente el conocimiento e implantando solo configuraciones históricas útiles cuando es necesario, reduciendo información engañosa. Los experimentos extensos demuestran que DLiSA supera significativamente los métodos de última generación, con mejoras de rendimiento de hasta 229% y aceleración de recursos de hasta 2.22 veces.

Contexto de Investigación y Motivación

Definición del Problema

El problema central que aborda esta investigación es el problema de optimización de configuración adaptativa de sistemas configurables bajo cargas de trabajo que varían en el tiempo. Específicamente:

  1. Complejidad del Espacio de Configuración: Los sistemas de software modernos (como la base de datos H2, el compresor de archivos KANZI, etc.) tienen numerosas opciones configurables, formando un espacio de configuración de crecimiento exponencial
  2. Dinamismo de la Carga de Trabajo: Las cargas de trabajo que enfrenta el sistema varían con el tiempo de manera impredecible, causando que la configuración óptima también cambie
  3. Requisitos de Tiempo Real: El sistema necesita encontrar rápidamente la configuración óptima que se adapte a nuevas cargas de trabajo bajo restricciones presupuestarias limitadas

Análisis de Importancia

La importancia de este problema se refleja en:

  • Valor Práctico: En escenarios modernos de computación en la nube, computación perimetral, etc., los sistemas necesitan adaptarse dinámicamente a diferentes tipos y escalas de cargas de trabajo
  • Impacto en el Rendimiento: La selección de configuración afecta directamente los indicadores de rendimiento críticos del sistema (tiempo de ejecución, rendimiento, etc.)
  • Eficiencia de Recursos: Las estrategias de adaptación razonables pueden mejorar significativamente la eficiencia de utilización de recursos

Limitaciones de Métodos Existentes

Mediante el análisis de métodos existentes, los autores identifican las deficiencias de dos categorías principales de métodos:

  1. Métodos de Adaptación Estática (como FEMOSAA):
    • Comienzan la búsqueda desde cero cada vez que cambia la carga de trabajo
    • Ignoran la experiencia de optimización histórica, causando trabajo repetido
    • Desperdician información histórica valiosa
  2. Métodos de Adaptación Dinámica (como Seed-EA, D-SOGA, LiDOS):
    • Adoptan estrategias estáticas de utilización de conocimiento
    • Utilizan ciegamente todas las configuraciones de la carga de trabajo más reciente para siembra
    • Descartan información útil de cargas de trabajo anteriores
    • No pueden distinguir entre configuraciones útiles y engañosas

Descubrimientos de Características Clave

Mediante análisis empírico de sistemas como KANZI y H2, los autores descubren características clave de sistemas configurables:

Las configuraciones de rendimiento superior entre diferentes cargas de trabajo pueden ser muy similares o muy diferentes, dependiendo del tipo de sistema y la carga de trabajo específica

Este descubrimiento revela el defecto fundamental de las estrategias estáticas de utilización de conocimiento, sentando las bases teóricas para la destilación dinámica de conocimiento.

Contribuciones Principales

  1. Propone el Marco DLiSA: El primer marco que admite adaptación automática destilada de por vida para sistemas configurables, combinando planificación de por vida y destilación dinámica de conocimiento
  2. Diseña Análisis de Similitud de Carga de Trabajo Ordenada: Método de medida de similitud basado en pérdida de ordenamiento para determinar cuándo realizar siembra de conocimiento
  3. Desarrolla Estrategia de Siembra de Configuración Ponderada: Extrae dinámicamente las configuraciones históricas más útiles mientras filtra información engañosa
  4. Verificación Experimental Integral: Validación en 9 sistemas reales y 93 casos de prueba, con mejoras de rendimiento de hasta 2.29 veces y mejoras de eficiencia de hasta 2.22 veces

Explicación Detallada del Método

Definición de Tarea

Entrada:

  • Sistema configurable S, espacio de configuración X = (x₁, x₂, ..., xₙ)
  • Secuencia de carga de trabajo que varía en el tiempo W₁, W₂, ..., Wₜ
  • Restricción presupuestaria Rₜ (número máximo de evaluaciones de configuración por paso de tiempo)

Salida:

  • Configuración óptima x* para cada paso de tiempo, optimizando el objetivo de rendimiento fₜ(x)

Restricciones:

  • Presupuesto de recursos: rₜ ≤ Rₜ
  • Requisitos de tiempo real: debe responder rápidamente cuando cambia la carga de trabajo

Arquitectura del Modelo

DLiSA adopta la arquitectura MAPE-K (Monitor-Analyze-Plan-Execute-Knowledge), con dos componentes especializados principales:

1. Componente de Destilación de Conocimiento (Analizador)

Responsable del análisis dinámico y extracción de conocimiento histórico útil:

Análisis de Similitud de Carga de Trabajo Ordenada:

  • Calcula la pérdida de ordenamiento entre cargas de trabajo adyacentes:
    L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))
    
  • Puntuación de similitud:
    S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
    
  • Similitud promedio: S_sav se utiliza para determinar si se activa la siembra

Siembra de Configuración Ponderada:

  • Fase local: selecciona el 50% superior de configuraciones óptimas de cada carga de trabajo
  • Fase global: calcula pesos basados en robustez y oportunidad
    • Peso de robustez: w_(c,r) = O_c / H
    • Peso de oportunidad: w_(c,t) = S_c / H
    • Peso total: w_c = w_(c,r) + w_(c,t)

2. Componente de Planificación Evolutiva (Planificador)

Optimización de configuración basada en algoritmo genético:

  • Utiliza configuraciones sembradas como población inicial
  • Evoluciona hacia mejores configuraciones mediante operaciones de cruce y mutación
  • Evalúa el rendimiento de configuración en el entorno Cyber-Twin

Puntos de Innovación Técnica

  1. Utilización Dinámica de Conocimiento:
    • A diferencia de los métodos estáticos, DLiSA decide dinámicamente si sembrar basándose en la similitud de carga de trabajo
    • Evita los efectos negativos potenciales de la siembra ciega
  2. Explotación de Conocimiento Histórico Completo:
    • No se limita a cargas de trabajo recientes, extrae configuraciones útiles de todo el historial
    • Equilibra la robustez y oportunidad de configuración mediante mecanismo de ponderación
  3. Paradigma de Aprendizaje de por Vida:
    • El proceso de planificación se ejecuta continuamente, manteniendo el estado entre diferentes cargas de trabajo
    • Logra verdadera optimización dinámica en lugar de reinicio estático

Configuración Experimental

Conjunto de Datos

El experimento utiliza 9 sistemas configurables reales de diferentes dominios:

SistemaLenguajeDominioMétrica de RendimientoNúmero de Opciones de ConfiguraciónNúmero de Cargas de Trabajo
JUMP3RJavaCodificador de AudioTiempo de Ejecución166
KANZIJavaCompresor de ArchivosTiempo de Ejecución249
H2JavaBase de DatosRendimiento168
XZC/C++Compresor de ArchivosTiempo de Ejecución3313
Z3C/C++Solucionador SMTTiempo de Ejecución1212

Total de 93 casos de prueba, cubriendo diferentes lenguajes de programación, dominios de aplicación y objetivos de rendimiento.

Métricas de Evaluación

  1. Efectividad: Clasificación de prueba Scott-Knott, valores de rendimiento final
  2. Eficiencia: Número de evaluaciones de configuración necesarias para lograr el mismo rendimiento, relación de aceleración s = b/m

Métodos de Comparación

  • FEMOSAA: Adaptación estática, búsqueda desde cero cada vez
  • Seed-EA: Adaptación dinámica, siembra de todas las configuraciones de carga de trabajo reciente
  • D-SOGA: Adaptación híbrida, 80% histórico + 20% configuración aleatoria
  • LiDOS: Adaptación dinámica, retiene configuraciones basadas en relaciones no dominadas multiobjeto

Detalles de Implementación

  • Tamaño de población: 20
  • Restricción presupuestaria: 80 evaluaciones de configuración
  • Tasa de cruce: 0.9, Tasa de mutación: 0.1
  • Parámetro de umbral: α = 0.3
  • Ejecuciones independientes: 100, orden de carga de trabajo aleatorizado

Resultados Experimentales

Resultados Principales

DLiSA supera significativamente los métodos de comparación en ambas dimensiones de efectividad y eficiencia:

Resultados de Efectividad:

  • En 93 casos de prueba, DLiSA se clasifica primero en 69 casos (74%)
  • En comparación, el número de casos de mejor clasificación de otros métodos: FEMOSAA (11), Seed-EA (33), D-SOGA (29), LiDOS (10)
  • Mejora máxima de rendimiento: 2.29 veces (sistema KANZI, carga de trabajo W8)

Resultados de Eficiencia:

  • En comparación con FEMOSAA: DLiSA es más eficiente en 88 casos, aceleración máxima de 2.16 veces
  • En comparación con Seed-EA: DLiSA es más eficiente en 57 casos, aceleración máxima de 2.22 veces
  • En comparación con D-SOGA: DLiSA es más eficiente en 58 casos, aceleración máxima de 2.05 veces
  • En comparación con LiDOS: DLiSA es más eficiente en 79 casos, aceleración máxima de 2.05 veces

Experimentos de Ablación

Se diseñan dos variantes para verificar la contribución de cada componente:

  1. DLiSA-I: Reemplaza siembra de configuración ponderada con siembra aleatoria
    • Resultado: DLiSA gana en 50 casos, 43 empates, 0 pérdidas
    • Prueba la efectividad de la siembra de configuración ponderada
  2. DLiSA-II: Desactiva análisis de similitud de carga de trabajo, activa siembra aleatoria
    • Resultado: DLiSA gana en 39 casos, 53 empates, 1 pérdida
    • Prueba la importancia del análisis de similitud

Análisis de Sensibilidad de Parámetros

Análisis de sensibilidad del parámetro de umbral α ∈ {0, 0.1, ..., 0.9}:

  • El rendimiento es óptimo cuando α = 0.3, obteniendo la mayoría de clasificaciones de primer lugar en la prueba Scott-Knott
  • α demasiado pequeño: siembra excesiva, introduce información engañosa
  • α demasiado grande: siembra insuficiente, desperdicia conocimiento histórico
  • La degradación de rendimiento con α grande es más severa que con α pequeño

Descubrimientos Experimentales

  1. Función del Análisis de Similitud de Carga de Trabajo: El análisis de similitud puede identificar efectivamente momentos favorables para la siembra, evitando siembra perjudicial cuando hay grandes diferencias en el paisaje de configuración
  2. Efecto de la Siembra Ponderada: Las configuraciones de alto peso generalmente funcionan mejor bajo nuevas cargas de trabajo, validando el diseño razonable de pesos de robustez y oportunidad
  3. Especificidad del Sistema: Diferentes sistemas exhiben diferentes patrones de similitud de carga de trabajo, como el sistema KANZI con mayor superposición entre cargas de trabajo, mientras que el sistema H2 muestra mayores diferencias

Trabajo Relacionado

Métodos de Adaptación Estática

Los métodos tradicionales como FEMOSAA se enfocaban principalmente en problemas de optimización única, reiniciando la búsqueda cada vez que cambia la carga de trabajo. Estos métodos simplifican el proceso de optimización pero ignoran la valiosa experiencia histórica.

Métodos de Adaptación Dinámica

Métodos como PLATO y Seed-EA admiten planificación continua y mantenimiento de estado, pero adoptan estrategias estáticas de utilización de conocimiento, sin poder ajustar dinámicamente la estrategia de siembra según las características de carga de trabajo.

Métodos de Teoría de Control

Métodos basados en filtro de Kalman, control predictivo de modelo, etc., muestran potencial en planificación adaptativa, pero enfrentan desafíos en el modelado de dinámicas de sistemas no lineales complejos.

Métodos de Aprendizaje de Rendimiento

Métodos como máquinas de vectores de soporte, redes neuronales, aprendizaje conjunto, etc., se enfocan en modelar relaciones entre configuración y rendimiento, complementando la perspectiva de optimización de DLiSA.

Conclusiones y Discusión

Conclusiones Principales

  1. Efectividad de DLiSA: Mediante destilación dinámica de conocimiento, DLiSA supera significativamente los métodos existentes en la mayoría de casos de prueba
  2. Mejora Significativa de Eficiencia: La mejora de eficiencia de utilización de recursos de hasta 2.22 veces demuestra el valor de la reutilización de conocimiento histórico
  3. Contribución de Componentes Clara: Los experimentos de ablación validan las contribuciones independientes del análisis de similitud ordenada y la siembra ponderada
  4. Configuración de Parámetros Razonable: α = 0.3 muestra el mejor desempeño en equilibrar los beneficios de siembra y riesgos de información engañosa

Limitaciones

  1. Ajuste de Parámetros: El umbral α puede necesitar ajuste específico del sistema para lograr rendimiento óptimo
  2. Rango de Sistemas: Aunque cubre 9 sistemas, la extensión a más tipos de sistemas puede requerir validación adicional
  3. Dependencia de Cyber-Twin: Los experimentos dependen de puntos de referencia existentes como Cyber-Twin, el despliegue real puede requerir modelado más complejo

Direcciones Futuras

  1. Métodos de Análisis de Paisaje: Desarrollar técnicas más refinadas de análisis de paisaje de configuración para manejar mejor la evolución de carga de trabajo
  2. Mecanismo de Retroalimentación: Explorar mecanismos de retroalimentación para identificar más precisamente información de planificación beneficiosa
  3. Extensión Multiobjetivo: Extender el marco a escenarios de optimización multiobjetivo
  4. Análisis Teórico: Proporcionar análisis teórico más profundo para guiar la configuración de parámetros y diseño de sistemas

Evaluación Profunda

Fortalezas

  1. Definición Clara del Problema: Identifica con precisión los defectos fundamentales de los métodos existentes en la utilización de conocimiento
  2. Diseño de Método Razonable: Las estrategias de análisis de similitud ordenada y siembra ponderada están diseñadas ingeniosamente con bases teóricas sólidas
  3. Diseño Experimental Completo: Cubre múltiples sistemas y escenarios diversos, con verificación estadística suficiente
  4. Alto Valor Práctico: Las mejoras significativas de rendimiento y eficiencia demuestran el valor de aplicación práctica del método
  5. Escritura Clara: La estructura del artículo es razonable, con descripción precisa de detalles técnicos

Deficiencias

  1. Análisis Teórico Limitado: Carece de garantías teóricas sobre convergencia y optimalidad del método
  2. Sensibilidad de Parámetros: La selección del parámetro α puede necesitar ajuste específico para diferentes tipos de sistemas
  3. Complejidad Computacional: No analiza en detalle la sobrecarga computacional del proceso de destilación de conocimiento
  4. Comportamiento a Largo Plazo: Carece de análisis del comportamiento de ejecución a largo plazo del sistema

Impacto

  1. Contribución Académica: Proporciona un nuevo paradigma de utilización de conocimiento para el campo de sistemas adaptativos
  2. Valor Práctico: Puede aplicarse directamente a escenarios reales como computación en la nube y computación perimetral
  3. Reproducibilidad: Proporciona código y datos completos para apoyar la reproducción de resultados
  4. Significado Inspirador: Proporciona nuevas ideas para la aplicación del aprendizaje de por vida en optimización de sistemas

Escenarios Aplicables

  1. Plataformas de Computación en la Nube: Optimización de configuración de sistemas bajo entornos de carga de trabajo dinámica
  2. Computación Perimetral: Adaptación rápida de configuración en entornos con recursos limitados
  3. Sistemas de Base de Datos: Ajuste de rendimiento orientado a diferentes patrones de consulta
  4. Sistemas Distribuidos: Gestión de configuración en entornos multiinquilino

Referencias

El artículo cita 76 referencias relacionadas, cubriendo trabajos importantes en múltiples dominios como sistemas adaptativos, ingeniería de software basada en búsqueda, optimización dinámica, proporcionando una base teórica sólida y análisis comparativo integral.


Evaluación General: Este es un artículo de investigación de alta calidad en ingeniería de software que propone una solución innovadora al importante problema de optimización adaptativa de configuración de sistemas configurables. El diseño del método es razonable, la verificación experimental es completa y el valor práctico es significativo. Aunque hay espacio para mejora en análisis teórico e investigación de comportamiento a largo plazo, la contribución general es destacada y tiene un impacto importante en el avance del campo relacionado.