2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li
Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.
academic

Дистиллированная пожизненная самоадаптация для конфигурируемых систем

Основная информация

  • ID статьи: 2501.00840
  • Название: Distilled Lifelong Self-Adaptation for Configurable Systems
  • Авторы: Yulong Ye, Tao Chen, Miqing Li (Университет Бирмингема)
  • Классификация: cs.SE (Программная инженерия), cs.AI
  • Дата публикации: 1 января 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2501.00840

Аннотация

Современные конфигурируемые системы предоставляют огромные возможности для разработки интеллектуальных программных систем будущего. Одна из ключевых проблем заключается в эффективной самоадаптации конфигурации работающей системы для оптимизации производительности (например, времени выполнения и пропускной способности) при изменяющихся во времени рабочих нагрузках. Существующие методы либо игнорируют доступные исторические знания, либо полагаются на статическое использование исторических знаний без учета их полезности, поэтому не решают эту проблему эффективно. В данной работе предлагается фреймворк DLiSA для решения этой сложной проблемы. DLiSA обладает двумя характеристиками: во-первых, поддерживает пожизненное планирование, процесс планирования продолжается на протяжении всего жизненного цикла системы, позволяя динамически использовать накопленные знания для быстрой адаптации; во-вторых, улучшает планирование для новых рабочих нагрузок посредством дистилляции знаний, динамически очищает знания и засевает только полезные исторические конфигурации при необходимости, снижая дезинформацию. Обширные эксперименты показывают, что DLiSA значительно превосходит передовые методы с улучшением производительности до 229% и ускорением ресурсов до 2,22 раза.

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема, которую решает данное исследование, — это проблема адаптивной оптимизации конфигурации конфигурируемых систем при изменяющихся во времени рабочих нагрузках. В частности:

  1. Сложность пространства конфигураций: Современные программные системы (такие как база данных H2, компрессор файлов KANZI и т.д.) имеют множество параметров конфигурации, образующих экспоненциально растущее пространство конфигураций
  2. Динамичность рабочей нагрузки: Рабочие нагрузки, с которыми сталкивается система, изменяются со временем и непредсказуемы, что приводит к изменению оптимальной конфигурации
  3. Требования реального времени: Система должна быстро найти оптимальную конфигурацию, адаптированную к новой рабочей нагрузке в условиях ограниченного бюджета

Анализ значимости

Значимость этой проблемы проявляется в:

  • Практической ценности: В современных сценариях облачных вычислений, граничных вычислений и т.д. системы должны динамически адаптироваться к различным типам и масштабам рабочих нагрузок
  • Влиянии на производительность: Выбор конфигурации напрямую влияет на ключевые показатели производительности системы (время выполнения, пропускная способность и т.д.)
  • Эффективности ресурсов: Разумная стратегия адаптации может значительно повысить эффективность использования ресурсов

Ограничения существующих методов

Путем анализа существующих методов авторы выявили недостатки двух основных классов методов:

  1. Методы статической адаптации (например, FEMOSAA):
    • При каждом изменении рабочей нагрузки начинают поиск с нуля
    • Игнорируют исторический опыт оптимизации, вызывая дублирование работы
    • Теряют ценную историческую информацию
  2. Методы динамической адаптации (например, Seed-EA, D-SOGA, LiDOS):
    • Применяют статическую стратегию использования знаний
    • Слепо используют все конфигурации последней рабочей нагрузки для засева
    • Отбрасывают полезную информацию из ранних рабочих нагрузок
    • Не могут различить полезные и дезинформирующие конфигурации

Ключевые выводы

Посредством эмпирического анализа систем KANZI и H2 авторы выявили ключевые характеристики конфигурируемых систем:

Конфигурации с лучшей производительностью для разных рабочих нагрузок могут быть очень похожи или очень отличаться в зависимости от типа системы и конкретной рабочей нагрузки

Этот вывод раскрывает фундаментальный дефект статических стратегий использования знаний и закладывает теоретическую основу для динамической дистилляции знаний.

Основные вклады

  1. Предложение фреймворка DLiSA: Первый фреймворк, поддерживающий дистиллированную пожизненную самоадаптацию для конфигурируемых систем, объединяющий пожизненное планирование и динамическую дистилляцию знаний
  2. Разработка анализа сходства рабочих нагрузок на основе ранжирования: Метод измерения сходства на основе потерь ранжирования для определения времени засева знаний
  3. Разработка стратегии взвешенного засева конфигураций: Динамическое извлечение наиболее полезных исторических конфигураций при фильтрации дезинформирующей информации
  4. Комплексная экспериментальная верификация: Верификация на 9 реальных системах и 93 тестовых случаях с улучшением производительности до 2,29 раза и повышением эффективности до 2,22 раза

Подробное описание метода

Определение задачи

Входные данные:

  • Конфигурируемая система S, пространство конфигураций X = (x₁, x₂, ..., xₙ)
  • Последовательность изменяющихся во времени рабочих нагрузок W₁, W₂, ..., Wₜ
  • Ограничение бюджета Rₜ (максимальное количество оценок конфигураций на каждом временном шаге)

Выходные данные:

  • Оптимальная конфигурация x* для каждого временного шага, оптимизирующая целевую функцию производительности fₜ(x)

Ограничения:

  • Бюджет ресурсов: rₜ ≤ Rₜ
  • Требования реального времени: необходимо быстро реагировать при изменении рабочей нагрузки

Архитектура модели

DLiSA использует архитектуру MAPE-K (Monitor-Analyze-Plan-Execute-Knowledge), основные компоненты которой включают два специализированных модуля:

1. Компонент дистилляции знаний (Analyzer)

Отвечает за динамический анализ и извлечение полезных исторических знаний:

Анализ сходства рабочих нагрузок на основе ранжирования:

  • Вычисление потерь ранжирования между соседними рабочими нагрузками:
    L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))
    
  • Оценка сходства:
    S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
    
  • Среднее сходство: S_sav используется для определения срабатывания засева

Взвешенный засев конфигураций:

  • Локальный этап: выбор 50% лучших конфигураций каждой рабочей нагрузки
  • Глобальный этап: вычисление весов на основе надежности и своевременности
    • Вес надежности: w_(c,r) = O_c / H
    • Вес своевременности: w_(c,t) = S_c / H
    • Общий вес: w_c = w_(c,r) + w_(c,t)

2. Компонент эволюционного планирования (Planner)

Основан на генетическом алгоритме для оптимизации конфигурации:

  • Использование засеянных конфигураций в качестве начальной популяции
  • Эволюция лучших конфигураций посредством операций кроссовера и мутации
  • Оценка производительности конфигураций в среде Cyber-Twin

Технические инновации

  1. Динамическое использование знаний:
    • В отличие от статических методов, DLiSA динамически решает, проводить ли засев, на основе сходства рабочих нагрузок
    • Избегает отрицательного влияния слепого засева
  2. Добыча знаний из полной истории:
    • Не ограничивается последней рабочей нагрузкой, извлекает полезные конфигурации из всех исторических рабочих нагрузок
    • Посредством механизма взвешивания балансирует надежность и своевременность конфигураций
  3. Парадигма пожизненного обучения:
    • Процесс планирования продолжается непрерывно, состояние сохраняется между различными рабочими нагрузками
    • Реализует истинную динамическую оптимизацию вместо статического перезапуска

Экспериментальная установка

Набор данных

Эксперименты используют 9 реальных конфигурируемых систем из различных областей:

СистемаЯзыкОбластьПоказатель производительностиКоличество параметров конфигурацииКоличество рабочих нагрузок
JUMP3RJavaКодировщик аудиоВремя выполнения166
KANZIJavaКомпрессор файловВремя выполнения249
H2JavaБаза данныхПропускная способность168
XZC/C++Компрессор файловВремя выполнения3313
Z3C/C++Решатель SMTВремя выполнения1212

Всего 93 тестовых случая, охватывающих различные языки программирования, области применения и целевые показатели производительности.

Показатели оценки

  1. Эффективность: Ранжирование теста Scott-Knott, финальные значения производительности
  2. Производительность: Количество оценок конфигураций, необходимых для достижения одинаковой производительности, коэффициент ускорения s = b/m

Методы сравнения

  • FEMOSAA: Статическая адаптация, поиск с нуля при каждом изменении
  • Seed-EA: Динамическая адаптация, засев всех конфигураций последней рабочей нагрузки
  • D-SOGA: Гибридная адаптация, 80% исторических + 20% случайных конфигураций
  • LiDOS: Динамическая адаптация, сохранение конфигураций на основе недоминируемых отношений в многокритериальной оптимизации

Детали реализации

  • Размер популяции: 20
  • Ограничение бюджета: 80 оценок конфигураций
  • Вероятность кроссовера: 0,9, вероятность мутации: 0,1
  • Пороговый параметр: α = 0,3
  • Независимые запуски: 100, случайный порядок рабочих нагрузок

Результаты экспериментов

Основные результаты

DLiSA значительно превосходит методы сравнения по двум измерениям: эффективности и производительности:

Результаты эффективности:

  • На 93 тестовых случаях DLiSA занимает первое место в 69 случаях (74%)
  • Для сравнения, лучшие результаты других методов: FEMOSAA (11), Seed-EA (33), D-SOGA (29), LiDOS (10)
  • Максимальное улучшение производительности: 2,29 раза (система KANZI, рабочая нагрузка W8)

Результаты производительности:

  • По сравнению с FEMOSAA: DLiSA более эффективен в 88 случаях, максимальное ускорение 2,16 раза
  • По сравнению с Seed-EA: DLiSA более эффективен в 57 случаях, максимальное ускорение 2,22 раза
  • По сравнению с D-SOGA: DLiSA более эффективен в 58 случаях, максимальное ускорение 2,05 раза
  • По сравнению с LiDOS: DLiSA более эффективен в 79 случаях, максимальное ускорение 2,05 раза

Абляционные эксперименты

Разработаны два варианта для проверки вклада каждого компонента:

  1. DLiSA-I: Замена взвешенного засева конфигураций случайным засевом
    • Результат: DLiSA побеждает в 50 случаях, 43 ничьи, 0 поражений
    • Доказывает эффективность взвешенного засева конфигураций
  2. DLiSA-II: Отключение анализа сходства рабочих нагрузок, случайное срабатывание засева
    • Результат: DLiSA побеждает в 39 случаях, 53 ничьи, 1 поражение
    • Доказывает важность анализа сходства

Анализ чувствительности параметров

Анализ чувствительности порогового параметра α ∈ {0, 0,1, ..., 0,9}:

  • При α = 0,3 производительность оптимальна, получено наибольшее количество первых мест в тесте Scott-Knott
  • Слишком малое α: чрезмерный засев, введение дезинформирующей информации
  • Слишком большое α: недостаточный засев, потеря исторических знаний
  • Деградация производительности при большом α более серьезна, чем при малом α

Экспериментальные выводы

  1. Роль сходства рабочих нагрузок: Анализ сходства эффективно определяет благоприятное время для засева, избегая вредного засева при большом различии в ландшафтах конфигураций
  2. Эффект взвешенного засева: Конфигурации с высоким весом обычно показывают лучшую производительность при новых рабочих нагрузках, подтверждая обоснованность разработки весов надежности и своевременности
  3. Специфичность системы: Различные системы демонстрируют различные модели сходства рабочих нагрузок, например, система KANZI имеет большее перекрытие между рабочими нагрузками, в то время как система H2 показывает большие различия

Связанные работы

Методы статической адаптации

Традиционные методы, такие как FEMOSAA, в основном сосредоточены на задачах однократной оптимизации, перезапуская поиск при каждом изменении рабочей нагрузки. Такие методы упрощают процесс оптимизации, но игнорируют ценный исторический опыт.

Методы динамической адаптации

Методы, такие как PLATO и Seed-EA, поддерживают непрерывное планирование и сохранение состояния, но применяют статические стратегии использования знаний, не способные динамически адаптировать стратегию засева в соответствии с характеристиками рабочей нагрузки.

Методы теории управления

Методы, основанные на фильтре Калмана, прогнозирующем управлении моделью и т.д., показывают потенциал в адаптивном планировании, но сталкиваются с проблемой моделирования сложной нелинейной динамики системы.

Методы обучения производительности

Методы, использующие машины опорных векторов, нейронные сети, ансамблевое обучение и т.д., сосредоточены на моделировании отношения между конфигурацией и производительностью, дополняя оптимизационный подход DLiSA.

Заключение и обсуждение

Основные выводы

  1. Эффективность DLiSA: Посредством динамической дистилляции знаний DLiSA значительно превосходит существующие методы в большинстве тестовых случаев
  2. Значительное повышение производительности: Повышение эффективности использования ресурсов до 2,22 раза доказывает ценность повторного использования исторических знаний
  3. Четкий вклад компонентов: Абляционные эксперименты подтверждают независимый вклад анализа сходства ранжирования и взвешенного засева
  4. Разумная установка параметров: α = 0,3 показывает лучшую производительность в балансировании выгод засева и рисков дезинформации

Ограничения

  1. Настройка параметров: Пороговый параметр α может потребовать настройки для конкретных систем для достижения оптимальной производительности
  2. Диапазон систем: Хотя охватывает 9 систем, расширение на большее количество типов систем может потребовать дополнительной верификации
  3. Зависимость от Cyber-Twin: Эксперименты полагаются на существующие тестовые наборы в качестве Cyber-Twin, что может потребовать более сложного моделирования при практическом развертывании

Направления будущих исследований

  1. Методы анализа ландшафта: Разработка более тонких методов анализа ландшафта конфигураций для лучшей обработки эволюции рабочих нагрузок
  2. Механизмы обратной связи: Исследование механизмов обратной связи для более точного определения полезной информации планирования
  3. Расширение на многокритериальную оптимизацию: Расширение фреймворка на сценарии многокритериальной оптимизации
  4. Теоретический анализ: Предоставление более глубокого теоретического анализа для руководства установкой параметров и проектированием системы

Глубокая оценка

Преимущества

  1. Четкое определение проблемы: Точное выявление фундаментальных дефектов существующих методов в использовании знаний
  2. Разумное проектирование метода: Анализ сходства ранжирования и стратегия взвешенного засева разработаны искусно с прочной теоретической базой
  3. Совершенное проектирование экспериментов: Охватывает несколько систем и различные сценарии с достаточной статистической верификацией
  4. Высокая практическая ценность: Значительные улучшения производительности и эффективности доказывают практическую применимость метода
  5. Четкое изложение: Логичная структура статьи, точное описание технических деталей

Недостатки

  1. Ограниченный теоретический анализ: Отсутствие теоретических гарантий сходимости и оптимальности метода
  2. Чувствительность параметров: Выбор параметра α может потребовать настройки для различных типов систем
  3. Сложность вычислений: Отсутствует подробный анализ вычислительных затрат процесса дистилляции знаний
  4. Долгосрочное поведение: Отсутствует анализ поведения системы при длительном времени работы

Влияние

  1. Академический вклад: Предоставляет новую парадигму использования знаний для области адаптивных систем
  2. Практическая ценность: Может быть непосредственно применен в реальных сценариях облачных и граничных вычислений
  3. Воспроизводимость: Предоставляет полный код и данные, поддерживая воспроизведение результатов
  4. Вдохновляющее значение: Предоставляет новые идеи для применения пожизненного обучения в оптимизации систем

Применимые сценарии

  1. Облачные вычислительные платформы: Оптимизация конфигурации системы в среде динамических рабочих нагрузок
  2. Граничные вычисления: Быстрая адаптация конфигурации в среде с ограниченными ресурсами
  3. Системы баз данных: Настройка производительности, ориентированная на различные модели запросов
  4. Распределенные системы: Управление конфигурацией в многотенантной среде

Библиография

Статья цитирует 76 связанных работ, охватывающих адаптивные системы, поисковую инженерию программного обеспечения, динамическую оптимизацию и другие области, предоставляя прочную теоретическую базу и комплексный сравнительный анализ.


Общая оценка: Это высококачественная исследовательская работа в области программной инженерии, предлагающая инновационное решение важной проблемы адаптивной оптимизации конфигурации конфигурируемых систем. Метод разработан разумно, экспериментальная верификация полна, практическая ценность значительна. Хотя в теоретическом анализе и исследовании долгосрочного поведения есть место для улучшения, общий вклад выдающийся и оказывает важное влияние на развитие соответствующих областей.