Distilled Lifelong Self-Adaptation for Configurable Systems
Ye, Chen, Li
Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.
academic
Дистиллированная пожизненная самоадаптация для конфигурируемых систем
Современные конфигурируемые системы предоставляют огромные возможности для разработки интеллектуальных программных систем будущего. Одна из ключевых проблем заключается в эффективной самоадаптации конфигурации работающей системы для оптимизации производительности (например, времени выполнения и пропускной способности) при изменяющихся во времени рабочих нагрузках. Существующие методы либо игнорируют доступные исторические знания, либо полагаются на статическое использование исторических знаний без учета их полезности, поэтому не решают эту проблему эффективно. В данной работе предлагается фреймворк DLiSA для решения этой сложной проблемы. DLiSA обладает двумя характеристиками: во-первых, поддерживает пожизненное планирование, процесс планирования продолжается на протяжении всего жизненного цикла системы, позволяя динамически использовать накопленные знания для быстрой адаптации; во-вторых, улучшает планирование для новых рабочих нагрузок посредством дистилляции знаний, динамически очищает знания и засевает только полезные исторические конфигурации при необходимости, снижая дезинформацию. Обширные эксперименты показывают, что DLiSA значительно превосходит передовые методы с улучшением производительности до 229% и ускорением ресурсов до 2,22 раза.
Основная проблема, которую решает данное исследование, — это проблема адаптивной оптимизации конфигурации конфигурируемых систем при изменяющихся во времени рабочих нагрузках. В частности:
Сложность пространства конфигураций: Современные программные системы (такие как база данных H2, компрессор файлов KANZI и т.д.) имеют множество параметров конфигурации, образующих экспоненциально растущее пространство конфигураций
Динамичность рабочей нагрузки: Рабочие нагрузки, с которыми сталкивается система, изменяются со временем и непредсказуемы, что приводит к изменению оптимальной конфигурации
Требования реального времени: Система должна быстро найти оптимальную конфигурацию, адаптированную к новой рабочей нагрузке в условиях ограниченного бюджета
Практической ценности: В современных сценариях облачных вычислений, граничных вычислений и т.д. системы должны динамически адаптироваться к различным типам и масштабам рабочих нагрузок
Влиянии на производительность: Выбор конфигурации напрямую влияет на ключевые показатели производительности системы (время выполнения, пропускная способность и т.д.)
Эффективности ресурсов: Разумная стратегия адаптации может значительно повысить эффективность использования ресурсов
Посредством эмпирического анализа систем KANZI и H2 авторы выявили ключевые характеристики конфигурируемых систем:
Конфигурации с лучшей производительностью для разных рабочих нагрузок могут быть очень похожи или очень отличаться в зависимости от типа системы и конкретной рабочей нагрузки
Этот вывод раскрывает фундаментальный дефект статических стратегий использования знаний и закладывает теоретическую основу для динамической дистилляции знаний.
Предложение фреймворка DLiSA: Первый фреймворк, поддерживающий дистиллированную пожизненную самоадаптацию для конфигурируемых систем, объединяющий пожизненное планирование и динамическую дистилляцию знаний
Разработка анализа сходства рабочих нагрузок на основе ранжирования: Метод измерения сходства на основе потерь ранжирования для определения времени засева знаний
Разработка стратегии взвешенного засева конфигураций: Динамическое извлечение наиболее полезных исторических конфигураций при фильтрации дезинформирующей информации
Комплексная экспериментальная верификация: Верификация на 9 реальных системах и 93 тестовых случаях с улучшением производительности до 2,29 раза и повышением эффективности до 2,22 раза
Роль сходства рабочих нагрузок: Анализ сходства эффективно определяет благоприятное время для засева, избегая вредного засева при большом различии в ландшафтах конфигураций
Эффект взвешенного засева: Конфигурации с высоким весом обычно показывают лучшую производительность при новых рабочих нагрузках, подтверждая обоснованность разработки весов надежности и своевременности
Специфичность системы: Различные системы демонстрируют различные модели сходства рабочих нагрузок, например, система KANZI имеет большее перекрытие между рабочими нагрузками, в то время как система H2 показывает большие различия
Традиционные методы, такие как FEMOSAA, в основном сосредоточены на задачах однократной оптимизации, перезапуская поиск при каждом изменении рабочей нагрузки. Такие методы упрощают процесс оптимизации, но игнорируют ценный исторический опыт.
Методы, такие как PLATO и Seed-EA, поддерживают непрерывное планирование и сохранение состояния, но применяют статические стратегии использования знаний, не способные динамически адаптировать стратегию засева в соответствии с характеристиками рабочей нагрузки.
Методы, основанные на фильтре Калмана, прогнозирующем управлении моделью и т.д., показывают потенциал в адаптивном планировании, но сталкиваются с проблемой моделирования сложной нелинейной динамики системы.
Методы, использующие машины опорных векторов, нейронные сети, ансамблевое обучение и т.д., сосредоточены на моделировании отношения между конфигурацией и производительностью, дополняя оптимизационный подход DLiSA.
Эффективность DLiSA: Посредством динамической дистилляции знаний DLiSA значительно превосходит существующие методы в большинстве тестовых случаев
Значительное повышение производительности: Повышение эффективности использования ресурсов до 2,22 раза доказывает ценность повторного использования исторических знаний
Четкий вклад компонентов: Абляционные эксперименты подтверждают независимый вклад анализа сходства ранжирования и взвешенного засева
Разумная установка параметров: α = 0,3 показывает лучшую производительность в балансировании выгод засева и рисков дезинформации
Настройка параметров: Пороговый параметр α может потребовать настройки для конкретных систем для достижения оптимальной производительности
Диапазон систем: Хотя охватывает 9 систем, расширение на большее количество типов систем может потребовать дополнительной верификации
Зависимость от Cyber-Twin: Эксперименты полагаются на существующие тестовые наборы в качестве Cyber-Twin, что может потребовать более сложного моделирования при практическом развертывании
Статья цитирует 76 связанных работ, охватывающих адаптивные системы, поисковую инженерию программного обеспечения, динамическую оптимизацию и другие области, предоставляя прочную теоретическую базу и комплексный сравнительный анализ.
Общая оценка: Это высококачественная исследовательская работа в области программной инженерии, предлагающая инновационное решение важной проблемы адаптивной оптимизации конфигурации конфигурируемых систем. Метод разработан разумно, экспериментальная верификация полна, практическая ценность значительна. Хотя в теоретическом анализе и исследовании долгосрочного поведения есть место для улучшения, общий вклад выдающийся и оказывает важное влияние на развитие соответствующих областей.