2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li

Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.

academic

Distilled Lifelong Self-Adaptation for Configurable Systems

基本信息

论文ID: 2501.00840
标题: Distilled Lifelong Self-Adaptation for Configurable Systems
作者: Yulong Ye, Tao Chen, Miqing Li (University of Birmingham)
分类: cs.SE (Software Engineering), cs.AI
发表时间: 2025年1月1日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2501.00840

摘要

现代可配置系统为工程未来智能软件系统提供了巨大机遇。其中一个关键难题是如何有效地自适应运行系统的配置，使其在时变工作负载下优化性能（如运行时间和吞吐量）。现有方法要么忽略可用的历史知识，要么依赖静态的历史知识利用而不考虑信息的有用性，因此无法很好地解决这一问题。本文提出DLiSA框架来解决这一挑战性问题。DLiSA具有两个特性：首先支持终身规划，规划过程在系统生命周期内持续运行，允许动态利用累积知识进行快速适应；其次通过蒸馏知识播种来增强新工作负载的规划，动态净化知识，仅在必要时播种有用的历史配置，减少误导信息。广泛实验表明DLiSA显著优于最先进方法，性能提升高达229%，资源加速高达2.22倍。

研究背景与动机

问题定义

本研究要解决的核心问题是可配置系统在时变工作负载下的自适应配置优化问题。具体而言：

配置空间复杂性：现代软件系统（如数据库H2、文件压缩器KANZI等）具有大量可配置选项，形成指数级增长的配置空间
工作负载动态性：系统面临的工作负载随时间变化且不可预测，导致最优配置也随之改变
实时性要求：系统需要在有限预算约束下快速找到适应新工作负载的最优配置

重要性分析

这个问题的重要性体现在：

实用价值：现代云计算、边缘计算等场景中，系统需要动态适应不同类型和规模的工作负载
性能影响：配置选择直接影响系统关键性能指标（运行时间、吞吐量等）
资源效率：合理的自适应策略可以显著提高资源利用效率

现有方法局限性

通过对现有方法的分析，作者识别出两大类方法的不足：

静态适应方法（如FEMOSAA）：
- 每次工作负载变化时从零开始搜索
- 忽略历史优化经验，造成重复劳动
- 浪费宝贵的历史信息
动态适应方法（如Seed-EA, D-SOGA, LiDOS）：
- 采用静态知识利用策略
- 盲目使用最近工作负载的所有配置进行播种
- 丢弃早期工作负载的有用信息
- 无法区分有用和误导性配置

关键特征发现

通过对KANZI和H2等系统的实证分析，作者发现了可配置系统的关键特征：

不同工作负载间的顶级性能配置可能非常相似或非常不同，这取决于系统类型和具体工作负载

这一发现揭示了静态知识利用策略的根本缺陷，为动态知识蒸馏奠定了理论基础。

核心贡献

提出DLiSA框架：首个支持蒸馏终身自适应的可配置系统框架，结合终身规划和动态知识蒸馏
设计排序工作负载相似性分析：基于排序损失的相似性度量方法，用于判断何时进行知识播种
开发加权配置播种策略：动态提取最有用的历史配置，同时过滤误导信息
全面实验验证：在9个真实系统、93个测试案例上验证，性能提升高达2.29倍，效率提升高达2.22倍

方法详解

任务定义

输入：

可配置系统S，配置空间X = (x₁, x₂, ..., xₙ)
时变工作负载序列W₁, W₂, ..., Wₜ
预算约束Rₜ（每个时间步的最大配置评估次数）

输出：

每个时间步的最优配置x*，使得性能目标fₜ(x)最优

约束条件：

资源预算：rₜ ≤ Rₜ
实时性要求：必须在工作负载变化时快速响应

模型架构

DLiSA采用MAPE-K（Monitor-Analyze-Plan-Execute-Knowledge）架构，核心包含两个专门化组件：

1. 知识蒸馏组件（Analyzer）

负责动态分析和提取有用的历史知识：

排序工作负载相似性分析：

计算相邻工作负载间的排序损失：

L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))

相似性得分：
```
S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
```
平均相似性：S_sav用于判断是否触发播种

加权配置播种：

局部阶段：选择每个工作负载的前50%最佳配置
全局阶段：基于鲁棒性和时效性计算权重
- 鲁棒性权重：w_(c,r) = O_c / H
- 时效性权重：w_(c,t) = S_c / H
- 总权重：w_c = w_(c,r) + w_(c,t)

2. 进化规划组件（Planner）

基于遗传算法进行配置优化：

使用播种的配置作为初始种群
通过交叉、变异操作进化出更好的配置
在Cyber-Twin环境中评估配置性能

技术创新点

动态知识利用：
- 与静态方法不同，DLiSA根据工作负载相似性动态决定是否播种
- 避免了盲目播种可能带来的负面影响
全历史知识挖掘：
- 不局限于最近工作负载，从所有历史工作负载中提取有用配置
- 通过加权机制平衡配置的鲁棒性和时效性
终身学习范式：
- 规划过程持续运行，状态在不同工作负载间保持
- 实现真正的动态优化而非静态重启

实验设置

数据集

实验使用9个不同领域的真实可配置系统：

系统	语言	域	性能指标	配置选项数	工作负载数
JUMP3R	Java	音频编码器	运行时间	16	6
KANZI	Java	文件压缩器	运行时间	24	9
H2	Java	数据库	吞吐量	16	8
XZ	C/C++	文件压缩器	运行时间	33	13
Z3	C/C++	SMT求解器	运行时间	12	12