2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li
Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.
academic

Distilled Lifelong Self-Adaptation for Configurable Systems

基本信息

  • 论文ID: 2501.00840
  • 标题: Distilled Lifelong Self-Adaptation for Configurable Systems
  • 作者: Yulong Ye, Tao Chen, Miqing Li (University of Birmingham)
  • 分类: cs.SE (Software Engineering), cs.AI
  • 发表时间: 2025年1月1日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2501.00840

摘要

现代可配置系统为工程未来智能软件系统提供了巨大机遇。其中一个关键难题是如何有效地自适应运行系统的配置,使其在时变工作负载下优化性能(如运行时间和吞吐量)。现有方法要么忽略可用的历史知识,要么依赖静态的历史知识利用而不考虑信息的有用性,因此无法很好地解决这一问题。本文提出DLiSA框架来解决这一挑战性问题。DLiSA具有两个特性:首先支持终身规划,规划过程在系统生命周期内持续运行,允许动态利用累积知识进行快速适应;其次通过蒸馏知识播种来增强新工作负载的规划,动态净化知识,仅在必要时播种有用的历史配置,减少误导信息。广泛实验表明DLiSA显著优于最先进方法,性能提升高达229%,资源加速高达2.22倍。

研究背景与动机

问题定义

本研究要解决的核心问题是可配置系统在时变工作负载下的自适应配置优化问题。具体而言:

  1. 配置空间复杂性:现代软件系统(如数据库H2、文件压缩器KANZI等)具有大量可配置选项,形成指数级增长的配置空间
  2. 工作负载动态性:系统面临的工作负载随时间变化且不可预测,导致最优配置也随之改变
  3. 实时性要求:系统需要在有限预算约束下快速找到适应新工作负载的最优配置

重要性分析

这个问题的重要性体现在:

  • 实用价值:现代云计算、边缘计算等场景中,系统需要动态适应不同类型和规模的工作负载
  • 性能影响:配置选择直接影响系统关键性能指标(运行时间、吞吐量等)
  • 资源效率:合理的自适应策略可以显著提高资源利用效率

现有方法局限性

通过对现有方法的分析,作者识别出两大类方法的不足:

  1. 静态适应方法(如FEMOSAA):
    • 每次工作负载变化时从零开始搜索
    • 忽略历史优化经验,造成重复劳动
    • 浪费宝贵的历史信息
  2. 动态适应方法(如Seed-EA, D-SOGA, LiDOS):
    • 采用静态知识利用策略
    • 盲目使用最近工作负载的所有配置进行播种
    • 丢弃早期工作负载的有用信息
    • 无法区分有用和误导性配置

关键特征发现

通过对KANZI和H2等系统的实证分析,作者发现了可配置系统的关键特征:

不同工作负载间的顶级性能配置可能非常相似或非常不同,这取决于系统类型和具体工作负载

这一发现揭示了静态知识利用策略的根本缺陷,为动态知识蒸馏奠定了理论基础。

核心贡献

  1. 提出DLiSA框架:首个支持蒸馏终身自适应的可配置系统框架,结合终身规划和动态知识蒸馏
  2. 设计排序工作负载相似性分析:基于排序损失的相似性度量方法,用于判断何时进行知识播种
  3. 开发加权配置播种策略:动态提取最有用的历史配置,同时过滤误导信息
  4. 全面实验验证:在9个真实系统、93个测试案例上验证,性能提升高达2.29倍,效率提升高达2.22倍

方法详解

任务定义

输入

  • 可配置系统S,配置空间X = (x₁, x₂, ..., xₙ)
  • 时变工作负载序列W₁, W₂, ..., Wₜ
  • 预算约束Rₜ(每个时间步的最大配置评估次数)

输出

  • 每个时间步的最优配置x*,使得性能目标fₜ(x)最优

约束条件

  • 资源预算:rₜ ≤ Rₜ
  • 实时性要求:必须在工作负载变化时快速响应

模型架构

DLiSA采用MAPE-K(Monitor-Analyze-Plan-Execute-Knowledge)架构,核心包含两个专门化组件:

1. 知识蒸馏组件(Analyzer)

负责动态分析和提取有用的历史知识:

排序工作负载相似性分析

  • 计算相邻工作负载间的排序损失:
    L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))
    
  • 相似性得分:
    S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
    
  • 平均相似性:S_sav用于判断是否触发播种

加权配置播种

  • 局部阶段:选择每个工作负载的前50%最佳配置
  • 全局阶段:基于鲁棒性和时效性计算权重
    • 鲁棒性权重:w_(c,r) = O_c / H
    • 时效性权重:w_(c,t) = S_c / H
    • 总权重:w_c = w_(c,r) + w_(c,t)

2. 进化规划组件(Planner)

基于遗传算法进行配置优化:

  • 使用播种的配置作为初始种群
  • 通过交叉、变异操作进化出更好的配置
  • 在Cyber-Twin环境中评估配置性能

技术创新点

  1. 动态知识利用
    • 与静态方法不同,DLiSA根据工作负载相似性动态决定是否播种
    • 避免了盲目播种可能带来的负面影响
  2. 全历史知识挖掘
    • 不局限于最近工作负载,从所有历史工作负载中提取有用配置
    • 通过加权机制平衡配置的鲁棒性和时效性
  3. 终身学习范式
    • 规划过程持续运行,状态在不同工作负载间保持
    • 实现真正的动态优化而非静态重启

实验设置

数据集

实验使用9个不同领域的真实可配置系统:

系统语言性能指标配置选项数工作负载数
JUMP3RJava音频编码器运行时间166
KANZIJava文件压缩器运行时间249
H2Java数据库吞吐量168
XZC/C++文件压缩器运行时间3313
Z3C/C++SMT求解器运行时间1212

总计93个测试案例,涵盖不同编程语言、应用域和性能目标。

评价指标

  1. 有效性:Scott-Knott测试排名,最终性能值
  2. 效率:达到相同性能所需的配置评估次数,加速比s = b/m

对比方法

  • FEMOSAA:静态适应,每次从零开始搜索
  • Seed-EA:动态适应,播种最近工作负载的所有配置
  • D-SOGA:混合适应,80%历史+20%随机配置
  • LiDOS:动态适应,基于多目标非支配关系保留配置

实现细节

  • 种群大小:20
  • 预算约束:80次配置评估
  • 交叉率:0.9,变异率:0.1
  • 阈值参数:α = 0.3
  • 独立运行:100次,随机化工作负载顺序

实验结果

主要结果

DLiSA在有效性和效率两个维度都显著优于对比方法:

有效性结果

  • 在93个测试案例中,DLiSA在69个案例中排名第一(74%)
  • 相比之下,其他方法的最佳排名案例数:FEMOSAA (11),Seed-EA (33),D-SOGA (29),LiDOS (10)
  • 最大性能提升:2.29倍(KANZI系统W8工作负载)

效率结果

  • 与FEMOSAA相比:88个案例中DLiSA更高效,最大加速2.16倍
  • 与Seed-EA相比:57个案例中DLiSA更高效,最大加速2.22倍
  • 与D-SOGA相比:58个案例中DLiSA更高效,最大加速2.05倍
  • 与LiDOS相比:79个案例中DLiSA更高效,最大加速2.05倍

消融实验

设计两个变体验证各组件贡献:

  1. DLiSA-I:用随机播种替换加权配置播种
    • 结果:DLiSA在50个案例中获胜,43个平局,0个失败
    • 证明加权配置播种的有效性
  2. DLiSA-II:禁用工作负载相似性分析,随机触发播种
    • 结果:DLiSA在39个案例中获胜,53个平局,1个失败
    • 证明相似性分析的重要性

参数敏感性分析

对阈值参数α ∈ {0, 0.1, ..., 0.9}进行敏感性分析:

  • α = 0.3时性能最佳,在Scott-Knott测试中获得最多第一排名
  • α过小:过度播种,引入误导信息
  • α过大:播种不足,浪费历史知识
  • 较大α的性能退化比较小α更严重

实验发现

  1. 工作负载相似性的作用:相似性分析能有效识别播种的有利时机,避免在配置景观差异较大时进行有害播种
  2. 加权播种的效果:高权重配置通常在新工作负载下表现更好,验证了鲁棒性和时效性权重设计的合理性
  3. 系统特异性:不同系统表现出不同的工作负载相似性模式,如KANZI系统工作负载间重叠较多,而H2系统差异较大

相关工作

静态适应方法

传统方法如FEMOSAA主要关注单次优化问题,每次工作负载变化时重新开始搜索。这类方法简化了优化过程但忽略了宝贵的历史经验。

动态适应方法

PLATO、Seed-EA等方法支持连续规划和状态保持,但采用静态知识利用策略,无法根据工作负载特征动态调整播种策略。

控制理论方法

基于卡尔曼滤波、模型预测控制等的方法在自适应规划中显示出潜力,但面临复杂非线性系统动态建模的挑战。

性能学习方法

支持向量机、神经网络、集成学习等方法关注配置与性能的关系建模,与DLiSA的优化视角形成互补。

结论与讨论

主要结论

  1. DLiSA有效性:通过动态知识蒸馏,DLiSA在大多数测试案例中显著优于现有方法
  2. 效率提升显著:资源利用效率提升高达2.22倍,证明了历史知识重用的价值
  3. 组件贡献明确:消融实验验证了排序相似性分析和加权播种的独立贡献
  4. 参数设置合理:α = 0.3在平衡播种收益和误导风险方面表现最佳

局限性

  1. 参数调优:阈值α可能需要针对特定系统进行调优以获得最佳性能
  2. 系统范围:虽然涵盖9个系统,但扩展到更多系统类型可能需要进一步验证
  3. Cyber-Twin依赖:实验依赖现有基准测试作为Cyber-Twin,实际部署中可能需要更复杂的建模

未来方向

  1. 景观分析方法:开发更精细的配置景观分析技术以更好地处理工作负载演化
  2. 反馈机制:探索反馈机制以更精确地识别有益的规划信息
  3. 多目标扩展:将框架扩展到多目标优化场景
  4. 理论分析:提供更深入的理论分析以指导参数设置和系统设计

深度评价

优点

  1. 问题定义清晰:准确识别了现有方法在知识利用方面的根本缺陷
  2. 方法设计合理:排序相似性分析和加权播种策略设计巧妙,有坚实的理论基础
  3. 实验设计完善:涵盖多个系统、多种场景,统计验证充分
  4. 实用价值高:显著的性能和效率提升证明了方法的实际应用价值
  5. 写作清晰:论文结构合理,技术细节描述准确

不足

  1. 理论分析有限:缺乏对方法收敛性和最优性的理论保证
  2. 参数敏感性:α参数的选择可能需要针对不同系统类型进行调优
  3. 计算复杂度:未详细分析知识蒸馏过程的计算开销
  4. 长期行为:缺乏对系统长期运行行为的分析

影响力

  1. 学术贡献:为自适应系统领域提供了新的知识利用范式
  2. 实用价值:可直接应用于云计算、边缘计算等实际场景
  3. 可复现性:提供完整的代码和数据,支持结果复现
  4. 启发意义:为终身学习在系统优化中的应用提供了新思路

适用场景

  1. 云计算平台:动态工作负载环境下的系统配置优化
  2. 边缘计算:资源受限环境下的快速配置适应
  3. 数据库系统:面向不同查询模式的性能调优
  4. 分布式系统:多租户环境下的配置管理

参考文献

论文引用了76篇相关文献,涵盖自适应系统、搜索基软件工程、动态优化等多个领域的重要工作,为研究提供了坚实的理论基础和全面的对比分析。


总体评价:这是一篇高质量的软件工程研究论文,在可配置系统自适应优化这一重要问题上提出了创新性解决方案。方法设计合理,实验验证充分,实用价值显著。虽然在理论分析和长期行为研究方面还有改进空间,但整体贡献突出,对相关领域具有重要推动作用。