2025-11-24T03:31:17.533463

Distilled Lifelong Self-Adaptation for Configurable Systems

Ye, Chen, Li

Modern configurable systems provide tremendous opportunities for engineering future intelligent software systems. A key difficulty thereof is how to effectively self-adapt the configuration of a running system such that its performance (e.g., runtime and throughput) can be optimized under time-varying workloads. This unfortunately remains unaddressed in existing approaches as they either overlook the available past knowledge or rely on static exploitation of past knowledge without reasoning the usefulness of information when planning for self-adaptation. In this paper, we tackle this challenging problem by proposing DLiSA, a framework that self-adapts configurable systems. DLiSA comes with two properties: firstly, it supports lifelong planning, and thereby the planning process runs continuously throughout the lifetime of the system, allowing dynamic exploitation of the accumulated knowledge for rapid adaptation. Secondly, the planning for a newly emerged workload is boosted via distilled knowledge seeding, in which the knowledge is dynamically purified such that only useful past configurations are seeded when necessary, mitigating misleading information. Extensive experiments suggest that the proposed DLiSA significantly outperforms state-of-the-art approaches, demonstrating a performance improvement of up to 229% and a resource acceleration of up to 2.22x on generating promising adaptation configurations. All data and sources can be found at our repository: https://github.com/ideas-labo/dlisa.

academic

Destillierte lebenslange Selbstadaption für konfigurierbare Systeme

Grundinformationen

Papier-ID: 2501.00840
Titel: Distilled Lifelong Self-Adaptation for Configurable Systems
Autoren: Yulong Ye, Tao Chen, Miqing Li (University of Birmingham)
Klassifizierung: cs.SE (Softwaretechnik), cs.AI
Veröffentlichungsdatum: 1. Januar 2025 (arXiv-Preprint)
Papierlink: https://arxiv.org/abs/2501.00840

Zusammenfassung

Moderne konfigurierbare Systeme bieten enorme Chancen für die Entwicklung intelligenter Softwaresysteme der Zukunft. Eine Schlüsselherausforderung besteht darin, die Konfiguration laufender Systeme effektiv selbstanpassend zu optimieren, um die Leistung unter zeitvariablen Arbeitslasten zu verbessern (wie Laufzeit und Durchsatz). Bestehende Methoden ignorieren entweder verfügbares historisches Wissen oder verlassen sich auf statische Nutzung historischen Wissens ohne Berücksichtigung der Informationsnützlichkeit und können daher dieses Problem nicht angemessen lösen. Dieses Papier präsentiert das DLiSA-Framework zur Bewältigung dieser Herausforderung. DLiSA weist zwei charakteristische Merkmale auf: Erstens unterstützt es lebenslange Planung, wobei der Planungsprozess während des gesamten Systemlebenszyklus kontinuierlich läuft und die dynamische Nutzung kumulativen Wissens für schnelle Anpassung ermöglicht; zweitens verbessert es die Planung neuer Arbeitslasten durch destillierte Wissensinitialisierung, reinigt Wissen dynamisch und initialisiert nur bei Bedarf nützliche historische Konfigurationen, um irreführende Informationen zu reduzieren. Umfangreiche Experimente zeigen, dass DLiSA bestehende Methoden erheblich übertrifft, mit Leistungsverbesserungen von bis zu 229% und Ressourcenbeschleunigung von bis zu 2,22x.

Forschungshintergrund und Motivation

Problemdefinition

Das Kernproblem dieser Forschung ist die selbstanpassende Konfigurationsoptimierung konfigurierbarer Systeme unter zeitvariablen Arbeitslasten. Konkret:

Komplexität des Konfigurationsraums: Moderne Softwaresysteme (wie die Datenbank H2, der Dateikompressor KANZI usw.) verfügen über zahlreiche konfigurierbare Optionen, die einen exponentiell wachsenden Konfigurationsraum bilden
Dynamik der Arbeitslasten: Die vom System erlebten Arbeitslasten ändern sich zeitlich und sind unvorhersehbar, was dazu führt, dass sich auch die optimale Konfiguration ändert
Echtzeitanforderungen: Das System muss unter begrenzten Budgetbeschränkungen schnell die optimale Konfiguration für neue Arbeitslasten finden

Bedeutungsanalyse

Die Bedeutung dieses Problems zeigt sich in:

Praktischer Wert: In modernen Cloud-Computing-, Edge-Computing- und ähnlichen Szenarien müssen Systeme dynamisch verschiedene Arten und Größen von Arbeitslasten bewältigen
Leistungsauswirkungen: Die Konfigurationsauswahl beeinflusst direkt kritische Systemleistungsindikatoren (Laufzeit, Durchsatz usw.)
Ressourceneffizienz: Eine angemessene Selbstanpassungsstrategie kann die Ressourcennutzungseffizienz erheblich verbessern

Einschränkungen bestehender Methoden

Durch die Analyse bestehender Methoden identifizieren die Autoren Mängel in zwei Kategorien:

Statische Anpassungsmethoden (wie FEMOSAA):
- Beginnen bei jeder Arbeitslaständerung von vorne zu suchen
- Ignorieren historische Optimierungserfahrungen und verursachen wiederholte Arbeit
- Verschwenden wertvolle historische Informationen
Dynamische Anpassungsmethoden (wie Seed-EA, D-SOGA, LiDOS):
- Verwenden statische Wissensnutzungsstrategien
- Initialisieren blind alle Konfigurationen der neuesten Arbeitslast
- Verwerfen nützliche Informationen aus früheren Arbeitslasten
- Können nicht zwischen nützlichen und irreführenden Konfigurationen unterscheiden

Entdeckung kritischer Merkmale

Durch empirische Analyse von Systemen wie KANZI und H2 entdecken die Autoren kritische Merkmale konfigurierbarer Systeme:

Die Top-Leistungskonfigurationen zwischen verschiedenen Arbeitslasten können sich je nach Systemtyp und spezifischer Arbeitslast sehr ähneln oder sehr unterscheiden

Diese Entdeckung offenbart die grundlegenden Mängel statischer Wissensnutzungsstrategien und legt den theoretischen Grundstein für dynamische Wissensdestillation.

Kernbeiträge

Präsentation des DLiSA-Frameworks: Das erste Framework, das destillierte lebenslange Selbstadaption für konfigurierbare Systeme unterstützt und lebenslange Planung mit dynamischer Wissensdestillation kombiniert
Entwurf der Rangfolge-Arbeitslaständlichkeitsanalyse: Eine auf Rangloss basierende Ähnlichkeitsmessungsmethode zur Bestimmung, wann Wissensinitialisierung durchgeführt werden sollte
Entwicklung einer gewichteten Konfigurationsinitialisierungsstrategie: Dynamische Extraktion der nützlichsten historischen Konfigurationen bei gleichzeitiger Filterung irreführender Informationen
Umfassende experimentelle Validierung: Validierung auf 9 realen Systemen und 93 Testfällen mit Leistungsverbesserungen von bis zu 2,29x und Effizienzsteigerungen von bis zu 2,22x

Methodische Erklärung

Aufgabendefinition

Eingabe:

Konfigurierbares System S, Konfigurationsraum X = (x₁, x₂, ..., xₙ)
Zeitvariable Arbeitslastreihe W₁, W₂, ..., Wₜ
Budgetbeschränkung Rₜ (maximale Anzahl von Konfigurationsbewertungen pro Zeitschritt)

Ausgabe:

Optimale Konfiguration x* für jeden Zeitschritt, die das Leistungsziel fₜ(x) optimiert

Einschränkungen:

Ressourcenbudget: rₜ ≤ Rₜ
Echtzeitanforderung: Schnelle Reaktion bei Arbeitslaständerungen erforderlich

Modellarchitektur

DLiSA verwendet die MAPE-K-Architektur (Monitor-Analyze-Plan-Execute-Knowledge) mit zwei spezialisierten Komponenten:

1. Wissensdestillationskomponente (Analyzer)

Verantwortlich für dynamische Analyse und Extraktion nützlichen historischen Wissens:

Rangfolge-Arbeitslaständlichkeitsanalyse:

Berechnung des Ranglosts zwischen benachbarten Arbeitslasten:

L(D^(t+1)_t) = ∑∑ 1((f_t(x_j) < f_t(x_k)) ⊕ (f_(t+1)(x_j) < f_(t+1)(x_k)))

Ähnlichkeitswert:
```
S^(t+1)_t = 1 - L(D^(t+1)_t) / N_pairs
```
Durchschnittliche Ähnlichkeit: S_sav zur Bestimmung, ob Initialisierung ausgelöst wird

Gewichtete Konfigurationsinitialisierung:

Lokale Phase: Auswahl der besten 50% Konfigurationen jeder Arbeitslast
Globale Phase: Gewichtsberechnung basierend auf Robustheit und Aktualität
- Robustheitsgewicht: w_(c,r) = O_c / H
- Aktualitätsgewicht: w_(c,t) = S_c / H
- Gesamtgewicht: w_c = w_(c,r) + w_(c,t)

2. Evolutionäre Planungskomponente (Planner)

Konfigurationsoptimierung basierend auf genetischen Algorithmen:

Verwendung initialisierter Konfigurationen als Ausgangspopulation
Entwicklung besserer Konfigurationen durch Kreuzungs- und Mutationsoperationen
Bewertung der Konfigurationsleistung in einer Cyber-Twin-Umgebung

Technische Innovationen

Dynamische Wissensnutzung:
- Im Gegensatz zu statischen Methoden entscheidet DLiSA dynamisch basierend auf Arbeitslaständlichkeit, ob Initialisierung durchgeführt werden soll
- Vermeidung negativer Auswirkungen blinder Initialisierung
Abbau des gesamten historischen Wissens:
- Nicht beschränkt auf neueste Arbeitslasten, Extraktion nützlicher Konfigurationen aus allen historischen Arbeitslasten
- Ausgleich der Robustheit und Aktualität von Konfigurationen durch Gewichtungsmechanismus
Paradigma des lebenslangen Lernens:
- Der Planungsprozess läuft kontinuierlich, Zustand bleibt über verschiedene Arbeitslasten hinweg erhalten
- Realisierung echter dynamischer Optimierung statt statischen Neustarts

Experimentelle Einrichtung

Datensatz

Experimente verwenden 9 reale konfigurierbare Systeme aus verschiedenen Bereichen:

System	Sprache	Bereich	Leistungsmetrik	Konfigurationsoptionen	Arbeitslasten
JUMP3R	Java	Audio-Encoder	Laufzeit	16	6
KANZI	Java	Dateikompressor	Laufzeit	24	9
H2	Java	Datenbank	Durchsatz	16	8
XZ	C/C++	Dateikompressor	Laufzeit	33	13
Z3	C/C++	SMT-Solver	Laufzeit	12	12

Insgesamt 93 Testfälle, die verschiedene Programmiersprachen, Anwendungsbereiche und Leistungsziele abdecken.

Bewertungsmetriken

Effektivität: Scott-Knott-Testrankings, endgültige Leistungswerte
Effizienz: Anzahl der Konfigurationsbewertungen zur Erreichung gleicher Leistung, Beschleunigungsverhältnis s = b/m

Vergleichsmethoden

FEMOSAA: Statische Anpassung, Neustart bei jeder Arbeitslaständerung
Seed-EA: Dynamische Anpassung, Initialisierung aller Konfigurationen der neuesten Arbeitslast
D-SOGA: Hybride Anpassung, 80% historisch + 20% zufällige Konfigurationen
LiDOS: Dynamische Anpassung, Beibehaltung von Konfigurationen basierend auf multiobjektiver Nichtdominiertheit

Implementierungsdetails

Populationsgröße: 20
Budgetbeschränkung: 80 Konfigurationsbewertungen
Kreuzungsrate: 0,9, Mutationsrate: 0,1
Schwellenwertparameter: α = 0,3
Unabhängige Läufe: 100, randomisierte Arbeitslastreihenfolge

Experimentelle Ergebnisse

Hauptergebnisse

DLiSA übertrifft Vergleichsmethoden erheblich in beiden Dimensionen Effektivität und Effizienz:

Effektivitätsergebnisse:

In 93 Testfällen rangiert DLiSA in 69 Fällen an erster Stelle (74%)
Im Vergleich dazu die besten Rangplatzierungen anderer Methoden: FEMOSAA (11), Seed-EA (33), D-SOGA (29), LiDOS (10)
Maximale Leistungsverbesserung: 2,29x (KANZI-System, W8-Arbeitslast)

Effizienzergebnisse:

Gegenüber FEMOSAA: DLiSA effizienter in 88 Fällen, maximale Beschleunigung 2,16x
Gegenüber Seed-EA: DLiSA effizienter in 57 Fällen, maximale Beschleunigung 2,22x
Gegenüber D-SOGA: DLiSA effizienter in 58 Fällen, maximale Beschleunigung 2,05x
Gegenüber LiDOS: DLiSA effizienter in 79 Fällen, maximale Beschleunigung 2,05x

Ablationsstudien

Zwei Varianten wurden entworfen, um die Komponentenbeiträge zu überprüfen:

DLiSA-I: Ersetzung der gewichteten Konfigurationsinitialisierung durch zufällige Initialisierung
- Ergebnis: DLiSA gewinnt in 50 Fällen, 43 Unentschieden, 0 Niederlagen
- Bestätigung der Effektivität der gewichteten Konfigurationsinitialisierung
DLiSA-II: Deaktivierung der Arbeitslaständlichkeitsanalyse, zufällige Auslösung der Initialisierung
- Ergebnis: DLiSA gewinnt in 39 Fällen, 53 Unentschieden, 1 Niederlage
- Bestätigung der Wichtigkeit der Ähnlichkeitsanalyse

Parametersensitivitätsanalyse

Sensitivitätsanalyse des Schwellenwertparameters α ∈ {0, 0,1, ..., 0,9}:

α = 0,3 zeigt beste Leistung, erhält die meisten ersten Platzierungen im Scott-Knott-Test
Zu kleines α: Übermäßige Initialisierung, Einführung irreführender Informationen
Zu großes α: Unzureichende Initialisierung, Verschwendung historischen Wissens
Leistungsabbau bei größerem α ist schwerwiegender als bei kleinerem α

Experimentelle Erkenntnisse

Rolle der Arbeitslaständlichkeit: Die Ähnlichkeitsanalyse kann effektiv günstige Zeitpunkte für Initialisierung identifizieren und schädliche Initialisierung bei großen Unterschieden in der Konfigurationslandschaft vermeiden
Effekt der gewichteten Initialisierung: Hochgewichtete Konfigurationen zeigen typischerweise bessere Leistung bei neuen Arbeitslasten, was die Rationalität des Robustheits- und Aktualitätsgewichtsentwurfs bestätigt
Systemspezifität: Verschiedene Systeme zeigen unterschiedliche Arbeitslaständlichkeitsmuster, wie z.B. größere Überlappung zwischen KANZI-Arbeitslasten, während H2-Systeme größere Unterschiede aufweisen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

DLiSA-Effektivität: Durch dynamische Wissensdestillation übertrifft DLiSA bestehende Methoden in den meisten Testfällen erheblich
Signifikante Effizienzverbesserung: Ressourcennutzungseffizienz verbessert sich um bis zu 2,22x, was den Wert der Wiederverwendung historischen Wissens beweist
Klare Komponentenbeiträge: Ablationsstudien bestätigen die unabhängigen Beiträge der Rangfolge-Ähnlichkeitsanalyse und gewichteten Initialisierung
Angemessene Parametereinstellung: α = 0,3 zeigt beste Leistung beim Ausgleich von Initialisierungsgewinnen und Irreführungsrisiken

Einschränkungen

Parameteroptimierung: Der Schwellenwert α kann für spezifische Systeme optimiert werden, um optimale Leistung zu erreichen
Systembereich: Obwohl 9 Systeme abgedeckt werden, kann die Erweiterung auf mehr Systemtypen weitere Validierung erfordern
Cyber-Twin-Abhängigkeit: Experimente verlassen sich auf vorhandene Benchmarks als Cyber-Twin; praktische Bereitstellung könnte komplexere Modellierung erfordern

Zukünftige Richtungen

Landschaftsanalysemethoden: Entwicklung verfeinerterer Konfigurationslandschaftsanalyseverfahren zur besseren Behandlung von Arbeitslaststevolution
Rückkopplungsmechanismen: Erforschung von Rückkopplungsmechanismen zur präziseren Identifikation vorteilhafter Planungsinformationen
Multiobjektive Erweiterung: Erweiterung des Frameworks auf multiobjektive Optimierungsszenarien
Theoretische Analyse: Bereitstellung tieferer theoretischer Analyse zur Anleitung von Parametereinstellung und Systementwurf

Tiefgreifende Bewertung

Stärken

Klare Problemdefinition: Genaue Identifikation grundlegender Mängel bestehender Methoden in der Wissensnutzung
Angemessener Methodenentwurf: Rangfolge-Ähnlichkeitsanalyse und gewichtete Initialisierungsstrategie sind sorgfältig entworfen mit solider theoretischer Grundlage
Umfassende experimentelle Gestaltung: Abdeckung mehrerer Systeme und Szenarien mit ausreichender statistischer Validierung
Hoher praktischer Wert: Signifikante Leistungs- und Effizienzverbesserungen beweisen praktische Anwendbarkeit der Methode
Klare Schreibweise: Angemessene Papierstruktur mit präziser Beschreibung technischer Details

Mängel

Begrenzte theoretische Analyse: Fehlende theoretische Garantien für Konvergenz und Optimalität der Methode
Parametersensitivität: Die Auswahl des Parameters α kann für verschiedene Systemtypen Optimierung erfordern
Rechenkomplexität: Fehlende detaillierte Analyse der Rechenkomplexität des Wissensdestillationsprozesses
Langzeitverhalten: Fehlende Analyse des Systemverhaltens bei langfristiger Ausführung

Einflussfähigkeit

Akademischer Beitrag: Bietet neues Wissensnutzungsparadigma für das Feld adaptiver Systeme
Praktischer Wert: Direkt anwendbar auf Cloud-Computing-, Edge-Computing- und ähnliche praktische Szenarien
Reproduzierbarkeit: Bereitstellung vollständiger Codes und Daten zur Unterstützung der Ergebnisreproduzierbarkeit
Inspirationswert: Bietet neue Perspektiven für die Anwendung lebenslangen Lernens in der Systemoptimierung

Anwendungsszenarien

Cloud-Computing-Plattformen: Systemkonfigurationsoptimierung in dynamischen Arbeitslasten
Edge-Computing: Schnelle Konfigurationsanpassung in ressourcenbeschränkten Umgebungen
Datenbanksysteme: Leistungsoptimierung für verschiedene Abfragemuster
Verteilte Systeme: Konfigurationsmanagement in Multi-Tenant-Umgebungen

Literaturverzeichnis

Das Papier zitiert 76 verwandte Arbeiten, die adaptive Systeme, suchbasierte Softwaretechnik, dynamische Optimierung und andere Bereiche abdecken und eine solide theoretische Grundlage und umfassende Vergleichsanalyse für die Forschung bieten.

Gesamtbewertung: Dies ist ein hochqualitatives Softwaretechnik-Forschungspapier, das eine innovative Lösung für das wichtige Problem der adaptiven Optimierung konfigurierbarer Systeme präsentiert. Der Methodenentwurf ist angemessen, die experimentelle Validierung umfassend und der praktische Wert erheblich. Obwohl es Raum für Verbesserungen in theoretischer Analyse und Langzeitverhaltensstudien gibt, sind die Gesamtbeiträge hervorragend und haben wichtige Auswirkungen auf verwandte Bereiche.