In this work, we propose a meta-learning-based Koopman modeling and predictive control approach for nonlinear systems with parametric uncertainties. An adaptive deep meta-learning-based modeling approach, called Meta Adaptive Koopman Operator (MAKO), is proposed. Without knowledge of the parametric uncertainty, the proposed MAKO approach can learn a meta-model from a multi-modal dataset and efficiently adapt to new systems with previously unseen parameter settings by using online data. Based on the learned meta Koopman model, a predictive control scheme is developed, and the stability of the closed-loop system is ensured even in the presence of previously unseen parameter settings. Through extensive simulations, our proposed approach demonstrates superior performance in both modeling accuracy and control efficacy as compared to competitive baselines.
- Paper-ID: 2510.09042
- Titel: MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems
- Autoren: Minghao Han, Kiwan Wong, Adrian Wing-Keung Law, Xunyuan Yin
- Klassifizierung: eess.SY cs.LG cs.SY
- Veröffentlichungszeitpunkt: Oktober 2025 (arXiv-Preprint)
- Paper-Link: https://arxiv.org/abs/2510.09042
In diesem Artikel wird eine auf Meta-Learning basierende Koopman-Modellierung und prädiktive Regelungsmethode für nichtlineare Systeme mit Parameterunsicherheit vorgestellt. Es wird eine adaptive tiefe Meta-Learning-Modellierungsmethode – Meta-Adaptive Koopman Operatoren (MAKO) – vorgeschlagen. Ohne Kenntnis der Parameterunsicherheit kann die MAKO-Methode aus multimodalen Datensätzen ein Meta-Modell lernen und sich durch Online-Daten effizient an neue Systeme mit zuvor ungesehenen Parametereinstellungen anpassen. Basierend auf dem gelernten Meta-Koopman-Modell wird ein prädiktives Regelungsschema entwickelt, das die Stabilität des geschlossenen Regelkreises auch bei zuvor ungesehenen Parametereinstellungen gewährleistet.
- Problemdefinition: Parameterunsicherheit ist in nichtlinearen Systemen weit verbreitet und wird normalerweise durch Lastveränderungen und Betriebsbedingungen verursacht. Diese Unsicherheiten führen zu Leistungsabfall und Instabilität und stellen große Herausforderungen für die Regelungssystemauslegung dar.
- Problemrelevanz: Traditionelle adaptive modellprädiktive Regelungsmethoden (AMPC) zeigen begrenzte Ergebnisse bei nichtlinearen Systemen und erfordern normalerweise First-Principles-Modelle als Grundlage für die Regelungssystemauslegung. Theoretische Annahmen setzen lineare Abhängigkeit von unsicheren Parametern voraus, was die Anwendbarkeit auf allgemeine nichtlineare Prozesse einschränkt.
- Limitierungen bestehender Methoden:
- Bestehende Koopman-Operator-Methoden konzentrieren sich hauptsächlich auf spezifische Regelungsaufgaben mit festen Modellparametern
- Online-Anpassung basierend auf tiefen neuronalen Netzen ist ineffizient und rechnerisch aufwändig
- Meta-Reinforcement-Learning-Methoden können keine Stabilitätsgarantien und Garantien für die Regelungsleistung im geschlossenen Kreis bieten
- Forschungsmotivation: Kombination von Meta-Learning mit Koopman-Operator-Theorie zur Schaffung eines lerngestützten adaptiven Regelungsrahmens für parametrisch unsichere nichtlineare Systeme.
- Erstmalige Integration: Erstmalige Integration von Meta-Learning und Koopman-Operator-Theorie, Etablierung eines lerngestützten adaptiven MPC-Rahmens für allgemeine Klassen parametrisch unsicherer nichtlinearer Systeme
- Theoretische Garantien: Strenger Nachweis der Konvergenz der Modellanpassung und des geschlossenen Regelkreises
- Leistungsverifikation: Basierend auf Benchmarksystemen aus drei verschiedenen Bereichen zeigt MAKO gute Modellierungsgenauigkeit und robuste Verfolgungsregelungsleistung bei Vorhandensein von Parameterunsicherheit, überlegen gegenüber konkurrierenden Baseline-Methoden
Betrachten Sie ein nichtlineares System mit Parameterunsicherheit:
xk+1=f(xk,uk,Θ),Θ∼p(Θ)
Wobei:
- xk∈X⊂Rn: Systemzustand
- uk∈U⊂Rm: Regelungseingang
- Θ∈Ξ⊂Rl: Systemparameter, verteilt nach unbekannter Verteilung p(Θ)
Das MNN parametrisiert die Beobachtungsfunktion und wird über verschiedene Aufgabeneinstellungen hinweg gemeinsam genutzt:
gki=ψθ(xki),xki∈Di
Wobei ψθ(⋅) ein mehrschichtiges neuronales Netz ist und θ trainierbare Parameter sind.
Im kodierten Beobachtungsraum wird für jede Aufgabeneinstellung Θi ein Satz von Koopman-Operatoren Ai,Bi,Ci gelernt:
gk+1∣ki=Aigk∣ki+Biukix^k+1∣ki=Cigk+1∣ki
Das Optimierungsproblem wird formuliert als:
minθ,{Ai,Bi,Ci}NTH1∑i=1N∑k=1T∑t=1H∥xk+ti−Cigk+t∣ki∥22
Unter den Nebenbedingungen:
- gk+t∣ki=Aigk+t−1∣ki+Biuk+t−1i
- gk∣ki=ψθ(xki)
Initialisierung: A^0,B^0,C^0={N1∑Ai,N1∑Bi,N1∑Ci}
Gradientenberechnung:
∇Ψ^Jk=−Xkg~k+1T∇C^Jk=−gk+1x~k+1T
Aktualisierungsgesetz:
Ψ^k+1=Ψ^k+λkg~k+1XkTC^k+1=C^k+λkx~k+1gk+1T
Wobei die adaptive Lernrate:
λk=min(XkTXk2−α,gk+1Tgk+12−α)
Unter Berücksichtigung von Modellierungsfehlern wird ideales Rauschen eingeführt:
wk∗,vk∗=minwk∈W,vk∈VJˉ(Ψ^k,C^k,wk,vk)
Robustes Aktualisierungsgesetz:
Ψ^k+1=Ψ^k+λk(g~k+1−wk∗)XkTC^k+1=C^k+λk(x~k+1−vk∗)gk+1T
- Gemeinsames Repräsentationslernen: Lernen von gemeinsamen Beobachtungsraumdarstellungen über Aufgaben hinweg durch MNN
- Aufgabenspezifische Dynamik: Lernen aufgabenspezifischer Koopman-Operatoren
- Adaptive Lernrate: Dynamische Lernratenanpassung basierend auf Dateneigenschaften
- Theoretische Garantien: Strenge theoretische Analyse von Konvergenz und Stabilität
Experimente werden auf drei Benchmarksystemen durchgeführt:
- Cart-Pole-System:
- Zustand: [x,x˙,θ,θ˙]T
- Unsichere Parameter: Stablänge lp∈[0,1m,1,0m], Stabmasse mp∈[0,01kg,0,2kg]
- Regelungseingang: u∈[−20,20]
- Genregulationsnetzwerk (GRN):
- Zustand: [m1,m2,m3,p1,p2,p3]T (mRNA- und Proteinkonzentrationen)
- Unsichere Parameter: Dissoziationskonstante K∈[2,8], Eingangsskalar b1∈[3,7]
- Reaktor-Separator-Chemieprozess:
- Zustand: 9-dimensional (Massenanteile und Temperatur)
- Unsichere Parameter: Einspeisungstemperatur T10,T20∈[150K,450K]
- Kumulativer Vorhersagefehler (16-Schritt-Vorhersage)
- L2-Norm des Verfolgungsfehlers
- Kumulierte Kosten der Regelungsleistung
- DeSKO (Deep Stochastic Koopman Operator): Konkurrierendes Baseline-Verfahren, trainiert unter nominalen Parametereinstellungen
- Beobachtungsdimension: 128-256
- Trajektorienlänge: 250-500
- Batch-Größe: 128
- Lernrate: 10−4
- Vorhersagehorizont: 16 Schritte
- Netzwerkstruktur: (128,128), ReLU-Aktivierungsfunktion
- MAKO zeigt gute Modellierungsleistung auf allen drei Systemen
- Durchschnittlicher Fehler der 16-Schritt-Vorhersage kleiner als 10−2
- Überlegen gegenüber DeSKO auf Cartpole- und Chemieprozesssystemen
- Leicht unterlegen gegenüber DeSKO auf GRN-System, aber immer noch gute Leistung
- Cartpole-System: MAKO erreicht stabile Regelung mit niedrigeren kumulierten Kosten als DeSKO
- GRN-System: DeSKO erreicht nur bei 3 Parametereinstellungen genaue Verfolgung, MAKO zeigt stabilere Leistung
- Chemieprozess: DeSKO kann bei keiner Parametereinstellung den Verfolgungsfehler stabil halten, MAKO erreicht erfolgreich das Regelungsziel
- MAKO-Robust-Framework benötigt durchschnittlich 0,0203 Sekunden Rechenzeit pro Zeitschritt auf Cartpole-System
- Geeignet für Echtzeit-Regelungsanwendungen
Vergleich zwischen nominaler Anpassung (MAKO) und robuster Anpassung (MAKO-robust):
- MAKO-robust zeigt schnelleres und stabileres Übergangverhalten
- Erreicht vergleichbare oder kleinere stationäre Verfolgungsfehler
- Verallgemeinerungsfähigkeit: MAKO kann sich an Parametereinstellungen anpassen, die während des Trainings nicht angetroffen wurden
- Robustheit: Behält gute Leistung bei Vorhandensein von Parameterunsicherheit
- Adaptivität: Schnelle Anpassung an neue Aufgaben durch Online-Daten
- Adaptive modellprädiktive Regelung: Traditionelle AMPC-Methoden zeigen begrenzte Ergebnisse bei nichtlinearen Systemen
- Koopman-Operator-Theorie: In den letzten Jahren Aufmerksamkeit bei der linearen Darstellung komplexer nichtlinearer Prozesse
- Meta-Learning in der Regelungstechnik: Entwicklung von MAML-, Meta-Reinforcement-Learning- und anderen Methoden
- Erstmalige Kombination von Meta-Learning und Koopman-Operatoren
- Bereitstellung theoretischer Konvergenzgarantien
- Anwendbarkeit auf allgemeine Klassen nichtlinearer Systeme
- Höhere Recheneffizienz als Online-Anpassung mit tiefen neuronalen Netzen
Satz 1 (Nominale Anpassung): Unter Annahmen 1-3 konvergiert der Vorhersagezustandsfehler x~ asymptotisch gegen Null mit den Aktualisierungsgesetzen (9) und (10), während die Parameterapproximationsfehler Ψ~k und C~k letztendlich begrenzt sind.
Satz 2 (Robuste Anpassung): Unter Annahmen 1 und 2 sind die Parameterapproximationsfehler Ψ~k, C~k letztendlich begrenzt mit den Aktualisierungsgesetzen (10), (15) und (16), und limk→∞∥x~k∥≤ϵv.
Satz 3: Betrachten Sie das nichtlineare System (1) mit Aktualisierungsgesetzen (9) und (10) sowie MPC-Regler (19). Unter Annahmen 1-3 ist der Verfolgungsfehler des geschlossenen Regelkreises asymptotisch stabil.
- Erfolgreiche Integration von Meta-Learning und Koopman-Operator-Theorie zur Schaffung eines adaptiven Regelungsrahmens für parametrisch unsichere nichtlineare Systeme
- Bereitstellung strenger theoretischer Konvergenz- und Stabilitätsgarantien
- Verifikation der Wirksamkeit und Überlegenheit der Methode auf mehreren Benchmarksystemen
- Theoretische Annahmen: Annahme 3 erfordert die Existenz eines endlich-dimensionalen invarianten Unterraums, was für allgemeine nichtlineare Systeme schwer zu garantieren ist
- Leistungsgrenzen: Fehlende strenge Grenzwertanalyse für Verallgemeinerung und Leistung des Meta-Training-Koopman-Modells
- Praktische Anwendung: Nur in Simulationen verifiziert, fehlende Verifikation an realen Systemen
- Anwendung der Methode auf reale Systeme mit Parameterunsicherheit
- Formale Analyse der Anforderungen an kontinuierliche Anregung (PE)
- Systematische Untersuchung der Beziehung zwischen Trajektorienlänge und Qualität des Meta-Learning-Koopman-Operators
- Erweiterung auf hochdimensionale Systeme
- Hohe Innovativität: Erstmalige Kombination von Meta-Learning und Koopman-Operatoren bietet neue Perspektiven für die Regelung parametrisch unsicherer Systeme
- Theoretische Vollständigkeit: Vollständige Konvergenz- und Stabilitätsanalyse
- Umfassende Experimente: Umfassende Evaluierung auf Benchmarksystemen aus drei verschiedenen Bereichen
- Praktischer Wert: Hohe Recheneffizienz, geeignet für Echtzeit-Regelungsanwendungen
- Annahmebeschränkungen: Theoretische Analyse beruht auf relativ starken Annahmebedingungen, die reale Systeme möglicherweise nicht erfüllen
- Begrenzte Baselines: Nur Vergleich mit DeSKO, fehlende Vergleiche mit anderen fortgeschrittenen Methoden
- Fehlende praktische Verifikation: Keine Verifikation der Methodenwirksamkeit an realen Systemen
- Skalierbarkeit auf hohe Dimensionen: Anwendbarkeit auf hochdimensionale Systeme bedarf weiterer Forschung
- Akademischer Beitrag: Bietet neuen theoretischen Rahmen und Methoden für die lerngestützte Regelungstheorie
- Anwendungsperspektiven: Breite Anwendungsperspektiven in Robotik, Chemieprozessregelung und anderen Bereichen
- Reproduzierbarkeit: Autoren stellen Code-Links bereit, was die Reproduzierbarkeit von Ergebnissen erleichtert
- Parametrisch unsichere nichtlineare Systeme: Wie Robotersysteme, Chemieprozesse, biologische Systeme
- Regelungsaufgaben mit schneller Anpassung erforderlich: Lastveränderungen, Umgebungsveränderungen und ähnliche Szenarien
- Echtzeit-Regelungsanwendungen: Szenarien mit hohen Anforderungen an Recheneffizienz
Der Artikel zitiert 41 relevante Literaturquellen, die wichtige Arbeiten aus mehreren Bereichen wie adaptive Regelung, Koopman-Operator-Theorie, Meta-Learning und modellprädiktive Regelung abdecken und eine solide theoretische Grundlage für die Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives akademisches Papier, das sich in theoretischer Innovation, Methodendesign und experimenteller Verifikation auszeichnet. Die Kombination von Meta-Learning und Koopman-Operator-Theorie bietet neue Lösungsansätze für das Regelungsproblem parametrisch unsicherer nichtlinearer Systeme und hat wichtigen akademischen Wert und Anwendungspotenzial. Trotz einiger Einschränkungen bei theoretischen Annahmen und praktischer Verifikation ist dies insgesamt eine bemerkenswerte Forschungsarbeit, die Aufmerksamkeit verdient.