In this work, we propose a meta-learning-based Koopman modeling and predictive control approach for nonlinear systems with parametric uncertainties. An adaptive deep meta-learning-based modeling approach, called Meta Adaptive Koopman Operator (MAKO), is proposed. Without knowledge of the parametric uncertainty, the proposed MAKO approach can learn a meta-model from a multi-modal dataset and efficiently adapt to new systems with previously unseen parameter settings by using online data. Based on the learned meta Koopman model, a predictive control scheme is developed, and the stability of the closed-loop system is ensured even in the presence of previously unseen parameter settings. Through extensive simulations, our proposed approach demonstrates superior performance in both modeling accuracy and control efficacy as compared to competitive baselines.
- ID Articolo: 2510.09042
- Titolo: MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems
- Autori: Minghao Han, Kiwan Wong, Adrian Wing-Keung Law, Xunyuan Yin
- Classificazione: eess.SY cs.LG cs.SY
- Data di Pubblicazione: Ottobre 2025 (preprint arXiv)
- Link Articolo: https://arxiv.org/abs/2510.09042
Questo articolo propone un metodo di modellazione di Koopman basato su meta-apprendimento e controllo predittivo per affrontare sistemi nonlineari con incertezze parametriche. Viene proposto un metodo di modellazione meta-apprendimento profondo adattivo—Operatori di Koopman Meta-Adattivi (MAKO). Senza conoscenza delle incertezze parametriche, il metodo MAKO può apprendere un meta-modello da insiemi di dati multimodali e adattarsi in modo efficiente online a nuovi sistemi con configurazioni parametriche precedentemente non osservate. Basato sul meta-modello di Koopman appreso, viene sviluppato uno schema di controllo predittivo che garantisce la stabilità del sistema in anello chiuso anche in presenza di configurazioni parametriche precedentemente non osservate.
- Definizione del Problema: L'incertezza parametrica è comune nei sistemi nonlineari, generalmente causata da variazioni di carico e condizioni operative. Queste incertezze causano degradazione delle prestazioni e instabilità, rappresentando una sfida significativa per la progettazione di sistemi di controllo.
- Importanza del Problema: I metodi tradizionali di controllo predittivo adattivo (AMPC) hanno risultati limitati su sistemi nonlineari, richiedono tipicamente modelli da principi primi come base per la progettazione del sistema di controllo, e teoricamente assumono dipendenza lineare dai parametri incerti, limitando l'applicabilità a processi nonlineari generali.
- Limitazioni dei Metodi Esistenti:
- I metodi attuali degli operatori di Koopman si concentrano principalmente su compiti di controllo specifici con parametri di modello fissi
- L'adattamento online basato su reti neurali profonde è inefficiente e computazionalmente intensivo
- I metodi di meta-apprendimento per rinforzo difficilmente forniscono garanzie di stabilità e prestazioni in anello chiuso
- Motivazione della Ricerca: Combinare meta-apprendimento e teoria degli operatori di Koopman per creare un framework di controllo adattivo basato su apprendimento per sistemi nonlineari con incertezze parametriche.
- Prima Integrazione: Prima integrazione di meta-apprendimento e teoria degli operatori di Koopman, stabilendo un framework di MPC adattivo basato su apprendimento applicabile a sistemi nonlineari con incertezze parametriche di classe generale
- Garanzie Teoriche: Dimostrazione rigorosa della convergenza dell'adattamento online del modello e del sistema in anello chiuso
- Verifica delle Prestazioni: Su tre sistemi di riferimento di domini diversi, MAKO dimostra accuratezza di modellazione e prestazioni di controllo di tracciamento robusto superiori ai metodi di base competitivi in presenza di incertezze parametriche
Considerare un sistema nonlineare con incertezze parametriche:
xk+1=f(xk,uk,Θ),Θ∼p(Θ)
dove:
- xk∈X⊂Rn: stato del sistema
- uk∈U⊂Rm: ingresso di controllo
- Θ∈Ξ⊂Rl: parametri del sistema, distribuiti secondo la distribuzione sconosciuta p(Θ)
La MNN è responsabile della parametrizzazione della funzione osservabile, condivisa tra diverse configurazioni di compiti:
gki=ψθ(xki),xki∈Di
dove ψθ(⋅) è una rete neurale multistrato e θ sono i parametri addestrabili.
Nello spazio osservabile codificato, viene appreso un insieme di operatori di Koopman Ai,Bi,Ci per ogni configurazione di compito Θi:
gk+1∣ki=Aigk∣ki+Biukix^k+1∣ki=Cigk+1∣ki
Il problema di ottimizzazione è formulato come:
minθ,{Ai,Bi,Ci}NTH1∑i=1N∑k=1T∑t=1H∥xk+ti−Cigk+t∣ki∥22
Soggetto ai vincoli:
- gk+t∣ki=Aigk+t−1∣ki+Biuk+t−1i
- gk∣ki=ψθ(xki)
Inizializzazione: A^0,B^0,C^0={N1∑Ai,N1∑Bi,N1∑Ci}
Calcolo del gradiente:
∇Ψ^Jk=−Xkg~k+1T∇C^Jk=−gk+1x~k+1T
Legge di aggiornamento:
Ψ^k+1=Ψ^k+λkg~k+1XkTC^k+1=C^k+λkx~k+1gk+1T
dove il tasso di apprendimento adattivo:
λk=min(XkTXk2−α,gk+1Tgk+12−α)
Considerando il caso di errore di modellazione, viene introdotto il rumore ideale:
wk∗,vk∗=minwk∈W,vk∈VJˉ(Ψ^k,C^k,wk,vk)
Legge di aggiornamento robusto:
Ψ^k+1=Ψ^k+λk(g~k+1−wk∗)XkTC^k+1=C^k+λk(x~k+1−vk∗)gk+1T
- Apprendimento di Rappresentazione Condivisa: Apprendimento tramite MNN di rappresentazioni osservabili condivise tra compiti
- Dinamica Specifica del Compito: Apprendimento di operatori di Koopman specifici per ogni compito
- Tasso di Apprendimento Adattivo: Regolazione dinamica del tasso di apprendimento basata sulle caratteristiche dei dati
- Garanzie Teoriche: Analisi teorica rigorosa della convergenza e della stabilità
Gli esperimenti vengono condotti su tre sistemi di riferimento:
- Sistema Cart-pole:
- Stato: [x,x˙,θ,θ˙]T
- Parametri incerti: lunghezza dell'asta lp∈[0.1m,1.0m], massa dell'asta mp∈[0.01kg,0.2kg]
- Ingresso di controllo: u∈[−20,20]
- Rete di Regolazione Genica (GRN):
- Stato: [m1,m2,m3,p1,p2,p3]T (concentrazioni di mRNA e proteine)
- Parametri incerti: costante di dissociazione K∈[2,8], scalare di ingresso b1∈[3,7]
- Processo Chimico Reattore-Separatore:
- Stato: 9-dimensionale (frazioni di massa e temperatura)
- Parametri incerti: temperatura di alimentazione T10,T20∈[150K,450K]
- Errore di previsione cumulativo (previsione a 16 passi)
- Norma L2 dell'errore di tracciamento
- Costo cumulativo delle prestazioni di controllo
- DeSKO (Deep Stochastic Koopman Operator): linea di base competitiva addestrata su configurazioni parametriche nominali
- Dimensione osservabile: 128-256
- Lunghezza della traiettoria: 250-500
- Dimensione del batch: 128
- Tasso di apprendimento: 10−4
- Orizzonte di previsione: 16 passi
- Struttura di rete: (128,128), funzione di attivazione ReLU
- MAKO dimostra buone prestazioni di modellazione su tutti e tre i sistemi
- L'errore medio di previsione a 16 passi è inferiore a 10−2
- Superiore a DeSKO su Cartpole e sistemi di processo chimico
- Leggermente inferiore a DeSKO sul sistema GRN, ma mantiene comunque buone prestazioni
- Sistema Cartpole: MAKO realizza controllo stabile con costo cumulativo inferiore a DeSKO
- Sistema GRN: DeSKO realizza tracciamento accurato solo su 3 configurazioni parametriche, MAKO mostra prestazioni più stabili
- Processo Chimico: DeSKO non riesce a stabilizzare l'errore di tracciamento su nessuna configurazione parametrica, MAKO raggiunge con successo l'obiettivo di controllo
- Il framework MAKO-robust impiega un tempo di calcolo medio di 0.0203 secondi per passo temporale sul sistema Cartpole
- Adatto per applicazioni di controllo in tempo reale
Confronto tra adattamento nominale (MAKO) e adattamento robusto (MAKO-robust):
- MAKO-robust dimostra comportamento transitorio più veloce e stabile
- Raggiunge errore di tracciamento a regime stazionario equivalente o inferiore
- Capacità di Generalizzazione: MAKO può adattarsi a configurazioni parametriche non incontrate durante l'addestramento
- Robustezza: Mantiene buone prestazioni in presenza di incertezze parametriche
- Adattabilità: Adattamento rapido a nuovi compiti tramite dati online
- Controllo Predittivo Adattivo: I metodi AMPC tradizionali hanno risultati limitati su sistemi nonlineari
- Teoria degli Operatori di Koopman: Recentemente ha ricevuto attenzione per la rappresentazione lineare di processi nonlineari complessi
- Applicazioni di Meta-Apprendimento nel Controllo: Sviluppo di metodi MAML, meta-apprendimento per rinforzo, ecc.
- Prima combinazione di meta-apprendimento e operatori di Koopman
- Fornisce garanzie teoriche di convergenza
- Applicabile a sistemi nonlineari di classe generale
- Efficienza computazionale superiore all'adattamento online basato su reti neurali profonde
Teorema 1 (Adattamento Nominale): Sotto le Assunzioni 1-3, utilizzando le leggi di aggiornamento adattivo (9) e (10), gli errori di approssimazione parametrica Ψ~k e C~k sono definitivamente limitati, e l'errore dello stato predetto x~ converge asintoticamente a zero.
Teorema 2 (Adattamento Robusto): Sotto le Assunzioni 1 e 2, utilizzando le leggi di aggiornamento (10), (15) e (16), gli errori di approssimazione parametrica Ψ~k, C~k sono definitivamente limitati, e limk→∞∥x~k∥≤ϵv.
Teorema 3: Considerando il sistema nonlineare (1) con leggi di aggiornamento adattivo (9) e (10) e controllore MPC (19), sotto le Assunzioni 1-3, l'errore di tracciamento del sistema in anello chiuso è asintoticamente stabile.
- Integrazione riuscita di meta-apprendimento e teoria degli operatori di Koopman, creando un framework di controllo adattivo applicabile a sistemi nonlineari con incertezze parametriche
- Fornisce garanzie teoriche rigorose di convergenza e stabilità
- Verifica dell'efficacia e della superiorità del metodo su più sistemi di riferimento
- Assunzioni Teoriche: L'Assunzione 3 richiede l'esistenza di sottospazi invarianti a dimensione finita, difficili da garantire per sistemi nonlineari generali
- Limiti di Prestazione: Manca un'analisi rigorosa dei limiti di generalizzazione e prestazione del meta-modello di Koopman addestrato
- Applicazione Pratica: Verificato solo in simulazione, manca la verifica su sistemi reali
- Applicazione del metodo a sistemi reali con incertezze parametriche
- Analisi formale dei requisiti di eccitazione persistente (PE)
- Studio sistematico della relazione tra lunghezza della traiettoria e qualità del meta-apprendimento dell'operatore di Koopman
- Estensione a sistemi ad alta dimensionalità
- Forte Innovatività: Prima combinazione di meta-apprendimento e operatori di Koopman, fornendo nuove prospettive per il controllo di sistemi con incertezze parametriche
- Completezza Teorica: Fornisce analisi completa di convergenza e stabilità
- Valutazione Sperimentale Completa: Valutazione complessiva su tre sistemi di riferimento di domini diversi
- Valore Pratico: Alta efficienza computazionale, adatta per applicazioni di controllo in tempo reale
- Limitazioni delle Assunzioni: L'analisi teorica dipende da condizioni di assunzione relativamente forti, che i sistemi reali potrebbero non soddisfare
- Linee di Base Limitate: Confronto solo con DeSKO, manca il confronto con altri metodi avanzati
- Mancanza di Verifica Pratica: Non verificato su sistemi reali
- Scalabilità ad Alta Dimensionalità: L'applicabilità a sistemi ad alta dimensionalità richiede ulteriore ricerca
- Contributo Accademico: Fornisce un nuovo framework teorico e metodo per la teoria del controllo basato su apprendimento
- Prospettive di Applicazione: Ampie prospettive di applicazione in robotica, controllo di processi chimici e altri campi
- Riproducibilità: Gli autori forniscono link al codice, facilitando la riproduzione dei risultati
- Sistemi Nonlineari con Incertezze Parametriche: Come sistemi robotici, processi chimici, sistemi biologici
- Compiti di Controllo che Richiedono Adattamento Rapido: Scenari di variazione di carico, variazione ambientale, ecc.
- Applicazioni di Controllo in Tempo Reale: Situazioni con elevati requisiti di efficienza computazionale
L'articolo cita 41 lavori correlati, coprendo importanti contributi in più domini inclusi controllo adattivo, teoria degli operatori di Koopman, meta-apprendimento, controllo predittivo del modello, fornendo una solida base teorica per la ricerca.
Valutazione Complessiva: Questo è un articolo accademico di alta qualità che eccelle in innovazione teorica, progettazione metodologica e verifica sperimentale. La combinazione di meta-apprendimento e teoria degli operatori di Koopman fornisce una nuova prospettiva di soluzione per il problema del controllo di sistemi nonlineari con incertezze parametriche, possedendo importante valore accademico e potenziale di applicazione. Sebbene esistano alcune limitazioni nelle assunzioni teoriche e insufficienze nella verifica pratica, nel complesso è un lavoro di ricerca degno di attenzione.