2025-11-14T08:52:10.884823

MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems

Han, Wong, Law et al.

In this work, we propose a meta-learning-based Koopman modeling and predictive control approach for nonlinear systems with parametric uncertainties. An adaptive deep meta-learning-based modeling approach, called Meta Adaptive Koopman Operator (MAKO), is proposed. Without knowledge of the parametric uncertainty, the proposed MAKO approach can learn a meta-model from a multi-modal dataset and efficiently adapt to new systems with previously unseen parameter settings by using online data. Based on the learned meta Koopman model, a predictive control scheme is developed, and the stability of the closed-loop system is ensured even in the presence of previously unseen parameter settings. Through extensive simulations, our proposed approach demonstrates superior performance in both modeling accuracy and control efficacy as compared to competitive baselines.

academic

MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems

基本信息

论文ID: 2510.09042
标题: MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems
作者: Minghao Han, Kiwan Wong, Adrian Wing-Keung Law, Xunyuan Yin
分类: eess.SY cs.LG cs.SY
发表时间: 2025年10月（arXiv预印本）
论文链接: https://arxiv.org/abs/2510.09042

摘要

本文提出了一种基于元学习的Koopman建模和预测控制方法，用于处理具有参数不确定性的非线性系统。提出了一种自适应深度元学习建模方法——元自适应Koopman算子（MAKO）。在不了解参数不确定性的情况下，MAKO方法可以从多模态数据集中学习元模型，并通过在线数据高效适应具有先前未见参数设置的新系统。基于学习的元Koopman模型，开发了预测控制方案，即使在存在先前未见参数设置的情况下也能确保闭环系统的稳定性。

研究背景与动机

问题定义：参数不确定性在非线性系统中很常见，通常由载荷变化和操作条件等因素引起。这些不确定性会导致性能下降和不稳定性，给控制系统设计带来巨大挑战。
问题重要性：传统的自适应模型预测控制（AMPC）方法在非线性系统上的结果有限，通常需要第一性原理模型作为控制系统设计的基础，且理论上假设对不确定参数的线性依赖性，限制了其对一般非线性过程的适用性。
现有方法局限性：
- 现有Koopman算子方法主要针对固定模型参数的特定控制任务
- 基于深度神经网络的在线适应效率低且计算量大
- 元强化学习方法难以提供稳定性保证和闭环性能保证
研究动机：将元学习与Koopman算子理论结合，创建一个学习型自适应控制框架，用于参数不确定的非线性系统。

核心贡献

首次集成：首次将元学习和Koopman算子理论集成，建立了适用于一般类参数不确定非线性系统的学习型自适应MPC框架
理论保证：严格证明了模型在线适应和闭环系统的收敛性
性能验证：基于三个不同领域的基准系统，MAKO在参数不确定性存在时展现了良好的建模精度和鲁棒跟踪控制性能，优于竞争基线方法

方法详解

任务定义

考虑参数不确定的非线性系统： $x_{k+1} = f(x_k, u_k, \Theta), \quad \Theta \sim p(\Theta)$

其中：

$x_k \in X \subset \mathbb{R}^n$ ：系统状态
$u_k \in U \subset \mathbb{R}^m$ ：控制输入
$\Theta \in \Xi \subset \mathbb{R}^l$ ：系统参数，服从未知分布 $p(\Theta)$

模型架构

1. 元训练神经网络（MNN）

MNN负责参数化可观测函数，在不同任务设置间共享： $g_k^i = \psi_\theta(x_k^i), \quad x_k^i \in D_i$

其中 $\psi_\theta(\cdot)$ 是多层神经网络， $\theta$ 为可训练参数。

2. Koopman算子

在编码的可观测空间中，为每个任务设置 $\Theta_i$ 学习一组Koopman算子 $A_i, B_i, C_i$ ： $g_{k+1|k}^i = A_i g_{k|k}^i + B_i u_k^i$ $\hat{x}_{k+1|k}^i = C_i g_{k+1|k}^i$

3. 元学习优化

优化问题表述为： $\min_{\theta,\{A_i,B_i,C_i\}} \frac{1}{NTH} \sum_{i=1}^N \sum_{k=1}^T \sum_{t=1}^H \|x_{k+t}^i - C_i g_{k+t|k}^i\|_2^2$

受约束：

$g_{k+t|k}^i = A_i g_{k+t-1|k}^i + B_i u_{k+t-1}^i$
$g_{k|k}^i = \psi_\theta(x_k^i)$

在线适应机制

1. 名义适应

初始化： $\hat{A}_0, \hat{B}_0, \hat{C}_0 = \{\frac{1}{N}\sum A_i, \frac{1}{N}\sum B_i, \frac{1}{N}\sum C_i\}$

梯度计算： $\nabla_{\hat{\Psi}} J_k = -X_k \tilde{g}_{k+1}^T$ $\nabla_{\hat{C}} J_k = -g_{k+1} \tilde{x}_{k+1}^T$

更新律： $\hat{\Psi}_{k+1} = \hat{\Psi}_k + \lambda_k \tilde{g}_{k+1} X_k^T$ $\hat{C}_{k+1} = \hat{C}_k + \lambda_k \tilde{x}_{k+1} g_{k+1}^T$

其中自适应学习率： $\lambda_k = \min\left(\frac{2-\alpha}{X_k^T X_k}, \frac{2-\alpha}{g_{k+1}^T g_{k+1}}\right)$

2. 鲁棒适应

考虑建模误差的情况，引入理想噪声： $w_k^*, v_k^* = \min_{w_k \in W, v_k \in V} \bar{J}(\hat{\Psi}_k, \hat{C}_k, w_k, v_k)$

鲁棒更新律： $\hat{\Psi}_{k+1} = \hat{\Psi}_k + \lambda_k(\tilde{g}_{k+1} - w_k^*) X_k^T$ $\hat{C}_{k+1} = \hat{C}_k + \lambda_k(\tilde{x}_{k+1} - v_k^*) g_{k+1}^T$

技术创新点

共享表示学习：通过MNN学习跨任务的共享可观测空间表示
任务特定动力学：为每个任务学习特定的Koopman算子
自适应学习率：基于数据特性的动态学习率调整
理论保证：提供收敛性和稳定性的严格理论分析

实验设置

数据集

实验在三个基准系统上进行：

Cart-pole系统：
- 状态： $[x, \dot{x}, \theta, \dot{\theta}]^T$
- 不确定参数：杆长 $l_p \in [0.1m, 1.0m]$ ，杆质量 $m_p \in [0.01kg, 0.2kg]$
- 控制输入： $u \in [-20, 20]$
基因调控网络（GRN）：
- 状态： $[m_1, m_2, m_3, p_1, p_2, p_3]^T$ （mRNA和蛋白质浓度）
- 不确定参数：解离常数 $K \in [2, 8]$ ，输入标量 $b_1 \in [3, 7]$
反应器-分离器化学过程：
- 状态：9维（质量分数和温度）
- 不确定参数：进料温度 $T_{10}, T_{20} \in [150K, 450K]$