In this work, we propose a meta-learning-based Koopman modeling and predictive control approach for nonlinear systems with parametric uncertainties. An adaptive deep meta-learning-based modeling approach, called Meta Adaptive Koopman Operator (MAKO), is proposed. Without knowledge of the parametric uncertainty, the proposed MAKO approach can learn a meta-model from a multi-modal dataset and efficiently adapt to new systems with previously unseen parameter settings by using online data. Based on the learned meta Koopman model, a predictive control scheme is developed, and the stability of the closed-loop system is ensured even in the presence of previously unseen parameter settings. Through extensive simulations, our proposed approach demonstrates superior performance in both modeling accuracy and control efficacy as compared to competitive baselines.
- ID статьи: 2510.09042
- Название: MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems
- Авторы: Minghao Han, Kiwan Wong, Adrian Wing-Keung Law, Xunyuan Yin
- Классификация: eess.SY cs.LG cs.SY
- Дата публикации: октябрь 2025 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2510.09042
В данной работе предложен метод моделирования на основе метаобучения с использованием операторов Купмана и прогнозирующего управления для обработки нелинейных систем с параметрической неопределённостью. Предложен адаптивный метод глубокого метаобучения — метаадаптивные операторы Купмана (MAKO). Без знания параметрической неопределённости метод MAKO может обучаться на метамодели из мультимодальных наборов данных и эффективно адаптироваться в режиме реального времени к новым системам с ранее не встречавшимися параметрическими конфигурациями. На основе обученной метамодели Купмана разработана схема прогнозирующего управления, которая обеспечивает устойчивость замкнутой системы даже при наличии ранее не встречавшихся параметрических конфигураций.
- Определение проблемы: Параметрическая неопределённость в нелинейных системах часто возникает из-за изменений нагрузки и условий эксплуатации. Эта неопределённость приводит к деградации производительности и нестабильности, создавая серьёзные проблемы при проектировании систем управления.
- Значимость проблемы: Традиционные методы адаптивного прогнозирующего управления (AMPC) имеют ограниченные результаты на нелинейных системах, обычно требуют моделей первых принципов в качестве основы для проектирования и теоретически предполагают линейную зависимость от неопределённых параметров, что ограничивает их применимость к общим нелинейным процессам.
- Ограничения существующих методов:
- Существующие методы операторов Купмана ориентированы в основном на конкретные задачи управления с фиксированными параметрами модели
- Онлайн-адаптация на основе глубоких нейронных сетей неэффективна и требует больших вычислительных ресурсов
- Методы метаусиления с подкреплением затрудняются в обеспечении гарантий устойчивости и замкнутой производительности
- Исследовательская мотивация: Объединить метаобучение с теорией операторов Купмана для создания обучаемой адаптивной системы управления для нелинейных систем с параметрической неопределённостью.
- Первая интеграция: Впервые интегрированы метаобучение и теория операторов Купмана, установлена обучаемая адаптивная система управления с прогнозированием для общего класса параметрически неопределённых нелинейных систем
- Теоретические гарантии: Строго доказана сходимость онлайн-адаптации модели и замкнутой системы
- Проверка производительности: На основе эталонных систем из трёх различных областей MAKO демонстрирует хорошую точность моделирования и надёжное отслеживающее управление при наличии параметрической неопределённости, превосходя конкурирующие базовые методы
Рассмотрим параметрически неопределённую нелинейную систему:
xk+1=f(xk,uk,Θ),Θ∼p(Θ)
где:
- xk∈X⊂Rn: состояние системы
- uk∈U⊂Rm: управляющее воздействие
- Θ∈Ξ⊂Rl: параметры системы, распределённые согласно неизвестному распределению p(Θ)
MNN отвечает за параметризацию функции наблюдаемости, совместно используемой между различными задачами:
gki=ψθ(xki),xki∈Di
где ψθ(⋅) — многослойная нейронная сеть, θ — обучаемые параметры.
В закодированном пространстве наблюдаемости для каждой конфигурации задачи Θi обучается набор операторов Купмана Ai,Bi,Ci:
gk+1∣ki=Aigk∣ki+Biukix^k+1∣ki=Cigk+1∣ki
Задача оптимизации формулируется как:
minθ,{Ai,Bi,Ci}NTH1∑i=1N∑k=1T∑t=1H∥xk+ti−Cigk+t∣ki∥22
При ограничениях:
- gk+t∣ki=Aigk+t−1∣ki+Biuk+t−1i
- gk∣ki=ψθ(xki)
Инициализация: A^0,B^0,C^0={N1∑Ai,N1∑Bi,N1∑Ci}
Вычисление градиента:
∇Ψ^Jk=−Xkg~k+1T∇C^Jk=−gk+1x~k+1T
Закон обновления:
Ψ^k+1=Ψ^k+λkg~k+1XkTC^k+1=C^k+λkx~k+1gk+1T
где адаптивный коэффициент обучения:
λk=min(XkTXk2−α,gk+1Tgk+12−α)
С учётом ошибок моделирования вводится идеальный шум:
wk∗,vk∗=minwk∈W,vk∈VJˉ(Ψ^k,C^k,wk,vk)
Закон робастного обновления:
Ψ^k+1=Ψ^k+λk(g~k+1−wk∗)XkTC^k+1=C^k+λk(x~k+1−vk∗)gk+1T
- Обучение совместного представления: Обучение совместного представления пространства наблюдаемости между задачами через MNN
- Динамика, специфичная для задачи: Обучение специфичных для каждой задачи операторов Купмана
- Адаптивный коэффициент обучения: Динамическая регулировка коэффициента обучения на основе характеристик данных
- Теоретические гарантии: Предоставление строгого теоретического анализа сходимости и устойчивости
Эксперименты проводились на трёх эталонных системах:
- Система тележка-маятник (Cart-pole):
- Состояние: [x,x˙,θ,θ˙]T
- Неопределённые параметры: длина стержня lp∈[0.1м,1.0м], масса стержня mp∈[0.01кг,0.2кг]
- Управляющее воздействие: u∈[−20,20]
- Сеть генной регуляции (GRN):
- Состояние: [m1,m2,m3,p1,p2,p3]T (концентрации мРНК и белков)
- Неопределённые параметры: константа диссоциации K∈[2,8], входной скаляр b1∈[3,7]
- Химический процесс реактор-сепаратор:
- Состояние: 9-мерное (массовые доли и температура)
- Неопределённые параметры: температура подачи T10,T20∈[150К,450К]
- Накопленная ошибка предсказания (16-шаговое предсказание)
- L2-норма ошибки отслеживания
- Накопленная стоимость управления
- DeSKO (Deep Stochastic Koopman Operator): конкурирующий базовый метод, обученный на номинальных параметрических конфигурациях
- Размерность наблюдаемости: 128-256
- Длина траектории: 250-500
- Размер пакета: 128
- Коэффициент обучения: 10−4
- Горизонт предсказания: 16 шагов
- Структура сети: (128,128), функция активации ReLU
- MAKO демонстрирует хорошую производительность моделирования на всех трёх системах
- Средняя ошибка 16-шагового предсказания менее 10−2
- Превосходит DeSKO на системах Cartpole и химического процесса
- Немного уступает DeSKO на системе GRN, но сохраняет хорошую производительность
- Система Cartpole: MAKO достигает стабильного управления с более низкой накопленной стоимостью, чем DeSKO
- Система GRN: DeSKO достигает точного отслеживания только на 3 параметрических конфигурациях, MAKO показывает более стабильное поведение
- Химический процесс: DeSKO не может стабильно отслеживать ошибку при всех параметрических конфигурациях, MAKO успешно достигает целей управления
- Среднее время вычисления на один временной шаг для системы Cartpole составляет 0.0203 секунды
- Подходит для приложений управления в реальном времени
Сравнение номинальной адаптации (MAKO) и робастной адаптации (MAKO-robust):
- MAKO-robust демонстрирует более быстрое и стабильное переходное поведение
- Достигает сравнимой или меньшей установившейся ошибки отслеживания
- Способность к обобщению: MAKO может адаптироваться к параметрическим конфигурациям, не встречавшимся во время обучения
- Робастность: Сохраняет хорошую производительность при наличии параметрической неопределённости
- Адаптивность: Быстро адаптируется к новым задачам через онлайн-данные
- Адаптивное прогнозирующее управление: Традиционные методы AMPC имеют ограниченные результаты на нелинейных системах
- Теория операторов Купмана: В последние годы привлекает внимание при линейном представлении сложных нелинейных процессов
- Применение метаобучения в управлении: Развитие методов MAML, метаусиления с подкреплением и др.
- Впервые объединяет метаобучение и операторы Купмана
- Предоставляет теоретические гарантии сходимости
- Применима к общему классу нелинейных систем
- Вычислительно эффективнее онлайн-адаптации глубоких нейронных сетей
Теорема 1 (Номинальная адаптация): При предположениях 1-3, используя законы адаптивного обновления (9) и (10), ошибки параметрической аппроксимации Ψ~k и C~k в конечном счёте ограничены, а ошибка предсказанного состояния x~ асимптотически сходится к нулю.
Теорема 2 (Робастная адаптация): При предположениях 1 и 2, используя законы обновления (10), (15) и (16), ошибки параметрической аппроксимации Ψ~k, C~k в конечном счёте ограничены, и limk→∞∥x~k∥≤ϵv.
Теорема 3: Рассмотрим нелинейную систему (1) с законами адаптивного обновления (9) и (10) и контроллером MPC (19). При предположениях 1-3 ошибка отслеживания замкнутой системы асимптотически устойчива.
- Успешно интегрированы метаобучение и теория операторов Купмана, создана адаптивная система управления для параметрически неопределённых нелинейных систем
- Предоставлены строгие теоретические гарантии сходимости и устойчивости
- Эффективность и превосходство метода подтверждены на нескольких эталонных системах
- Теоретические предположения: Предположение 3 требует существования конечномерного инвариантного подпространства, что сложно гарантировать для общих нелинейных систем
- Границы производительности: Отсутствует строгий анализ границ обобщения и производительности метамодели операторов Купмана
- Практическое применение: Проверено только в симуляции, отсутствует проверка на реальных системах
- Применение метода к реальным системам с параметрической неопределённостью
- Формальный анализ требований постоянного возбуждения (PE)
- Систематическое исследование связи между длиной траектории и качеством метаобучения операторов Купмана
- Расширение на высокомерные системы
- Высокая инновационность: Впервые объединены метаобучение и операторы Купмана, предложен новый подход к управлению параметрически неопределёнными системами
- Теоретическая полнота: Предоставлен полный анализ сходимости и устойчивости
- Достаточная экспериментальная проверка: Проведена комплексная оценка на эталонных системах из трёх различных областей
- Практическая ценность: Высокая вычислительная эффективность, подходит для приложений управления в реальном времени
- Ограничения предположений: Теоретический анализ зависит от строгих условий предположений, которые реальные системы могут не удовлетворять
- Ограниченные базовые методы: Сравнение только с DeSKO, отсутствует сравнение с другими передовыми методами
- Отсутствие практической проверки: Метод не проверен на реальных системах
- Масштабируемость на высокие размерности: Применимость к высокомерным системам требует дальнейших исследований
- Академический вклад: Предоставляет новую теоретическую базу и методы для теории обучаемого управления
- Перспективы применения: Имеет широкие перспективы применения в робототехнике, управлении химическими процессами и других областях
- Воспроизводимость: Авторы предоставили ссылку на код, облегчающую воспроизведение результатов
- Параметрически неопределённые нелинейные системы: Такие как робототехнические системы, химические процессы, биологические системы
- Задачи управления, требующие быстрой адаптации: Сценарии с изменением нагрузки, изменением окружающей среды и т.д.
- Приложения управления в реальном времени: Ситуации с высокими требованиями к вычислительной эффективности
Статья цитирует 41 соответствующий источник, охватывающий адаптивное управление, теорию операторов Купмана, метаобучение, прогнозирующее управление и другие области, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это высококачественная академическая статья, демонстрирующая отличные результаты в теоретических инновациях, разработке методов и экспериментальной проверке. Объединение метаобучения и теории операторов Купмана предоставляет новый подход к решению проблемы управления параметрически неопределёнными нелинейными системами, имеет важное академическое значение и потенциал применения. Несмотря на некоторые ограничения теоретических предположений и недостаток практической проверки, в целом это исследование заслуживает внимания.