2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.
This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
academic

Проектирование структурированного регулятора на основе данных с использованием матричной S-процедуры

Основная информация

  • ID статьи: 2503.14949
  • Название: Data-Driven Structured Controller Design Using the Matrix S-Procedure
  • Авторы: Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi
  • Классификация: math.OC (математическая оптимизация и управление)
  • Дата публикации: 14 октября 2025 г. (препринт, отправленный в Automatica)
  • Ссылка на статью: https://arxiv.org/abs/2503.14949

Аннотация

Данная работа посвящена проектированию оптимального структурированного регулятора на основе данных для дискретных линейных стационарных (LTI) систем с учётом характеристик H2H_2 и HH_\infty. Исследуются три сценария: (i) модельное структурированное управление, (ii) управление без структуры на основе данных, (iii) структурированное управление на основе данных. Для характеристики H2H_2 основное внимание уделяется сценариям (ii) и (iii), поскольку сценарий (i) широко изучен в литературе. Для характеристики HH_\infty рассматриваются все три сценария. Для структурированного управления предложена техника линеаризации, преобразующая исходную невыпуклую задачу в задачу полуопределённого программирования (SDP), на основе которой разработан итеративный алгоритм линейных матричных неравенств (ILMI).

Исследовательский контекст и мотивация

Постановка проблемы

  1. Вызовы в сетевых системах управления: В крупномасштабных сетевых системах управления централизованные стратегии управления создают огромную нагрузку на коммуникации, поэтому необходимо проектировать регуляторы с разреженной структурой.
  2. Сложность проектирования структурированного регулятора: Проектирование регулятора со структурными ограничениями является NP-трудной задачей. Существующие методы подразделяются на методы на основе LMI и методы на основе градиента.
  3. Потребность в управлении на основе данных: В практических приложениях динамика многих систем часто неизвестна, что стимулирует исследования в области управления на основе данных.

Ограничения существующих методов

  1. Традиционные методы зависят от известной модели: Существующие методы проектирования структурированного регулятора предполагают, что модель системы известна.
  2. Консервативность методов на основе данных: Существующие методы на основе данных, такие как работа Miller и др. 15, имеют следующие проблемы:
    • Чрезмерная аппроксимация мгновенно ограниченного шума как последовательности шума с ограниченной энергией, вносящая дополнительный консерватизм
    • Проектирование структурированного регулятора только в выпуклом подмножестве невыпуклой допустимой области
    • Отсутствие гарантий монотонности производительности

Основные вклады

  1. Улучшенная схема на основе данных:
    • Представление множества всех возможных матриц системы как пересечения множеств для каждой точки данных, что меньше, чем множество в 15
    • Использование матричной S-процедуры для обработки всех возможных матриц системы, доказательство того, что допустимая область содержит допустимую область из 15
    • Доказательство монотонной неубывающей производительности относительно длины данных
  2. Новая техника линеаризации:
    • Разработка техники линеаризации для преобразования исходной невыпуклой задачи в задачу SDP
    • Предложение алгоритма ILMI для вычисления структурированного регулятора
    • Возможность исследования большей допустимой области, чем в 15
  3. Комплексное исследование управления HH_\infty:
    • Первое комплексное исследование модельного структурированного управления, управления без структуры на основе данных и структурированного управления на основе данных

Описание методологии

Определение задачи

Рассмотрим дискретную LTI систему:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

где xkRnxx_k \in \mathbb{R}^{n_x} — состояние системы, ukRnuu_k \in \mathbb{R}^{n_u} — управляющее воздействие, ykRnyy_k \in \mathbb{R}^{n_y} — управляемый выход, dkRndd_k \in \mathbb{R}^{n_d} — внешнее возмущение.

Используется регулятор с обратной связью по состоянию uk=Kxku_k = Kx_k, где KRnu×nxK \in \mathbb{R}^{n_u \times n_x} должен удовлетворять структурным ограничениям KSK \in S.

Механизм сбора данных

Предполагается, что матрицы A,BA, B неизвестны, но детерминированы, а матрицы C,D,G,HC, D, G, H известны. Собранные данные включают:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

Ключевое предположение: Шум процесса ограничен, т.е. wk2ϵ\|w_k\|_2 \leq \epsilon.

Основные технические инновации

1. Улучшенное представление множества матриц системы

На основе данных ii-го временного шага (xi,ui,xi+1)(x_i, u_i, x_{i+1}) определяется:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

Множество всех матриц системы, согласованных с данными:

Σ = ∩_{i=0}^{T-1} Σ_i

Это более точно, чем множество в 15, и снижает консерватизм.

2. Применение матричной S-процедуры

Для управления H2H_2 с использованием матричной S-процедуры достаточным условием выполнения условия (5a) для всех (A,B)Σ(A,B) \in Σ является существование неотрицательных α0,α1,...,αT1α_0, α_1, ..., α_{T-1} и β>0β > 0 таких, что:

[PGGTβI00[IK]P[IK]T]i=0T1αiΨi0\begin{bmatrix} P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0

3. Техника линеаризации

Для структурированного управления ключевой вызов — невыпуклость ограничения YP1Y ⪯ P^{-1}. Путём линеаризации P1P^{-1} в окрестности точки P~\tilde{P}:

Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1}

Схема алгоритма

Алгоритм 1: Проектирование оптимального регулятора без структуры

Вход: данные X, U, граница шума ε
Выход: регулятор K*, граница производительности γ*
1. Выбрать соответствующую задачу SDP в зависимости от типа
2. Решить SDP и получить L*, P*, γ*
3. Вернуть K* = L*P*^{-1}, γ*

Алгоритм 2: Проектирование оптимального структурированного регулятора

Вход: данные X, U, структурные ограничения I_S
Выход: регулятор K*, граница производительности γ*
1. Инициализировать λ, μ, δ, ε, P_0 = I, k = 0
2. Повторять:
   a. Решить SDP с P̃ = P_k и λ
   b. Обновить K_{k+1}, P_{k+1}, γ_{k+1}
   c. Если λ < δ, то λ = μλ
   d. k = k + 1
3. До сходимости
4. Вернуть K_k, γ_k

Экспериментальная установка

Случай управления H2H_2

Параметры системы:

A = [-0.4095  0.4036 -0.0874
      0.5154 -0.0815  0.1069
      1.6715  0.7718 -0.3376]

B = [ 0      0
     -0.6359 -0.1098
     -0.0325  2.2795]

Структурные ограничения: I_S = [1 1 0
                                  0 1 1]

Случай управления HH_\infty

Параметры системы:

A = [0.8  0.2  0.1
     0.1  0.7 -0.3
    -0.3  0.5  0.9]

B = [1 0
     0 1
     1 1]

Структурные ограничения: I_S = [1 1 0
                                  1 1 0]

Метрики оценки

  • Граница производительности H2H_2/HH_\infty
  • Время вычисления
  • Сравнение производительности с методами-эталонами

Результаты экспериментов

Результаты управления H2H_2

Сравнение производительности при различных уровнях шума (T=20)

Метод проектирования(A,B) известныε=0.05ε=0.1ε=0.2
Без структуры 152.15372.34483.09395.2814
Без структуры (данная работа)2.15372.26632.56602.7889
Структурированный 152.97943.54944.680611.3186
Структурированный (данная работа)2.71652.91543.22494.0422

Сравнение производительности при различной длине данных (ε=0.1)

Метод проектирования(A,B) известныT=6T=10T=15
Без структуры 152.15372.99112.81562.6836
Без структуры (данная работа)2.15372.74942.56452.4374
Структурированный 152.97944.40364.43234.4456
Структурированный (данная работа)2.71653.52493.24293.1485

Результаты управления HH_\infty

Сравнение производительности при различных уровнях шума (T=50)

Метод проектирования(A,B) известныε=0.01ε=0.05ε=0.15
Без структуры 150.78150.80350.90631.6483
Без структуры (данная работа)0.78150.79210.82071.0303
Структурированный диагональный P3.74644.09506.6234недопустимо
Структурированный (данная работа)1.05801.08901.18261.5969

Основные выводы

  1. Преимущество производительности: Предложенный метод значительно превосходит метод-эталон 15 во всех тестовых сценариях
  2. Монотонность: Метод гарантирует монотонное неубывание границы производительности с увеличением длины данных T, чего не имеет 15
  3. Вычислительные затраты: Из-за итеративного процесса и большего числа переменных оптимизации время вычисления увеличивается

Связанные работы

Проектирование структурированного регулятора

  • Методы LMI: Работы Polyak и др. 2, Fardad и др. 5
  • Методы градиента: Метод увеличенного лагранжиана Lin и др. 3
  • Методы внутренней точки: Новый алгоритм Yang и др. 6

Управление на основе данных

  • Фундаментальная теория: Основная лемма Willems и др. 7
  • Робастная стабилизация: Работы De Persis и Tesi 8, Berberich и др. 9
  • Применение матричной S-леммы: Исследования van Waarde и др. 11, Bisoffi и др. 12,13

Заключение и обсуждение

Основные выводы

  1. Предложено более точное представление множества матриц системы, снижающее консерватизм
  2. Разработана эффективная техника линеаризации для обработки структурных ограничений
  3. Доказаны теоретические преимущества метода и подтверждены численными экспериментами

Ограничения

  1. Вычислительная сложность: Итеративный алгоритм и дополнительные переменные увеличивают вычислительную нагрузку
  2. Сходимость: Отсутствуют теоретические гарантии сходимости алгоритма
  3. Ограничения структурных ограничений: Эффективность метода зависит от разумности структурных ограничений

Направления будущих исследований

  1. Теоретический анализ сходимости алгоритма
  2. Дальнейшая оптимизация вычислительной эффективности
  3. Обработка более сложных структурных ограничений

Глубокая оценка

Преимущества

  1. Твёрдый теоретический вклад: Улучшенное представление системного множества и применение матричной S-процедуры имеют теоретическую ценность
  2. Сильная инновационность метода: Техника линеаризации ловко решает невыпуклые ограничения
  3. Достаточная экспериментальная верификация: Метод проверен в различных сценариях
  4. Значительное улучшение производительности: Явное улучшение по сравнению с существующими методами

Недостатки

  1. Значительные вычислительные затраты: Вычислительная стоимость итеративного алгоритма является препятствием для практического применения
  2. Отсутствие гарантий сходимости алгоритма: Теоретический анализ неполный
  3. Ограниченная область применения: Метод требует разумности структурных ограничений

Влияние

  1. Академическая ценность: Предоставляет новую теоретическую базу для структурированного управления на основе данных
  2. Практическая ценность: Имеет важные перспективы применения в сетевых системах управления
  3. Воспроизводимость: Алгоритмы описаны ясно, что облегчает воспроизведение

Сценарии применения

  • Крупномасштабные сетевые системы управления
  • Распределённое управление с ограниченной коммуникацией
  • Сценарии, где модель системы неизвестна, но доступны исторические данные
  • Приложения с высокими требованиями к производительности управления

Список литературы

Статья цитирует 42 связанные работы, охватывающие структурированное управление, управление на основе данных, робастное управление и другие важные области, обеспечивая прочную теоретическую базу для исследования.