2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic

Стабилизация на основе данных с использованием априорных знаний об управляемости и стабилизируемости

Основная информация

  • ID статьи: 2510.25452
  • Название: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
  • Авторы: Амир Шакури, Хенк Ван Ваарде, Трен Балтуссен, В.П.М.Х. (Морис) Химелс
  • Учреждения: Университет Гронингена (Шакури, Ван Ваарде), Технологический университет Эйндховена (Балтуссен, Химелс)
  • Классификация: math.OC (Оптимизация и управление), cs.SY, eess.SY (Системы и управление)
  • Дата публикации: arXiv v2, 30 октября 2025 г.
  • Ссылка на статью: https://arxiv.org/abs/2510.25452v2

Аннотация

В данной работе исследуется задача стабилизации линейных стационарных систем на основе данных с использованием свойств теории систем (в частности, управляемости и стабилизируемости) в качестве априорных знаний. Авторы расширяют концепцию информативности данных, требуя существования регулятора, который стабилизирует все системы, согласованные с данными и априорными знаниями. Показано, что: (1) если система управляема, использование этого как априорного знания не ослабляет условия стабилизации на основе данных; (2) если система стабилизируема, то использование этого априорного знания дает более слабые необходимые и достаточные условия по сравнению со случаем без априорных знаний. Иными словами, если известно, что базовая система стабилизируема, то стабилизация на основе данных становится более достижимой. Статья также предоставляет новый метод проектирования управления на основе данных, основанный на линейных матричных неравенствах (ЛМН).

Исследовательский контекст и мотивация

Основная решаемая проблема

Статья решает следующую задачу: Как спроектировать стабилизирующий регулятор при ограниченном объеме данных, объединяя априорные знания о стабилизируемости или управляемости системы?

Традиционное управление на основе данных предполагает полную неизвестность параметров системы, однако для большинства физических систем это предположение чрезмерно консервативно. На практике мы часто располагаем некоторыми априорными знаниями (такими как диапазоны физических величин — масс, коэффициентов жесткости пружин и т.д., или управляемость/стабилизируемость, выводимые из структуры системы).

Важность проблемы

  1. Снижение требований к данным: Прямое проектирование регулятора из данных может требовать большого объема данных для удовлетворения условия постоянного возбуждения, однако объединение с априорными знаниями может позволить достичь стабилизации с меньшим объемом данных
  2. Практическая применимость: В некоторых случаях невозможно спроектировать стабилизирующий регулятор только на основе данных (например, когда матрица состояния имеет дефицит ранга), но добавление априорных знаний может сделать проектирование возможным
  3. Теоретическая полнота: Свойства теории систем (управляемость, стабилизируемость) являются фундаментальными концепциями теории управления, однако в рамках подхода на основе данных они еще не получили достаточного изучения

Ограничения существующих методов

  1. Управление на основе данных: Существующие работы (такие как De Persis & Tesi 2019, van Waarde et al. 2020) в основном исследуют случай без априорных знаний и требуют строгих условий на данные (например, постоянное возбуждение, полный ранг матрицы состояния)
  2. Интеграция априорных знаний: Существующие исследования ограничиваются ограничениями на параметры 12-14 или частично известными параметрами 15, не затрагивая свойства теории систем
  3. Вызов невыпуклости: Множества управляемых и стабилизируемых систем невыпуклны, в отличие от выпуклых множеств систем, рассматриваемых в существующих работах

Исследовательская мотивация

Во многих практических приложениях управляемость или стабилизируемость можно вывести из структуры системы (теория структурной управляемости), однако такие априорные знания еще не использовались в управлении на основе данных. Данная статья заполняет этот теоретический пробел.

Основные вклады

Основные вклады статьи включают:

  1. Расширение теоретической базы: Расширение концепции информативности данных (data informativity) для включения априорных знаний, введение определения Σ_pk-информативности (Definition 3)
  2. Теорема эквивалентности для управляемости (Theorem 5): Доказано, что использование управляемости в качестве априорного знания эквивалентно случаю без априорных знаний, то есть априорное знание об управляемости не ослабляет условия на данные
  3. Теоремы преимущества для стабилизируемости (Theorems 14, 15):
    • Когда матрица состояния имеет полный ранг (rank X⁻ = n), априорное знание о стабилизируемости не обеспечивает дополнительной помощи
    • Когда матрица состояния имеет дефицит ранга (rank X⁻ < n), априорное знание о стабилизируемости значительно ослабляет условия, обеспечивая необходимые и достаточные условия
  4. Вычислимый метод проектирования (Proposition 16): Предоставлен метод вычисления стабилизирующего регулятора на основе ЛМН, который может быть решен непосредственно из Σ_stab-информативных данных
  5. Теоретические выводы: Раскрыто кажущееся противоречие — более сильное свойство (управляемость) не помогает ослабить условия, а более слабое свойство (стабилизируемость) может это сделать. Это объясняется тем, что в некоторых случаях все системы, согласованные с данными, неуправляемы.

Подробное описание метода

Определение задачи

Модель системы: Рассматривается дискретная линейная стационарная система

x(t+1) = A_true x(t) + B_true u(t)

где x(t)∈ℝⁿ — состояние, u(t)∈ℝᵐ — управление, матрицы системы (A_true, B_true) неизвестны.

Данные: Собранные входно-состояние данные с времени 0 до T

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

Определены матрицы данных:

  • U⁻ = u(0),...,u(T-1)
  • X⁻ = x(0),...,x(T-1)
  • X⁺ = x(1),...,x(T)

Множество систем, согласованных с данными:

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

Цель: Найти матрицу обратной связи K такую, что A+BK является Шур-устойчивой (все собственные значения имеют модуль < 1) для всех (A,B)∈Σ_D∩Σ_pk

Основные концепции

Definition 3 (Σ_pk-информативность для стабилизации): Данные D называются Σ_pk-информативными для стабилизации, если существует K∈ℝᵐˣⁿ такая, что A+BK является Шур-устойчивой для всех (A,B)∈Σ_D∩Σ_pk.

Множества априорных знаний:

  • Σ_cont: множество всех пар управляемых систем
  • Σ_stab: множество всех пар стабилизируемых систем

Управляемость как априорное знание (Section III)

Theorem 5 (основной результат): Предположим, что (A_true, B_true)∈Σ_cont. Тогда следующие утверждения эквивалентны:

  • (a) Данные D являются Σ_cont-информативными для стабилизации
  • (b) Данные D являются информативными для стабилизации (без априорных знаний)

Идея доказательства:

  1. (b)⇒(a) очевидно
  2. (a)⇒(b) ключевой момент:
    • Если Σ_D⊆Σ_cont, заключение следует
    • Если существует неуправляемая система (Ā,B̄)∈Σ_D, используется Lemma 7 (параметризация семейства систем почти везде управляемо) и Lemma 9 (устойчивость матричного пучка) для доказательства того, что регулятор стабилизации также стабилизирует (Ā,B̄)

Ключевые леммы:

  • Lemma 7: Если (M,N) управляемо, то (M+αM₀, N+αN₀) управляемо для всех α, кроме конечного множества из n² значений
  • Lemma 9: Если M+δN является Шур-устойчивой для всех δ∈[ε,∞)\F (F конечно), то N нильпотентна и M+δN является Шур-устойчивой для всех δ∈ℝ

Стабилизируемость как априорное знание (Section IV)

A. Необходимые условия (Theorem 10)

Если данные Σ_stab-информативны и K — матрица стабилизирующей обратной связи, то:

  • (a) (A₀+B₀K)R(A,B) = {0} для всех (A,B)∈Σ_D∩Σ_stab и (A₀,B₀)∈Σ⁰_D
  • (b) Если rank X⁻ < n, то imX⁻;U⁻ = im X⁻ × ℝᵐ
  • (c) im X⁺ ⊆ im X⁻
  • (d) im X⁻ является A-инвариантным и содержит im B

Замечание 11: Условие (a) является ослаблением условия A₀+B₀K=0 из случая без априорных знаний; условия (b)-(d) автоматически выполняются при rank X⁻ = n, но нетривиальны при дефиците ранга.

B. Случай полного ранга (Theorem 14)

Theorem 14: Если (A_true,B_true)∈Σ_stab и rank X⁻ = n, то:

  • Σ_stab-информативность ⟺ информативность (без априорных знаний)

Идея доказательства:

  1. Если истинная система управляема, из Theorem 5 следует заключение
  2. Если истинная система неуправляема, строится K̂ такая, что для всех (A,B)∈Σ_D имеет место A+BK̂ = A_true+B_true K̂, затем доказывается, что последняя является Шур-устойчивой

C. Случай дефицита ранга (Theorem 15, основной результат)

Theorem 15: Если (A_true,B_true)∈Σ_stab и rank X⁻ < n, то данные D являются Σ_stab-информативными тогда и только тогда, когда:

  • (a) im X⁺ ⊆ im X⁻
  • (b) imX⁻;U⁻ = im X⁻ × ℝᵐ

Ключевая лемма (Lemma 17): Если условия (a)(b) выполнены, то для всех (A,B)∈Σ_D∩Σ_stab матрица преобразования S удовлетворяет:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

где (A₁₁,B₁) стабилизируема, A₂₂ является Шур-устойчивой, и A₁₁ B₁ = X̂⁺X̂⁻;U⁻

Это обеспечивает разложение, подобное разложению Калмана, основанное на данных.

Метод проектирования регулятора (Proposition 16)

Proposition 16: Если данные Σ_stab-информативны и rank X⁻ = r < n:

(a) Существует Θ∈ℝᵀˣʳ такая, что ЛМН разрешимо:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) Если Θ удовлетворяет (11), положим K = K₁ K₂S, где:

  • K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  • K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾ произвольна тогда A+BK является Шур-устойчивой для всех (A,B)∈Σ_D∩Σ_stab

Этапы проектирования:

  1. Вычислить QR-разложение X⁻ для получения S и X̂⁻
  2. Решить ЛМН (11) для получения Θ
  3. Вычислить K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  4. Выбрать K₂, построить K = K₁ K₂S

Экспериментальная установка

Численный пример: система трех резервуаров

Описание системы (Figure 2):

  • 3 последовательно соединенных резервуара, жидкость течет из резервуара 3 в резервуар 2 и затем в резервуар 1
  • Состояние: x_i — высота жидкости в резервуаре i (i=1,2,3)
  • Управляющее воздействие: u — скорость потока между резервуаром 2 и накопительным баком
  • Структурное свойство: из-за однонаправленного потока x₃ неуправляемо

Модель в непрерывном времени:

ẋ = A_c x + B_c u

где:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

Дискретизация (период дискретизации 0.1 с):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

Экспериментальные данные

Эксперимент в разомкнутом контуре (T=5):

t012345
u(t)10-101
x₁11.041.07781.10861.13341.1575
x₂22.04982.00151.85971.82371.8881
x₃000000

Характеристики данных: rank X⁻ = 2 < 3 (дефицит ранга)

Процесс решения

  1. Использование MATLAB + YALMIP + MOSEK для решения ЛМН (11)
  2. Получение Θ (матрица 5×2)
  3. Вычисление K₁ = -2.7728 -9.7123
  4. Выбор K₂ = 0, получение K = -2.7728 -9.7123 0

Эксперимент Монте-Карло

Установка эксперимента:

  • 1000 случайных сценариев
  • В каждом сценарии: моделирование системы с t=0 до t=100
  • Входные данные и начальные условия независимо выбраны из распределения Пуассона (λ=1)
  • Анализ информативности данных при различных размерах выборки T = 3, 4, 5, 10, 100

Метрики оценки:

  • Информативность идентификации системы (rankX⁻ᵀ U⁻ᵀ = n+m)
  • Информативность стабилизации без априорных знаний
  • Σ_stab-информативность стабилизации

Результаты экспериментов

Основные результаты (Table I)

TИнформативность идентификацииИнформативность стабилизации (без априорных)Σ_stab-информативность стабилизации
30%8.1%42%
462.4%63.2%99.4%
562.8%63.2%99.8%
1063.2%63.2%100%
10063.2%63.2%100%

Ключевые выводы

  1. Значительное преимущество при T=3:
    • Невозможна идентификация системы (T < n+m)
    • Только 8.1% данных могут быть использованы для стабилизации без априорных знаний
    • 42% данных могут быть использованы для Σ_stab-стабилизации (5-кратное улучшение)
  2. Поведение сходимости при T≥4:
    • Информативность идентификации и стабилизации без априорных знаний стабилизируется на уровне 63.2%
    • Это объясняется тем, что примерно 36.8% случайных данных не удовлетворяют необходимым условиям
  3. Полное покрытие при T≥10:
    • 100% данных являются Σ_stab-информативными
    • Ярко демонстрирует мощь априорного знания о стабилизируемости

Проверка конкретного случая

Для данных с T=5:

  • X⁻ не имеет полного ранга, Proposition 2 неприменима (невозможна стабилизация без априорных знаний)
  • Однако условия Theorem 15 выполнены
  • Успешно решено ЛМН, получена матрица стабилизирующей обратной связи K

Связанные работы

Управление на основе данных

  1. De Persis & Tesi (2019): Первая работа по прямому проектированию стабилизирующей обратной связи из данных с использованием ЛМН, требует условия постоянного возбуждения
  2. van Waarde et al. (2020): Введена концепция информативности данных, даны необходимые и достаточные условия, не требует уникальной идентификации
  3. Случай с шумом: van Waarde et al. (2020), Li et al. (2026) исследовали синтез регулятора при наличии шума в данных

Априорные знания в управлении на основе данных

  1. Ограничения на параметры: Berberich et al. (2022) исследовали априорные знания, представленные линейными дробными представлениями
  2. Частично известные параметры: Huang et al. (2025) исследовали метод функции плотности для полиномиальных систем
  3. Инновация данной работы: Первое исследование свойств теории систем (управляемость/стабилизируемость) как априорных знаний

Идентификация систем с априорными знаниями

  1. Ограничения устойчивости: van Gestel et al. (2002), Lacy & Bernstein (2003)
  2. Ограничения на собственные значения: Miller & De Callafon (2013)
  3. Позитивность/пассивность: De Santis & Farina (2002), Goethals et al. (2003)
  4. Отличие данной работы: Фокус на проектировании регулятора, а не на идентификации, и работа с невыпуклыми множествами априорных знаний

Структурная управляемость

Jia et al. (2020) и др. исследовали вывод управляемости из структуры системы. Данная работа может рассматриваться как мост между структурной информацией и управлением на основе данных.

Заключение и обсуждение

Основные выводы

  1. Неэффективность априорного знания об управляемости: Если известно, что система управляема, это априорное знание не ослабляет условия стабилизации на основе данных (Theorem 5)
  2. Эффективность априорного знания о стабилизируемости:
    • При полном ранге матрицы состояния помощь отсутствует (Theorem 14)
    • При дефиците ранга матрицы состояния значительно ослабляет условия (Theorem 15)
  3. Контринтуитивное явление: Более сильное свойство (управляемость) бесполезно, а более слабое свойство (стабилизируемость) полезно — причина в том, что все системы, согласованные с данными, могут быть неуправляемы
  4. Практический метод проектирования: Предоставлен вычислимый метод проектирования регулятора на основе ЛМН (Proposition 16)

Теоретические выводы

Значение Example 4:

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])
  • rank X⁻ = 1 < 2, данные не информативны
  • Но все системы в Σ_D∩Σ_stab стабилизируются K=-1 0
  • Ключевой момент: автономная часть неуправляемых систем β должна быть устойчива (|β|<1)

Значение Lemma 17: Обеспечивает разложение системы, основанное на данных, без знания матриц системы:

  • Стабилизируемая часть: (A₁₁,B₁) может быть восстановлена непосредственно из данных
  • Устойчивая автономная часть: A₂₂ не влияет на стабилизируемость

Ограничения

  1. Предположение об отсутствии шума: Текущая теория применима только к данным без шума, расширение на случай с шумом является открытой проблемой
  2. Автономные данные: Требуется предварительный сбор полного набора данных, неприменимо к сценариям онлайн-обучения
  3. Линейные системы: Рассматриваются только ЛТИ системы, расширение на нелинейные системы представляет вызов
  4. Бинарные априорные знания: Рассматриваются только "стабилизируемо" или "не стабилизируемо", не рассматриваются более тонкие априорные знания, такие как верхние границы размерности достижимого подпространства
  5. Устойчивость Шура: Рассматривается только устойчивость, не затрагиваются показатели производительности (такие как норма H∞)

Направления будущих исследований

  1. Робастность к шуму: Расширение на данные с шумом, возможно требующее интеграции с методами робастного управления (такими как S-лемма)
  2. Границы размерности достижимого подпространства: Исследование "rank R(A,B) ≤ r" как априорного знания
  3. Оптимизация производительности: Проектирование оптимальных регуляторов в сочетании с априорным знанием о стабилизируемости (например, LQR)
  4. Онлайн-обучение: Разработка адаптивных алгоритмов для онлайн-обновления регулятора
  5. Расширение на нелинейные системы: Исследование аналогичной теории для билинейных или полиномиальных систем
  6. Практические приложения: Проверка метода в приложениях робототехники, электроэнергетических систем и др.

Глубокая оценка

Преимущества

1. Глубокие теоретические вклады

  • Обработка невыпуклых априорных знаний: Первое рассмотрение невыпуклых множеств априорных знаний (множества стабилизируемых/управляемых систем невыпуклы) в управлении на основе данных, высокая техническая сложность
  • Необходимые и достаточные условия: Theorem 15 дает необходимые и достаточные условия для случая дефицита ранга, теория полна
  • Контринтуитивные результаты: Раскрыто явление, что управляемость бесполезна, а стабилизируемость полезна, обеспечивает глубокие теоретические выводы

2. Изящные методы доказательства

  • Lemma 7 (параметризованная управляемость): Использование полиномиальных свойств матрицы Калмана, доказательство того, что управляемость выполняется "почти везде"
  • Lemma 9 (анализ матричного пучка): Вывод нильпотентности через полиномиальные свойства следа, техника изящна
  • Lemma 17 (разложение на основе данных): Реализация разложения без знания матриц системы, высокая инновационность

3. Сильная практическая применимость метода

  • Разрешимость ЛМН: Proposition 16 предоставляет стандартную задачу выпуклой оптимизации, решаемую существующими инструментами
  • Степени свободы в параметрах: Произвольность K₂ обеспечивает гибкость проектирования
  • Численная проверка: Пример с тремя резервуарами ясно демонстрирует эффективность метода

4. Разумная экспериментальная установка

  • Анализ Монте-Карло: 1000 сценариев обеспечивают статистическую достаточность
  • Анализ различных размеров выборки: Систематическое исследование влияния T от 3 до 100
  • Физическая система: Система трех резервуаров имеет практическое значение и четкую структурную управляемость

5. Четкое и строгое изложение

  • Точные определения, четкие формулировки теорем
  • Примеры (Example 4, 6) помогают пониманию
  • Последовательная система обозначений

Недостатки

1. Теоретические ограничения

  • Проблема в Remark 19: Σ_stab-информативность не гарантирует квадратичную стабилизацию (quadratic stabilization), что может ограничить практическое применение
  • Отсутствие анализа консервативности: Не количественно оценено, насколько априорное знание о стабилизируемости может сэкономить данные по сравнению с отсутствием априорных знаний
  • Неполнота доказательства необходимости: Доказательство необходимости в Theorem 10(b)-(d) зависит от (a), но необходимость самого (a) доказана сложно

2. Недостаточность экспериментов

  • Единственный пример: Только система трех резервуаров, отсутствует разнообразие (например, высокомерные системы, различные структуры)
  • Отсутствие сравнения с шумом: Не сравнена робастность метода при наличии шума
  • Анализ сложности: Не проанализирована вычислительная сложность решения ЛМН в зависимости от n, T
  • Примеры отказа: Не показаны примеры данных, не удовлетворяющих условиям Theorem 15

3. Ограничения метода

  • Выбор K₂: В Proposition 16(b) K₂ произвольна, но не дано руководства по выбору (например, оптимизация производительности)
  • Эффективность данных: Не сравнена с методами, основанными на моделях, по эффективности использования данных
  • Масштабируемость: Не обсуждены специальные рассмотрения для систем с множественными входами и выходами (MIMO)

4. Сравнение с связанными работами

  • Не сравнено с последними методами глубокого обучения с подкреплением
  • Не обсуждена связь с адаптивным управлением
  • Отсутствует связь с робастным управлением (например, μ-синтез)

5. Практические соображения

  • Получение априорных знаний: Не обсуждено, как на практике проверить стабилизируемость системы (может требовать частичной идентификации)
  • Обработка отказа: Что делать, если ЛМН (11) неразрешимо?
  • Данные в замкнутом контуре: Рассматриваются только данные в разомкнутом контуре, случай с данными в замкнутом контуре не затронут

Оценка влияния

Вклад в область

  1. Теоретическая база: Закладывает основу для интеграции свойств теории систем в управление на основе данных, открывает новое направление исследований
  2. Методология: Методы обработки невыпуклых априорных знаний могут быть обобщены на другие системные свойства (такие как пассивность, позитивность)
  3. Мостовая роль: Связывает теорию структурной управляемости с управлением на основе данных

Практическая ценность

  1. Снижение требований к данным: Эксперимент Монте-Карло показывает, что требования к данным могут быть снижены до 1/5 (при T=3)
  2. Решение для дефицита ранга: Предоставляет решение для часто встречающегося в практике случая дефицита ранга данных
  3. Воспроизводимость: Предоставлен код на GitHub, обеспечивающий воспроизводимость

Потенциальные приложения

  1. Робототехника: Стабилизация управления при неуправляемых суставах
  2. Электроэнергетические системы: Стабилизация электросети при неуправляемых генераторах
  3. Технологические процессы: Системы с несколькими резервуарами, теплообменники
  4. Аэрокосмос: Управление ориентацией спутника (некоторые моды неуправляемы, но стабилизируемы)

Ограничения

  1. Высокий теоретический порог: Требует глубоких знаний теории управления, ограничивает распространение
  2. Недостаточная практическая проверка: Отсутствуют эксперименты на реальных системах, сомнения в принятии промышленностью
  3. Чувствительность к шуму: Предположение об отсутствии шума ограничивает прямое применение

Применимые сценарии

Идеальные сценарии

  1. Системы с известной структурой: Управляемость/стабилизируемость может быть выведена из структуры (например, сетевые системы)
  2. Данные с дефицитом ранга: Начальные условия приводят к дефициту ранга X⁻, но система стабилизируема
  3. Среда с ограниченными данными: Сбор данных дорог (например, космос, медицина)
  4. Системы, критичные по безопасности: Требуется теоретическая гарантия стабилизируемости

Неприменимые сценарии

  1. Высокошумовая среда: Текущая теория неприменима
  2. Нелинейные системы: Требуются другие методы
  3. Нестационарные системы: Предположение ЛТИ не выполнено
  4. Строгие требования к производительности: Гарантируется только устойчивость, не производительность

Рекомендации по улучшению

  1. Интеграция с робастными методами: Расширение на случай ограниченного шума
  2. Оптимизация производительности: Оптимизация стоимости LQR при ограничениях стабилизации
  3. Онлайн-обновление: Разработка рекурсивных алгоритмов
  4. Экспериментальная проверка: Проверка на реальных системах (например, беспилотные летательные аппараты, промышленные процессы)

Общая оценка

Это высокачественная теоретическая работа в области управления, которая вносит важный вклад в область управления на основе данных. Основные достоинства:

  1. Первое систематическое исследование свойств теории систем как априорных знаний
  2. Раскрытие фундаментального различия между управляемостью и стабилизируемостью
  3. Предоставление полных необходимых и достаточных условий и вычислимого метода

Основные недостатки — недостаточная экспериментальная проверка и отсутствие рассмотрения робастности к шуму.

Рекомендуемый рейтинг: ⭐⭐⭐⭐☆ (4/5)

  • Теоретическая глубина: ⭐⭐⭐⭐⭐
  • Практическая ценность: ⭐⭐⭐⭐
  • Полнота экспериментов: ⭐⭐⭐
  • Качество изложения: ⭐⭐⭐⭐⭐
  • Инновационность: ⭐⭐⭐⭐⭐

Подходит для публикации в ведущих журналах области управления (таких как IEEE TAC, Automatica), имеет важное справочное значение для исследователей в области управления на основе данных и теории систем.

Избранные ссылки

3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Фундаментальная работа по концепции информативности данных)

4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Первый метод ЛМН для стабилизации на основе данных)

12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Априорные знания об ограничениях параметров)

25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Теория структурной управляемости)

27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Теория квадратичной стабилизации)