Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
Стабилизация на основе данных с использованием априорных знаний об управляемости и стабилизируемости
В данной работе исследуется задача стабилизации линейных стационарных систем на основе данных с использованием свойств теории систем (в частности, управляемости и стабилизируемости) в качестве априорных знаний. Авторы расширяют концепцию информативности данных, требуя существования регулятора, который стабилизирует все системы, согласованные с данными и априорными знаниями. Показано, что: (1) если система управляема, использование этого как априорного знания не ослабляет условия стабилизации на основе данных; (2) если система стабилизируема, то использование этого априорного знания дает более слабые необходимые и достаточные условия по сравнению со случаем без априорных знаний. Иными словами, если известно, что базовая система стабилизируема, то стабилизация на основе данных становится более достижимой. Статья также предоставляет новый метод проектирования управления на основе данных, основанный на линейных матричных неравенствах (ЛМН).
Статья решает следующую задачу: Как спроектировать стабилизирующий регулятор при ограниченном объеме данных, объединяя априорные знания о стабилизируемости или управляемости системы?
Традиционное управление на основе данных предполагает полную неизвестность параметров системы, однако для большинства физических систем это предположение чрезмерно консервативно. На практике мы часто располагаем некоторыми априорными знаниями (такими как диапазоны физических величин — масс, коэффициентов жесткости пружин и т.д., или управляемость/стабилизируемость, выводимые из структуры системы).
Снижение требований к данным: Прямое проектирование регулятора из данных может требовать большого объема данных для удовлетворения условия постоянного возбуждения, однако объединение с априорными знаниями может позволить достичь стабилизации с меньшим объемом данных
Практическая применимость: В некоторых случаях невозможно спроектировать стабилизирующий регулятор только на основе данных (например, когда матрица состояния имеет дефицит ранга), но добавление априорных знаний может сделать проектирование возможным
Теоретическая полнота: Свойства теории систем (управляемость, стабилизируемость) являются фундаментальными концепциями теории управления, однако в рамках подхода на основе данных они еще не получили достаточного изучения
Управление на основе данных: Существующие работы (такие как De Persis & Tesi 2019, van Waarde et al. 2020) в основном исследуют случай без априорных знаний и требуют строгих условий на данные (например, постоянное возбуждение, полный ранг матрицы состояния)
Интеграция априорных знаний: Существующие исследования ограничиваются ограничениями на параметры 12-14 или частично известными параметрами 15, не затрагивая свойства теории систем
Вызов невыпуклости: Множества управляемых и стабилизируемых систем невыпуклны, в отличие от выпуклых множеств систем, рассматриваемых в существующих работах
Во многих практических приложениях управляемость или стабилизируемость можно вывести из структуры системы (теория структурной управляемости), однако такие априорные знания еще не использовались в управлении на основе данных. Данная статья заполняет этот теоретический пробел.
Расширение теоретической базы: Расширение концепции информативности данных (data informativity) для включения априорных знаний, введение определения Σ_pk-информативности (Definition 3)
Теорема эквивалентности для управляемости (Theorem 5): Доказано, что использование управляемости в качестве априорного знания эквивалентно случаю без априорных знаний, то есть априорное знание об управляемости не ослабляет условия на данные
Теоремы преимущества для стабилизируемости (Theorems 14, 15):
Когда матрица состояния имеет полный ранг (rank X⁻ = n), априорное знание о стабилизируемости не обеспечивает дополнительной помощи
Когда матрица состояния имеет дефицит ранга (rank X⁻ < n), априорное знание о стабилизируемости значительно ослабляет условия, обеспечивая необходимые и достаточные условия
Вычислимый метод проектирования (Proposition 16): Предоставлен метод вычисления стабилизирующего регулятора на основе ЛМН, который может быть решен непосредственно из Σ_stab-информативных данных
Теоретические выводы: Раскрыто кажущееся противоречие — более сильное свойство (управляемость) не помогает ослабить условия, а более слабое свойство (стабилизируемость) может это сделать. Это объясняется тем, что в некоторых случаях все системы, согласованные с данными, неуправляемы.
Definition 3 (Σ_pk-информативность для стабилизации):
Данные D называются Σ_pk-информативными для стабилизации, если существует K∈ℝᵐˣⁿ такая, что A+BK является Шур-устойчивой для всех (A,B)∈Σ_D∩Σ_pk.
Theorem 5 (основной результат): Предположим, что (A_true, B_true)∈Σ_cont. Тогда следующие утверждения эквивалентны:
(a) Данные D являются Σ_cont-информативными для стабилизации
(b) Данные D являются информативными для стабилизации (без априорных знаний)
Идея доказательства:
(b)⇒(a) очевидно
(a)⇒(b) ключевой момент:
Если Σ_D⊆Σ_cont, заключение следует
Если существует неуправляемая система (Ā,B̄)∈Σ_D, используется Lemma 7 (параметризация семейства систем почти везде управляемо) и Lemma 9 (устойчивость матричного пучка) для доказательства того, что регулятор стабилизации также стабилизирует (Ā,B̄)
Ключевые леммы:
Lemma 7: Если (M,N) управляемо, то (M+αM₀, N+αN₀) управляемо для всех α, кроме конечного множества из n² значений
Lemma 9: Если M+δN является Шур-устойчивой для всех δ∈[ε,∞)\F (F конечно), то N нильпотентна и M+δN является Шур-устойчивой для всех δ∈ℝ
Если данные Σ_stab-информативны и K — матрица стабилизирующей обратной связи, то:
(a) (A₀+B₀K)R(A,B) = {0} для всех (A,B)∈Σ_D∩Σ_stab и (A₀,B₀)∈Σ⁰_D
(b) Если rank X⁻ < n, то imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ является A-инвариантным и содержит im B
Замечание 11: Условие (a) является ослаблением условия A₀+B₀K=0 из случая без априорных знаний; условия (b)-(d) автоматически выполняются при rank X⁻ = n, но нетривиальны при дефиците ранга.
Если истинная система управляема, из Theorem 5 следует заключение
Если истинная система неуправляема, строится K̂ такая, что для всех (A,B)∈Σ_D имеет место A+BK̂ = A_true+B_true K̂, затем доказывается, что последняя является Шур-устойчивой
De Persis & Tesi (2019): Первая работа по прямому проектированию стабилизирующей обратной связи из данных с использованием ЛМН, требует условия постоянного возбуждения
van Waarde et al. (2020): Введена концепция информативности данных, даны необходимые и достаточные условия, не требует уникальной идентификации
Случай с шумом: van Waarde et al. (2020), Li et al. (2026) исследовали синтез регулятора при наличии шума в данных
Jia et al. (2020) и др. исследовали вывод управляемости из структуры системы. Данная работа может рассматриваться как мост между структурной информацией и управлением на основе данных.
Неэффективность априорного знания об управляемости: Если известно, что система управляема, это априорное знание не ослабляет условия стабилизации на основе данных (Theorem 5)
Эффективность априорного знания о стабилизируемости:
При полном ранге матрицы состояния помощь отсутствует (Theorem 14)
При дефиците ранга матрицы состояния значительно ослабляет условия (Theorem 15)
Контринтуитивное явление: Более сильное свойство (управляемость) бесполезно, а более слабое свойство (стабилизируемость) полезно — причина в том, что все системы, согласованные с данными, могут быть неуправляемы
Практический метод проектирования: Предоставлен вычислимый метод проектирования регулятора на основе ЛМН (Proposition 16)
Предположение об отсутствии шума: Текущая теория применима только к данным без шума, расширение на случай с шумом является открытой проблемой
Автономные данные: Требуется предварительный сбор полного набора данных, неприменимо к сценариям онлайн-обучения
Линейные системы: Рассматриваются только ЛТИ системы, расширение на нелинейные системы представляет вызов
Бинарные априорные знания: Рассматриваются только "стабилизируемо" или "не стабилизируемо", не рассматриваются более тонкие априорные знания, такие как верхние границы размерности достижимого подпространства
Устойчивость Шура: Рассматривается только устойчивость, не затрагиваются показатели производительности (такие как норма H∞)
Обработка невыпуклых априорных знаний: Первое рассмотрение невыпуклых множеств априорных знаний (множества стабилизируемых/управляемых систем невыпуклы) в управлении на основе данных, высокая техническая сложность
Необходимые и достаточные условия: Theorem 15 дает необходимые и достаточные условия для случая дефицита ранга, теория полна
Контринтуитивные результаты: Раскрыто явление, что управляемость бесполезна, а стабилизируемость полезна, обеспечивает глубокие теоретические выводы
Проблема в Remark 19: Σ_stab-информативность не гарантирует квадратичную стабилизацию (quadratic stabilization), что может ограничить практическое применение
Отсутствие анализа консервативности: Не количественно оценено, насколько априорное знание о стабилизируемости может сэкономить данные по сравнению с отсутствием априорных знаний
Неполнота доказательства необходимости: Доказательство необходимости в Theorem 10(b)-(d) зависит от (a), но необходимость самого (a) доказана сложно
Это высокачественная теоретическая работа в области управления, которая вносит важный вклад в область управления на основе данных. Основные достоинства:
Первое систематическое исследование свойств теории систем как априорных знаний
Раскрытие фундаментального различия между управляемостью и стабилизируемостью
Предоставление полных необходимых и достаточных условий и вычислимого метода
Основные недостатки — недостаточная экспериментальная проверка и отсутствие рассмотрения робастности к шуму.
Рекомендуемый рейтинг: ⭐⭐⭐⭐☆ (4/5)
Теоретическая глубина: ⭐⭐⭐⭐⭐
Практическая ценность: ⭐⭐⭐⭐
Полнота экспериментов: ⭐⭐⭐
Качество изложения: ⭐⭐⭐⭐⭐
Инновационность: ⭐⭐⭐⭐⭐
Подходит для публикации в ведущих журналах области управления (таких как IEEE TAC, Automatica), имеет важное справочное значение для исследователей в области управления на основе данных и теории систем.
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Фундаментальная работа по концепции информативности данных)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Первый метод ЛМН для стабилизации на основе данных)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Априорные знания об ограничениях параметров)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Теория структурной управляемости)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Теория квадратичной стабилизации)