2025-11-17T18:37:13.154009

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

DisarÃ², Valcher

The purpose of this paper is to propose a novel perspective, based on Willems' "behavior theory", on the design of an unknown-input observer for a given linear time-invariant discrete-time state-space model, with unknown disturbances affecting both the state and the output equations. The problem is first addressed assuming that the original system model is known, and later assuming that the model is unknown but historical data satisfying a certain assumption are available. In both cases, fundamental concepts in behavior theory, as the projection of a behavior, the inclusion of a behavior in another one, and the use of kernel and image representations, provide quite powerful tools to determine necessary and sufficient conditions for the existence of an unknown-input observer (UIO), as well as algorithms to design one of them, if it exists.

academic

Поведения, траектории и данные: Новый взгляд на проектирование наблюдателей с неизвестным входом

Основная информация

ID статьи: 2407.18833
Название: Behaviors, trajectories and data: A novel perspective on the design of unknown-input observer
Авторы: Giorgia Disarò, Maria Elena Valcher (Университет Падуи)
Классификация: math.OC (Оптимизация и управление), math.DS (Динамические системы)
Дата публикации: 26 июля 2024 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2407.18833

Аннотация

В данной работе на основе теории поведения Виллемса предлагается новый подход к проектированию наблюдателей с неизвестным входом (UIO) для линейных стационарных дискретных систем в пространстве состояний, подверженных неизвестным возмущениям в уравнениях состояния и выхода. Исследование сначала предполагает известность исходной модели системы, а затем расширяется на случай неизвестной модели с историческими данными, удовлетворяющими определённым условиям. В обоих случаях фундаментальные концепции теории поведения (такие как проекция поведения, отношения включения поведений, ядро и образные представления) предоставляют мощные инструменты для определения необходимых и достаточных условий существования UIO и разработки алгоритмов проектирования.

Исследовательский контекст и мотивация

Определение проблемы

Основная задача: Проектирование наблюдателя с неизвестным входом для линейной стационарной дискретной системы, подверженной неизвестным возмущениям, одновременно влияющим на уравнения состояния и выхода
Сложность: Традиционные методы основаны на алгебраических операциях в пространстве состояний и не предоставляют единой теоретической базы для обработки как известных моделей, так и сценариев, управляемых данными

Анализ значимости

Практическая потребность: В сложных системах часто присутствуют возмущения, которые сложно моделировать, требуется оценка состояния системы при наличии возмущений
Теоретическая ценность: Теория поведения предоставляет более общую базу по сравнению с традиционными методами пространства состояний
Перспективы применения: Методы, управляемые данными, избегают этапа идентификации модели и более эффективны в практических приложениях

Ограничения существующих методов

Традиционное проектирование UIO: Основано на алгебраических операциях в пространстве состояний, не имеет единой теоретической базы
Применение теории поведения: В существующих исследованиях 1,12,15 спроектированные наблюдатели не гарантируют причинность
Методы, управляемые данными: Предыдущие работы 3,4,11 рассматривали только упрощённый случай, когда возмущения не влияют на выход

Основные вклады

Теоретическое инновация: Первое систематическое применение теории поведения Виллемса к проектированию UIO, предоставляющее новую теоретическую перспективу
Единая база: Установление единого метода проектирования UIO для сценариев как с известной моделью, так и управляемых данными
Необходимые и достаточные условия: Вывод новых необходимых и достаточных условий существования UIO на основе теории поведения с доказательством их эквивалентности классическим условиям
Проектирование алгоритма: Предоставление алгебраического алгоритма для прямого проектирования параметров UIO на основе данных
Расширенное применение: Обработка более общего случая, когда возмущения одновременно влияют на состояние и выход

Подробное описание методов

Определение задачи

Рассмотрим дискретную систему LTI Σ:

x(t+1) = Ax(t) + Bu(t) + Ed(t)    (1a)
y(t) = Cx(t) + Du(t) + Fd(t)      (1b)

где:

x(t) ∈ ℝⁿ: вектор состояния
u(t) ∈ ℝᵐ: известный управляющий вход
y(t) ∈ ℝᵖ: вектор выхода
d(t) ∈ ℝʳ: неизвестный вход (возмущение)

Проектирование UIO:

z(t+1) = A_UIO z(t) + B^u_UIO u(t) + B^y_UIO y(t)    (2a)
x̂(t) = z(t) + D^u_UIO u(t) + D^y_UIO y(t)            (2b)

Основы теории поведения

Определение поведения: Поведение B ⊆ (ℝʷ)^ℤ₊ — это множество траекторий, удовлетворяющих системе разностных уравнений:

R(σ)w = 0

где R(z) ∈ ℝz^(p×w) — полиномиальная матрица, σ — оператор левого сдвига.

Основные концепции:

Проекция поведения: P_{w₁}B = {w₁ : ∃w₂ такой что (w₁,w₂) ∈ B}
Минимальный левый аннулятор (MLA): Минимальная по порядку полиномиальная матрица, удовлетворяющая H(z)M(z) = 0
Включение поведения: Условие для определения B₁ ⊆ B₂

Проектирование UIO на основе поведения

Случай известной модели

Представление поведения системы:

B_Σ = ker(R_Σ(σ))

где:

R_Σ(z) = [zI_n - A  -B   0   -E]
          [-C       -D   I_p -F]

Представление поведения UIO:

B_Σ̂ = ker(R_Σ̂(σ))

Основная теорема: Система Σ̂ является UIO для Σ тогда и только тогда, когда:

Условие приёмника: P_{(x,u,y)}B_Σ ⊆ P_{(x̂,u,y)}B_Σ̂
Условие стабильности: A_UIO является устойчивой по Шуру

Условия проектирования: UIO существует тогда и только тогда, когда существуют матрицы, удовлетворяющие:

[-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CE F] = [-E 0]     (10)
                                    [F  0]

A_UIO = A + [-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CA]    (11)
                                                [C ]

[B^u_UIO] = [I  -D^y_UIO C  -B^y_UIO][B]               (12)
[D^u_UIO]   [0  -D^y_UIO            ][D]

и A_UIO является устойчивой по Шуру.

Метод, управляемый данными

Исторические данные: Сбор траекторий состояния-входа-выхода на временном интервале 0,T-1:

x_d = {x_d(t)}^{T-1}_
u_d = {u_d(t)}^{T-1}_
y_d = {y_d(t)}^{T-1}_

Матрица данных:

Φ_d = [X_p^T  X_f^T  U_p^T  U_f^T  Y_p^T  Y_f^T]^T ∈ ℝ^{2(n+m+p)×(T-1)}

Совместимые траектории: Траектория (x,u,y) совместима с историческими данными тогда и только тогда, когда:

[x(t)    ]
[x(t+1)  ] ∈ Im(Φ_d), ∀t ∈ ℤ₊
[u(t)    ]
[u(t+1)  ]
[y(t)    ]
[y(t+1)  ]

Основной результат: UIO существует тогда и только тогда, когда для любых матриц, удовлетворяющих ker(V_p V_f W_p W_f R_p R_f) = Im(Φ_d), существует Ω такой что:

Ω[V_p V_f] = [-A* I_n]

где A* — матрица, устойчивая по Шуру.

Технические инновации

Метод ядерного представления: Использование ядра полиномиальных матриц для единого описания поведения системы и наблюдателя
Техника проекции: Исключение ненаблюдаемых переменных (неизвестных входов) через проекцию поведения
Отношения включения: Преобразование условия приёмника в отношение включения поведений для удобства алгебраических операций
Параметризация данных: Прямое построение параметров UIO из матрицы данных, избегая промежуточного этапа моделирования

Экспериментальная установка

Численный пример

Рассмотрим систему третьего порядка:

A = [1  1 -1]    B = [-1]    E = [1]
    [2  1  1]        [1 ]        [0]
    [1  0 -1]        [1 ]        [1]

C = [1  1  0]    D = [2]    F = [1]
    [1 -1  1]        [1]        [1]

Детали реализации

Временное окно: T = 11
Данные входа: u(t) равномерно распределены на (-4,4), d(t) равномерно распределены на (-3,3)
Начальные условия: случайно сгенерированы

Результаты экспериментов

Процесс проектирования

Сбор данных: Построение матрицы данных Φ_d
Вычисление ядра: Определение матриц, удовлетворяющих условию (20)
Решение параметров: Решение уравнения (21) через разложение по сингулярным значениям
Стабилизация: Выбор L такого, что Ā + LC̄ устойчива по Шуру

Полученные параметры UIO

A_UIO = [0.3721 -0.2326 -0.4651]
        [0.2791 -0.1744 -0.3488]  (собственные значения: 0, 0, 0.5)
        [0.5581 -0.3488 -0.6977]

B^u_UIO = [-2.9070]    B^y_UIO = [1.0930 -0.1860]
          [-0.1802]              [0.3198  0.1105]
          [-0.3605]              [0.6395  0.2209]

Фундаментальные работы Виллемса 20,21: Установление базы теории поведения
Проектирование наблюдателей 1,12,15: Проектирование наблюдателей в рамках теории поведения, но без гарантии причинности
Управление, управляемое данными 6,7,8: Методы, управляемые данными, на основе фундаментальной леммы Виллемса

Методы проектирования UIO

Классические методы 2,13: Проектирование UIO на основе алгебры пространства состояний
UIO, управляемый данными 3,4,11: Только упрощённый случай, когда возмущения не влияют на выход

Преимущества данной работы

Теоретическая унификация: Предоставление единой базы для методов, основанных на модели и управляемых данными
Полнота условий: Обработка общего случая, когда возмущения влияют на состояние и выход одновременно
Простота алгоритма: Предоставление прямого алгебраического алгоритма проектирования

Заключение и обсуждение

Основные выводы

Теоретический вклад: Успешное применение теории поведения к проектированию UIO, установление новой теоретической базы
Унификация методов: Решение как случаев с известной моделью, так и управляемых данными в единой базе
Эквивалентность условий: Доказательство эквивалентности условий теории поведения и классических алгебраических условий
Эффективность алгоритма: Предоставление реализуемого алгоритма проектирования и его проверка численными примерами

Ограничения

Предположения о данных: Требование измеримости состояния на автономном этапе может быть ограничивающим в практических приложениях
Требования к возмущениям: Предположение о постоянной возбуждаемости неизвестного входа сложно проверить на практике
Вычислительная сложность: Для высокомерных систем вычислительная нагрузка матричных операций может быть значительной
Отсутствие робастности: Не рассматриваются шум измерений и неопределённость модели

Направления будущих исследований

Робастное проектирование: Учёт шума измерений и неопределённости модели
Онлайн-обучение: Разработка методов адаптивного проектирования UIO
Расширение на нелинейные системы: Распространение методов на нелинейные системы
Распределённое наблюдение: Исследование распределённого проектирования UIO для многоагентных систем

Глубокая оценка

Преимущества

Теоретическая новизна: Первое систематическое применение теории поведения к проектированию UIO, открывающее новое направление исследований
Полнота методов: От теоретического анализа к разработке алгоритмов и численной проверке, формирующие полную цепь исследований
Единая база: Обработка как сценариев с известной моделью, так и управляемых данными в единой теоретической базе
Строгие условия: Предоставление строгих математических выводов и необходимых и достаточных условий
Практические алгоритмы: Предоставление алгебраических шагов проектирования, которые можно непосредственно реализовать

Недостатки

Ограничения применения: Предположение об измеримости состояния на автономном этапе может быть сложно удовлетворить в реальных системах
Предположения о возмущениях: Предположение о постоянной возбуждаемости неизвестного входа сложно проверить на практике
Вычислительная эффективность: Для крупномасштабных систем матричные операции могут стать узким местом
Отсутствие робастности: Не рассматриваются шум и неопределённость, которые широко распространены в реальных системах

Влияние

Академическая ценность: Предоставление новых математических инструментов и аналитических перспектив для теории управления
Методологический вклад: Демонстрация потенциала применения теории поведения к практическим задачам управления
Последующие исследования: Возможность стимулирования дальнейших исследований в области управления системами на основе теории поведения
Образовательная ценность: Предоставление хорошей теоретической базы для понимания управления, управляемого данными

Применимые сценарии

Промышленные процессы: Химические, энергетические и другие промышленные системы с трудно моделируемыми возмущениями
Робототехнические системы: Требующие оценки состояния при наличии неизвестных возмущений окружающей среды
Аэрокосмические системы: Навигация и управление летательных аппаратов в сложных условиях окружающей среды
Сетевые системы: Мониторинг состояния и обнаружение неисправностей в коммуникационных сетях

Список литературы

Данная работа ссылается на 24 важные публикации, включая:

Основы теории поведения:

20,21 Пионерские работы J.C. Willems
18,22 Развитие теории поведения систем

Проектирование наблюдателей:

1,15 Проектирование наблюдателей методом поведения
2,13 Классическая теория проектирования UIO

Методы, управляемые данными:

19 Фундаментальная лемма Виллемса
3,4,11 Предыдущие работы по проектированию UIO, управляемому данными

Эти источники предоставляют прочную базу для теоретического развития и сравнения методов в данной работе.