2025-11-17T18:37:13.154009

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

DisarÃ², Valcher

The purpose of this paper is to propose a novel perspective, based on Willems' "behavior theory", on the design of an unknown-input observer for a given linear time-invariant discrete-time state-space model, with unknown disturbances affecting both the state and the output equations. The problem is first addressed assuming that the original system model is known, and later assuming that the model is unknown but historical data satisfying a certain assumption are available. In both cases, fundamental concepts in behavior theory, as the projection of a behavior, the inclusion of a behavior in another one, and the use of kernel and image representations, provide quite powerful tools to determine necessary and sufficient conditions for the existence of an unknown-input observer (UIO), as well as algorithms to design one of them, if it exists.

academic

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

基本信息

论文ID: 2407.18833
标题: Behaviors, trajectories and data: A novel perspective on the design of unknown-input observer
作者: Giorgia Disarò, Maria Elena Valcher (University of Padova)
分类: math.OC (Optimization and Control), math.DS (Dynamical Systems)
发表时间: 2024年7月26日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2407.18833

核心问题: 为受未知扰动影响的线性时不变离散时间系统设计未知输入观测器，其中扰动同时影响状态和输出方程
挑战性: 传统方法主要基于状态空间代数操作，缺乏统一的理论框架来处理模型已知和数据驱动两种场景

重要性分析

实际需求: 复杂系统中经常存在难以建模的扰动，需要在扰动存在的情况下估计系统状态
理论价值: 行为理论提供了比传统状态空间方法更一般化的框架
应用前景: 数据驱动方法避免了模型辨识步骤，在实际应用中更加高效

现有方法局限性

传统UIO设计: 主要基于状态空间代数操作，缺乏统一的理论框架
行为理论应用: 现有研究1,12,15中设计的观测器不保证因果性
数据驱动方法: 之前的工作3,4,11只考虑了扰动不影响输出的简化情况

核心贡献

理论创新: 首次将Willems行为理论系统性地应用于UIO设计，提供了新的理论视角
统一框架: 建立了模型已知和数据驱动两种场景下UIO设计的统一方法
充要条件: 基于行为理论导出了UIO存在性的新的充要条件，并证明其与经典条件等价
算法设计: 提供了基于数据直接设计UIO参数的代数算法
扩展应用: 处理了扰动同时影响状态和输出的更一般情况

方法详解

任务定义

考虑离散时间LTI系统Σ:

x(t+1) = Ax(t) + Bu(t) + Ed(t)    (1a)
y(t) = Cx(t) + Du(t) + Fd(t)      (1b)

其中：

x(t) ∈ ℝⁿ: 状态向量
u(t) ∈ ℝᵐ: 已知控制输入
y(t) ∈ ℝᵖ: 输出向量
d(t) ∈ ℝʳ: 未知输入(扰动)

设计UIO:

z(t+1) = A_UIO z(t) + B^u_UIO u(t) + B^y_UIO y(t)    (2a)
x̂(t) = z(t) + D^u_UIO u(t) + D^y_UIO y(t)            (2b)

行为理论基础

行为定义: 行为B ⊆ (ℝʷ)^ℤ₊ 是满足差分方程组的轨迹集合：

R(σ)w = 0

其中R(z) ∈ ℝz^(p×w)是多项式矩阵，σ是左移位算子。

核心概念:

行为投影: P_{w₁}B = {w₁ : ∃w₂ 使得 (w₁,w₂) ∈ B}
最小左零化子(MLA): 满足H(z)M(z) = 0的最小阶多项式矩阵
行为包含: B₁ ⊆ B₂ 的判定条件

基于行为的UIO设计

模型已知情况

系统行为表示:

B_Σ = ker(R_Σ(σ))

其中：

R_Σ(z) = [zI_n - A  -B   0   -E]
          [-C       -D   I_p -F]

UIO行为表示:

B_Σ̂ = ker(R_Σ̂(σ))

主要定理: 系统Σ̂是Σ的UIO当且仅当：

接受器条件: P_{(x,u,y)}B_Σ ⊆ P_{(x̂,u,y)}B_Σ̂
稳定性条件: A_UIO是Schur稳定的

设计条件: UIO存在的充要条件为存在矩阵满足：

[-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CE F] = [-E 0]     (10)
                                    [F  0]

A_UIO = A + [-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CA]    (11)
                                                [C ]

[B^u_UIO] = [I  -D^y_UIO C  -B^y_UIO][B]               (12)
[D^u_UIO]   [0  -D^y_UIO            ][D]

且A_UIO是Schur稳定的。

数据驱动方法

历史数据: 收集时间区间0,T-1的状态-输入-输出轨迹：

x_d = {x_d(t)}^{T-1}_
u_d = {u_d(t)}^{T-1}_
y_d = {y_d(t)}^{T-1}_

数据矩阵:

Φ_d = [X_p^T  X_f^T  U_p^T  U_f^T  Y_p^T  Y_f^T]^T ∈ ℝ^{2(n+m+p)×(T-1)}

兼容轨迹: 轨迹(x,u,y)与历史数据兼容当且仅当：

[x(t)    ]
[x(t+1)  ] ∈ Im(Φ_d), ∀t ∈ ℤ₊
[u(t)    ]
[u(t+1)  ]
[y(t)    ]
[y(t+1)  ]

主要结果: UIO存在当且仅当对于满足ker(V_p V_f W_p W_f R_p R_f) = Im(Φ_d)的任意矩阵，存在Ω使得：

Ω[V_p V_f] = [-A* I_n]

其中A*是Schur矩阵。

技术创新点

核表示方法: 使用多项式矩阵的核表示统一描述系统和观测器行为
投影技术: 通过行为投影消除不可观测变量(未知输入)
包含关系: 将接受器条件转化为行为包含关系，便于代数操作
数据参数化: 直接从数据矩阵构造UIO参数，避免中间建模步骤

实验设置

数值算例

考虑3阶系统：

A = [1  1 -1]    B = [-1]    E = [1]
    [2  1  1]        [1 ]        [0]
    [1  0 -1]        [1 ]        [1]

C = [1  1  0]    D = [2]    F = [1]
    [1 -1  1]        [1]        [1]

实现细节

时间窗口: T = 11
输入数据: u(t)在(-4,4)均匀分布，d(t)在(-3,3)均匀分布
初始条件: 随机生成

实验结果

设计过程

数据收集: 构造数据矩阵Φ_d
核计算: 确定满足条件(20)的矩阵Ψ
参数求解: 通过SVD分解求解方程(21)
稳定化: 选择L使得Ā + LC̄为Schur稳定

获得的UIO参数

A_UIO = [0.3721 -0.2326 -0.4651]
        [0.2791 -0.1744 -0.3488]  (特征值: 0, 0, 0.5)
        [0.5581 -0.3488 -0.6977]

B^u_UIO = [-2.9070]    B^y_UIO = [1.0930 -0.1860]
          [-0.1802]              [0.3198  0.1105]
          [-0.3605]              [0.6395  0.2209]

理论贡献: 成功将行为理论应用于UIO设计，建立了新的理论框架
方法统一: 在同一框架下解决了模型已知和数据驱动两种情况
条件等价: 证明了行为理论条件与经典代数条件的等价性
算法有效: 提供了可实现的设计算法并通过数值例子验证

局限性

数据假设: 需要状态在离线阶段可测，在实际应用中可能受限
扰动要求: 假设未知输入满足持续激励条件，实际中难以验证
计算复杂度: 对于高维系统，矩阵运算的计算负担较重
鲁棒性: 未考虑噪声和模型不确定性的影响

未来方向

鲁棒设计: 考虑测量噪声和模型不确定性
在线学习: 发展自适应UIO设计方法
非线性扩展: 将方法扩展到非线性系统
分布式观测: 研究多智能体系统的分布式UIO设计

深度评价

优点

理论创新性: 首次系统性地将行为理论应用于UIO设计，开辟了新的研究方向
方法完整性: 从理论分析到算法设计再到数值验证，形成完整的研究链条
统一框架: 在同一理论框架下处理模型已知和数据驱动两种场景
条件严格: 提供了严格的数学推导和充要条件
实用算法: 给出了可直接实施的代数设计步骤

不足

应用限制: 状态离线可测的假设在实际系统中可能难以满足
扰动假设: 未知输入的持续激励假设难以在实践中验证
计算效率: 对于大规模系统，矩阵运算可能成为计算瓶颈
鲁棒性缺失: 未考虑实际系统中普遍存在的噪声和不确定性

影响力

学术价值: 为控制理论提供了新的数学工具和分析视角
方法论贡献: 展示了行为理论在实际控制问题中的应用潜力
后续研究: 可能激发更多基于行为理论的控制系统设计研究
教学价值: 为理解数据驱动控制提供了良好的理论基础

适用场景

工业过程: 化工、电力等存在难建模扰动的工业系统
机器人系统: 需要在未知环境扰动下进行状态估计
航空航天: 飞行器在复杂环境中的导航和控制
网络系统: 通信网络中的状态监测和故障检测

参考文献

本文引用了24篇重要文献，主要包括：

行为理论基础:

20,21 J.C. Willems的开创性工作
18,22 行为系统理论的发展

观测器设计:

1,15 行为方法的观测器设计
2,13 经典UIO设计理论

数据驱动方法:

19 Willems基本引理
3,4,11 数据驱动UIO设计的前期工作

这些文献为本文的理论发展和方法比较提供了坚实基础。

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

基本信息

摘要

研究背景与动机

问题定义

重要性分析

现有方法局限性

核心贡献

方法详解

任务定义

行为理论基础

基于行为的UIO设计

模型已知情况

数据驱动方法

技术创新点

实验设置

数值算例

实现细节

实验结果

设计过程

获得的UIO参数

性能验证

相关工作

行为理论应用

UIO设计方法

本文优势

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献