2025-11-17T18:37:13.154009

Behaviors, trajectories and data: A novel perspective on the design of unknown-input observers

Disarò, Valcher
The purpose of this paper is to propose a novel perspective, based on Willems' "behavior theory", on the design of an unknown-input observer for a given linear time-invariant discrete-time state-space model, with unknown disturbances affecting both the state and the output equations. The problem is first addressed assuming that the original system model is known, and later assuming that the model is unknown but historical data satisfying a certain assumption are available. In both cases, fundamental concepts in behavior theory, as the projection of a behavior, the inclusion of a behavior in another one, and the use of kernel and image representations, provide quite powerful tools to determine necessary and sufficient conditions for the existence of an unknown-input observer (UIO), as well as algorithms to design one of them, if it exists.
academic

行動、軌跡およびデータ:未知入力オブザーバー設計への新しい視点

基本情報

  • 論文ID: 2407.18833
  • タイトル: Behaviors, trajectories and data: A novel perspective on the design of unknown-input observer
  • 著者: Giorgia Disarò, Maria Elena Valcher (パドヴァ大学)
  • 分類: math.OC (最適化と制御)、math.DS (力学系)
  • 発表日: 2024年7月26日 (arXiv プレプリント)
  • 論文リンク: https://arxiv.org/abs/2407.18833

要約

本論文はWillemsの「行動理論」(behavior theory)に基づいて、未知入力オブザーバー(UIO)の設計に対する新しい視点を提案している。これは、未知の外乱の影響を受ける状態方程式と出力方程式を持つ線形時不変離散時間状態空間モデルに適用される。研究はまず元のシステムモデルが既知である場合を想定し、その後、モデルは未知であるが特定の仮定を満たす履歴データが利用可能な場合に拡張される。両方の場合において、行動理論の基本概念(行動投影、行動包含関係、核および像表現など)は、UIO存在の必要十分条件を決定し、設計アルゴリズムを提供するための強力なツールとなる。

研究背景と動機

問題定義

  1. 中核的問題: 未知の外乱の影響を受ける線形時不変離散時間システムに対して未知入力オブザーバーを設計すること。ここで外乱は状態方程式と出力方程式の両方に影響を与える
  2. 課題: 従来の方法は主に状態空間代数操作に基づいており、モデル既知とデータ駆動の両シナリオを処理するための統一的な理論フレームワークが不足している

重要性分析

  • 実際的必要性: 複雑なシステムにおいて、モデル化が困難な外乱がしばしば存在し、外乱の存在下でシステム状態を推定する必要がある
  • 理論的価値: 行動理論は従来の状態空間法よりも一般化されたフレームワークを提供する
  • 応用の見通し: データ駆動法はモデル同定ステップを回避し、実際の応用においてより効率的である

既存方法の限界

  1. 従来のUIO設計: 主に状態空間代数操作に基づいており、統一的な理論フレームワークが不足している
  2. 行動理論の応用: 既存研究1,12,15で設計されたオブザーバーは因果性を保証しない
  3. データ駆動法: 以前の研究3,4,11は外乱が出力に影響しない簡略化された場合のみを考慮していた

核心的貢献

  1. 理論的革新: Willems行動理論をUIO設計に初めて体系的に適用し、新しい理論的視点を提供する
  2. 統一フレームワーク: モデル既知とデータ駆動の両シナリオ下でのUIO設計の統一的方法を確立する
  3. 必要十分条件: 行動理論に基づいてUIO存在性の新しい必要十分条件を導出し、古典的条件との等価性を証明する
  4. アルゴリズム設計: データから直接UIOパラメータを設計するための代数的アルゴリズムを提供する
  5. 応用の拡張: 外乱が状態方程式と出力方程式の両方に影響する、より一般的な場合を処理する

方法の詳細

タスク定義

離散時間LTIシステムΣを考える:

x(t+1) = Ax(t) + Bu(t) + Ed(t)    (1a)
y(t) = Cx(t) + Du(t) + Fd(t)      (1b)

ここで:

  • x(t) ∈ ℝⁿ: 状態ベクトル
  • u(t) ∈ ℝᵐ: 既知の制御入力
  • y(t) ∈ ℝᵖ: 出力ベクトル
  • d(t) ∈ ℝʳ: 未知入力(外乱)

UIObを設計する:

z(t+1) = A_UIO z(t) + B^u_UIO u(t) + B^y_UIO y(t)    (2a)
x̂(t) = z(t) + D^u_UIO u(t) + D^y_UIO y(t)            (2b)

行動理論の基礎

行動の定義: 行動B ⊆ (ℝʷ)^ℤ₊ は差分方程式系を満たす軌跡の集合である:

R(σ)w = 0

ここでR(z) ∈ ℝz^(p×w)は多項式行列、σは左シフト作用素である。

核心的概念:

  1. 行動投影: P_{w₁}B = {w₁ : ∃w₂ such that (w₁,w₂) ∈ B}
  2. 最小左零化子(MLA): H(z)M(z) = 0を満たす最小次数の多項式行列
  3. 行動包含: B₁ ⊆ B₂の判定条件

行動に基づくUIO設計

モデル既知の場合

システム行動表現:

B_Σ = ker(R_Σ(σ))

ここで:

R_Σ(z) = [zI_n - A  -B   0   -E]
          [-C       -D   I_p -F]

UIO行動表現:

B_Σ̂ = ker(R_Σ̂(σ))

主要定理: システムΣ̂がΣのUIObである必要十分条件は:

  1. 受容器条件: P_{(x,u,y)}B_Σ ⊆ P_{(x̂,u,y)}B_Σ̂
  2. 安定性条件: A_UIObはSchur安定である

設計条件: UIObが存在するための必要十分条件は、以下を満たす行列が存在することである:

[-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CE F] = [-E 0]     (10)
                                    [F  0]

A_UIO = A + [-D^y_UIO  A_UIO D^y_UIO - B^y_UIO][CA]    (11)
                                                [C ]

[B^u_UIO] = [I  -D^y_UIO C  -B^y_UIO][B]               (12)
[D^u_UIO]   [0  -D^y_UIO            ][D]

かつA_UIObはSchur安定である。

データ駆動法

履歴データ: 時間区間0,T-1における状態-入力-出力軌跡を収集する:

  • x_d = {x_d(t)}^{T-1}_
  • u_d = {u_d(t)}^{T-1}_
  • y_d = {y_d(t)}^{T-1}_

データ行列:

Φ_d = [X_p^T  X_f^T  U_p^T  U_f^T  Y_p^T  Y_f^T]^T ∈ ℝ^{2(n+m+p)×(T-1)}

互換軌跡: 軌跡(x,u,y)が履歴データと互換である必要十分条件は:

[x(t)    ]
[x(t+1)  ] ∈ Im(Φ_d), ∀t ∈ ℤ₊
[u(t)    ]
[u(t+1)  ]
[y(t)    ]
[y(t+1)  ]

主要結果: UIObが存在する必要十分条件は、ker(V_p V_f W_p W_f R_p R_f) = Im(Φ_d)を満たす任意の行列に対して、以下を満たすΩが存在することである:

Ω[V_p V_f] = [-A* I_n]

ここでA*はSchur行列である。

技術的革新点

  1. 核表現法: 多項式行列の核表現を使用してシステムとオブザーバー行動を統一的に記述する
  2. 投影技術: 行動投影を通じて観測不可能な変数(未知入力)を消去する
  3. 包含関係: 受容器条件を行動包含関係に変換し、代数操作を容易にする
  4. データパラメータ化: データ行列から直接UIObパラメータを構築し、中間的なモデル化ステップを回避する

実験設定

数値例

3次システムを考える:

A = [1  1 -1]    B = [-1]    E = [1]
    [2  1  1]        [1 ]        [0]
    [1  0 -1]        [1 ]        [1]

C = [1  1  0]    D = [2]    F = [1]
    [1 -1  1]        [1]        [1]

実装の詳細

  • 時間ウィンドウ: T = 11
  • 入力データ: u(t)は(-4,4)上の一様分布、d(t)は(-3,3)上の一様分布
  • 初期条件: ランダムに生成

実験結果

設計プロセス

  1. データ収集: データ行列Φ_dを構築する
  2. 核計算: 条件(20)を満たす行列Ψを決定する
  3. パラメータ求解: SVD分解を通じて方程式(21)を解く
  4. 安定化: Ā + LC̄がSchur安定となるようにLを選択する

得られたUIObパラメータ

A_UIO = [0.3721 -0.2326 -0.4651]
        [0.2791 -0.1744 -0.3488]  (固有値: 0, 0, 0.5)
        [0.5581 -0.3488 -0.6977]

B^u_UIO = [-2.9070]    B^y_UIO = [1.0930 -0.1860]
          [-0.1802]              [0.3198  0.1105]
          [-0.3605]              [0.6395  0.2209]

性能検証

状態推定誤差は約20時間ステップ内でゼロに収束し、UIObの有効性を検証した。

関連研究

行動理論の応用

  • Willemsの基礎研究20,21: 行動理論フレームワークの確立
  • オブザーバー設計1,12,15: 行動フレームワーク下のオブザーバー設計だが因果性を保証しない
  • データ駆動制御6,7,8: Willemsの基本補題に基づくデータ駆動法

UIO設計法

  • 古典的方法2,13: 状態空間代数に基づくUIO設計
  • データ駆動UIO3,4,11: 外乱が出力に影響しない簡略化された場合のみを考慮

本論文の利点

  1. 理論の統一: モデルとデータ駆動法の統一フレームワークを提供する
  2. 条件の完全性: 外乱が状態方程式と出力方程式の両方に影響する一般的な場合を処理する
  3. アルゴリズムの簡潔性: 直接的な代数設計アルゴリズムを提供する

結論と考察

主要な結論

  1. 理論的貢献: 行動理論をUIO設計に成功裏に適用し、新しい理論フレームワークを確立した
  2. 方法の統一: 同一フレームワーク下でモデル既知とデータ駆動の両方の場合を解決した
  3. 条件の等価性: 行動理論的条件と古典的代数条件の等価性を証明した
  4. アルゴリズムの有効性: 実現可能な設計アルゴリズムを提供し、数値例で検証した

限界

  1. データ仮定: オフライン段階で状態が測定可能である必要があり、実際の応用では制限される可能性がある
  2. 外乱要件: 未知入力が持続的励起条件を満たすと仮定しており、実際には検証が困難である
  3. 計算複雑性: 高次元システムの場合、行列演算の計算負担が大きい
  4. ロバスト性: 測定ノイズとモデル不確実性の影響を考慮していない

今後の方向性

  1. ロバスト設計: 測定ノイズとモデル不確実性を考慮する
  2. オンライン学習: 適応的UIO設計法を開発する
  3. 非線形拡張: 方法を非線形システムに拡張する
  4. 分散オブザーバー: マルチエージェントシステムの分散UIO設計を研究する

深い評価

利点

  1. 理論的革新性: 行動理論をUIO設計に初めて体系的に適用し、新しい研究方向を開拓した
  2. 方法の完全性: 理論分析からアルゴリズム設計、数値検証まで、完全な研究チェーンを形成している
  3. 統一フレームワーク: 同一の理論フレームワーク下でモデル既知とデータ駆動の両シナリオを処理する
  4. 条件の厳密性: 厳密な数学的導出と必要十分条件を提供する
  5. 実用的アルゴリズム: 直接実装可能な代数設計ステップを提供する

不足点

  1. 応用の制限: 状態がオフラインで測定可能という仮定は、実際のシステムでは満たしにくい可能性がある
  2. 外乱仮定: 未知入力の持続的励起仮定は実践では検証困難である
  3. 計算効率: 大規模システムの場合、行列演算が計算ボトルネックになる可能性がある
  4. ロバスト性の欠如: 実際のシステムに普遍的に存在するノイズと不確実性を考慮していない

影響力

  1. 学術的価値: 制御理論に新しい数学的ツールと分析視点を提供する
  2. 方法論的貢献: 実際の制御問題における行動理論の応用可能性を示す
  3. 後続研究: 行動理論に基づくより多くの制御システム設計研究を刺激する可能性がある
  4. 教育的価値: データ駆動制御の理解のための良好な理論的基礎を提供する

適用シーン

  1. 産業プロセス: 化学、電力など、モデル化困難な外乱が存在する産業システム
  2. ロボットシステム: 未知の環境外乱下での状態推定が必要なロボット
  3. 航空宇宙: 複雑な環境における航空機の航法と制御
  4. ネットワークシステム: 通信ネットワークの状態監視と故障検出

参考文献

本論文は24篇の重要な文献を引用しており、主に以下を含む:

行動理論の基礎:

  • 20,21 J.C. Willemsの開拓的研究
  • 18,22 行動システム理論の発展

オブザーバー設計:

  • 1,15 行動法によるオブザーバー設計
  • 2,13 古典的UIO設計理論

データ駆動法:

  • 19 Willemsの基本補題
  • 3,4,11 データ駆動UIO設計の先行研究

これらの文献は本論文の理論発展と方法比較のための堅実な基礎を提供している。