In this paper we investigate a data-driven approach to the design of an unknown-input observer (UIO). Specifically, we provide necessary and sufficient conditions for the existence of an unknown-input observer for a discrete-time linear time-invariant (LTI) system, designed based only on some available data, obtained on a finite time window. We also prove that, under weak assumptions on the collected data, the solvability conditions derived by means of the data-driven approach are in fact equivalent to those obtained through the model-based one. In other words, the data-driven conditions do not impose further constraints with respect to the classic model-based ones, expressed in terms of the original system matrices.
論文ID : 2311.00673タイトル : On the equivalence of model-based and data-driven approaches to the design of unknown-input observers著者 : Giorgia Disarò, Maria Elena Valcher (パドヴァ大学、イタリア)分類 : math.DS (力学系)発表時期 : 2023年11月 (arXiv プレプリント)論文リンク : https://arxiv.org/abs/2311.00673 本論文は、未知入力オブザーバ(UIO)設計のデータ駆動法を研究している。具体的には、著者は離散時間線形時不変(LTI)システムに対して、有限時間窓データに基づくUIO設計の存在性に関する必要十分条件を提供している。同時に、収集データに対する弱い仮定の下で、データ駆動法から導出される可解条件が、実はモデルベース法から得られた条件と等価であることを証明している。言い換えれば、原システム行列で表現された古典的なモデルベース条件に対して、データ駆動条件は追加的な制約を課さない。
問題記述 : 多くの制御工学応用において、システムの内部状態を把握することは、状態フィードバック安定化と故障検出などの基本的な問題を解決するために重要である。しかし、システム状態は通常直接取得できず、状態ベクトルを推定するための適切なオブザーバを設計する必要がある。課題 : 実際のシステム動態は、しばしば干渉、測定誤差、または状態進化の識別に利用できない他の未知信号の影響を受ける。従来のオブザーバ設計はシステムモデルが既知であると仮定しているが、場合によっては、利用可能なデータのみではシステムを一意に識別できない。既存方法の限界 :モデルベース法はシステム行列が既知であることを必要とする 既存のデータ駆動法(例:18 )は十分条件のみを提供し、得られたシステムが漸近安定でない場合、UIoを設計できるかどうかが不明確である 研究動機 : 利用可能な大量のデータを活用して、制御工学問題を解決するためのデータ駆動技術を開発すること。特に、正確なシステムモデルが得られない場合の状態推定問題に対応すること。必要十分条件の提供 : データに基づくUIO存在性を検証するための検証可能な必要十分条件を提供完全なパラメータ化 : すべての候補UIoの完全なパラメータ化表現を提供等価性の証明 : 特定のデータ仮定の下で、データ駆動法の可解条件とモデルベース法の条件が完全に等価であることを証明理論的ブレークスルー : データ駆動法とモデルベース法の間に全単射対応関係を確立離散時間LTIシステムΣを考える:
x(t+1) = Ax(t) + Bu(t) + Ed(t) (1)
y(t) = Cx(t) (2)
ここで:
x(t) ∈ ℝⁿ: 状態ベクトル u(t) ∈ ℝᵐ: 既知制御入力 y(t) ∈ ℝᵖ: 出力ベクトル d(t) ∈ ℝʳ: 未知入力(例:干渉) UIO定義 : 以下の形式のLTIシステムΣ̂:
z(t+1) = A_UIO z(t) + B^u_UIO u(t) + B^y_UIO y(t) (3)
x̂(t) = z(t) + D_UIO y(t) (4)
推定誤差e(t) = x(t) - x̂(t)が初期条件と未知入力動態に依存せず漸近的にゼロに収束するようなもの。
必要十分条件 (定理2):UIoが存在するための必要十分条件は以下のいずれかが成立することである:
行列(A_UIO, B^u_UIO, B^y_UIO, D_UIO)が存在して以下を満たす:A_UIoはSchur安定 D_UIO CE = E B^u_UIO = (I - D_UIO C)B A_UIO(I - D_UIO C) + B^y_UIO C = (I - D_UIO C)A 行列条件:rank(CE) = rank(E) = r rankzIₙ - A -E; C 0 = n + r, ∀z ∈ ℂ, |z| ≥ 1 三つ組(A,E,C)は強*検出可能である データ組織 : 履歴データを行列形式に組織化:
Uₚ = uₐ(0) ... uₐ(T-2) ∈ ℝᵐˣ⁽ᵀ⁻¹⁾ Xₚ = xₐ(0) ... xₐ(T-2) ∈ ℝⁿˣ⁽ᵀ⁻¹⁾ Xf = xₐ(1) ... xₐ(T-1) ∈ ℝⁿˣ⁽ᵀ⁻¹⁾ Yₚ = yₐ(0) ... yₐ(T-2) ∈ ℝᵖˣ⁽ᵀ⁻¹⁾ Yf = yₐ(1) ... yₐ(T-1) ∈ ℝᵖˣ⁽ᵀ⁻¹⁾ 核心仮定 : 行列Uₚᵀ Dₚᵀ Xₚᵀ ᵀが完全行ランクm+r+nを有する。
主要結果 (定理9):以下の条件は等価である:
(3)-(4)の形式のUIoが存在してT_Σ ⊆ T_Σ̂ 行列T₁,T₂,T₃,T₄が存在してXf = [T₁ T₂ T₃ T₄]Uₚ; Yₚ; Yf; Xₚ かつT₄がSchur安定 データ条件:ker(Xf) ⊇ ker(Uₚ; Yₚ; Yf; Xₚ )かつrankzXₚ-Xf; Uₚ; Yₚ = n+m+r, ∀z∈ℂ,|z|≥1 三つ組(A,E,C)は強*検出可能である 等価性の確立 : データ駆動条件とモデルベース条件の完全な等価性を初めて厳密に証明全単射対応 : UIoパラメータ行列とデータ駆動パラメータ間の全単射関係を確立(系10)実用的アルゴリズム : 問題をより扱いやすい形式に変換する簡略化された計算方法を提供文献4 の例を使用:
A = [-1 -1 0; -1 0 0; 0 -1 -1]
C = [1 0 0; 0 0 1]
E = [-1; 0; 0]
時間窓:T = 20 未知入力:(-2,2)区間内で均一にランダム生成 初期条件:ランダムに選択 干渉:(-10,10)区間内でランダム生成 文献18 で提案された方法との比較
モデル検証 : rank(CE) = rank(E) = rと強*検出可能性条件を検証データ駆動設計 : データから行列Cを正常に再構成し、定理9の条件を検証性能比較 :
本論文の方法で得られたA_UIO行列は冪零行列 文献18 の方法で得られた固有値は{0, 0, -0.2} 両方法とも機能するが、本論文の方法は収束速度の選択を許可 図1は状態推定誤差の動態を示す:
実線(黒色):本論文の設計方法 破線(赤色):文献18 の方法 両方法とも漸近収束を実現するが、本論文の方法はより多くの設計自由度を提供 データ駆動条件はUIoの存在性を正しく識別できる 完全なパラメータ化は望ましい収束特性の選択を許可 データが仮定条件を満たす場合、データ駆動法は追加的な制約を導入しない Luenbergerオブザーバ理論12,13 未知入力分離法9,11,21 幾何学的方法2 と一般化逆行列法15 特異値分解技術6 二段階法:まずシステム同定、次にオブザーバ設計 一段階法:同定段階を回避して直接データを利用18 データ駆動シミュレーションと制御14 既存研究と比較して、本論文は初めて両方法の理論的等価性を確立し、完全なパラメータ化ソリューションを提供している。
弱いデータ仮定の下で、データ駆動UIo設計条件はモデルベース条件と完全に等価である データ駆動法は追加的な制約を導入しない すべての可能なUIoの完全なパラメータ化を提供 理論的橋梁を確立し、両設計パラダイムを統一 履歴状態測定データが必要(実験室環境では実行可能) 未知入力の次元が既知であることを要求 データの完全行ランク仮定に依存 線形時不変システムにのみ適用可能 非線形システムへの拡張 時変システムの場合を考慮 ノイズを含むデータの堅牢性を研究 実用的応用のためのアルゴリズム実装を開発 理論的貢献が顕著 : データ駆動法とモデルベース法の等価性を初めて厳密に証明数学的厳密性 : 完全な必要十分条件と厳密な数学的証明を提供実用的価値 : 検証可能なデータ条件と実用的アルゴリズムを提供完全性 : 単一の解ではなく、すべてのUIoのパラメータ化を提供明確な記述 : 論理構造が明確で、技術的詳細が充分仮定の制限 : 状態測定データの仮定は実際には比較的厳しい線形性の制限 : 線形システムのみに適用可能で、応用範囲が限定される数値検証が限定的 : 数値例が1つのみ堅牢性分析の欠落 : データノイズとモデリング誤差の影響を考慮していない理論的意義 : データ駆動制御理論に重要な理論的基礎を提供実用的価値 : 工学応用に実行可能な設計方法を提供研究への示唆 : 他のオブザーバ設計問題に新しい研究思想を提供再現性 : 明確なアルゴリズムステップを提供し、再現を容易にするシステムモデルが未知だが履歴状態データが利用可能なシーン 未知干渉を処理する必要がある状態推定問題 離散時間線形制御システムのオブザーバ設計 故障検出と診断応用 論文は観測器理論、データ駆動制御、システム同定などの関連分野の重要な研究を含む24篇の関連文献を引用しており、研究に堅実な理論的基礎を提供している。
総合評価 : これは高品質な理論論文であり、データ駆動オブザーバ設計分野で重要な貢献をしている。実用的応用にいくつかの制限があるが、その理論的価値と分野発展への推進力は肯定する価値がある。