2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic

データ駆動型安定化:安定化可能性と可制御性の事前知識を用いた手法

基本情報

  • 論文ID: 2510.25452
  • タイトル: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
  • 著者: Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels
  • 所属機関: グローニンゲン大学(Shakouri, van Waarde)、アイントホーフェン工科大学(Baltussen, Heemels)
  • 分類: math.OC(最適化と制御)、cs.SY、eess.SY(システムと制御)
  • 発表日時: arXiv v2、2025年10月30日
  • 論文リンク: https://arxiv.org/abs/2510.25452v2

概要

本論文は、システム理論的性質(特に安定化可能性と可制御性)を事前知識として活用する線形時不変(LTI)システムのデータ駆動型安定化問題を研究している。著者らはデータ情報性の概念を拡張し、データと事前知識に一致するすべてのシステムを安定化できるコントローラの存在を要求している。主な知見は以下の通りである:(1)システムが可制御である場合、この事前知識をデータ駆動型安定化の条件として用いても緩和効果がない;(2)システムが安定化可能である場合、この事前知識を用いることで事前知識がない場合より弱い必要十分条件が得られる。言い換えれば、基礎となるシステムが安定化可能であることが既知であれば、データ駆動型安定化がより容易に実現される。本論文はさらに線形行列不等式(LMI)に基づく新しいデータ駆動型制御設計手法を提供している。

研究背景と動機

解決すべき核心問題

本論文が解決する問題は以下の通りである:限定的なデータ条件下で、システムの安定化可能性または可制御性の事前知識を組み合わせて、安定化コントローラをいかに設計するか?

従来のデータ駆動型制御はシステムパラメータが完全に未知であることを仮定しているが、ほとんどの物理システムではこの仮定は過度に保守的である。実際には、物理量の範囲(質量、ばね定数など)やシステム構造から推論可能な可制御性/安定化可能性といった事前知識をしばしば保有している。

問題の重要性

  1. データ要件の削減:データから直接コントローラを設計する場合、持続的励起条件を満たすために大量のデータが必要となる可能性があるが、事前知識を組み合わせることでより少ないデータで安定化を実現できる可能性がある
  2. 実用的実現可能性:データのみからは安定化コントローラの設計が不可能な場合(例えば状態データのランク不足)でも、事前知識を加えることで設計が可能になる可能性がある
  3. 理論的完全性:可制御性と安定化可能性はシステム理論の基本概念であるが、データ駆動型フレームワークではまだ十分に研究されていない

既存手法の限界

  1. データ駆動型制御:既存の研究(De Persis & Tesi 2019、van Waarde et al. 2020)は主に事前知識がない場合を研究しており、厳密なデータ条件(持続的励起、状態データの満秩)を必要とする
  2. 事前知識の統合:既存研究はパラメータ範囲制約12-14または部分的既知パラメータ15に限定されており、システム理論的性質には及んでいない
  3. 非凸性の課題:安定化可能および可制御システムの集合は非凸であり、既存研究で考慮されている凸システム集合とは異なる

研究動機

多くの実用的応用では、システム構造から可制御性または安定化可能性を推論できる(構造的可制御性理論)が、このような事前知識はデータ駆動型制御ではまだ活用されていない。本論文はこの理論的空白を埋めるものである。

核心的貢献

本論文の主な貢献は以下の通りである:

  1. 理論的フレームワークの拡張:データ情報性の概念を事前知識を含むように拡張し、Σ_pk-情報性の定義を提案(定義3)
  2. 可制御性事前知識の等価性定理(定理5):可制御性を事前知識として用いることが事前知識がない場合と等価であることを証明、すなわち可制御性事前知識はデータ条件を緩和しない
  3. 安定化可能性事前知識の優位性定理(定理14、15):
    • 状態データが満秩(rank X⁻ = n)の場合、安定化可能性事前知識は追加の利益をもたらさない
    • 状態データがランク不足(rank X⁻ < n)の場合、安定化可能性事前知識は条件を大幅に緩和し、必要十分条件を与える
  4. 計算可能な設計手法(命題16):Σ_stab-情報性データから直接安定化コントローラを計算するLMIベースの手法を提供
  5. 理論的洞察:一見矛盾した現象を明らかにする——より強い性質(可制御性)は条件を緩和できないが、より弱い性質(安定化可能性)は緩和できる。これは、データに一致するすべてのシステムが可制御でない場合があるためである。

方法の詳細

タスク定義

システムモデル:離散時間LTIシステムを考える

x(t+1) = A_true x(t) + B_true u(t)

ここで x(t)∈ℝⁿ は状態、u(t)∈ℝᵐ は入力、システム行列(A_true, B_true)は未知である。

データ:時刻0からTまで収集した入力-状態データ

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

データ行列を定義する:

  • U⁻ = u(0),...,u(T-1)
  • X⁻ = x(0),...,x(T-1)
  • X⁺ = x(1),...,x(T)

データ一致システム集合

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

目標:すべての(A,B)∈Σ_D∩Σ_pkに対してA+BKがSchur安定(すべての固有値の絶対値が1未満)となるフィードバックゲインK∈ℝᵐˣⁿを見つけること

核心概念

定義3(安定化のためのΣ_pk-情報性): データDがΣ_pk-情報性を持つと呼ぶのは、K∈ℝᵐˣⁿが存在して、すべての(A,B)∈Σ_D∩Σ_pkに対してA+BKがSchur安定である場合である。

事前知識集合

  • Σ_cont:すべての可制御システム対の集合
  • Σ_stab:すべての安定化可能なシステム対の集合

事前知識としての可制御性(第III節)

定理5(核心的結果):(A_true, B_true)∈Σ_contと仮定すると、以下は等価である:

  • (a) データDはΣ_cont-情報性を持つ
  • (b) データDは情報性を持つ(事前知識なし)

証明の概要

  1. (b)⇒(a)は明らかに成立
  2. (a)⇒(b)の鍵:
    • Σ_D⊆Σ_contの場合、結論は明らかである
    • 不可制御な(Ā,B̄)∈Σ_Dが存在する場合、補題7(パラメータ化システム族がほぼすべての点で可制御)と補題9(行列束の安定性)を利用して、安定化Kが(Ā,B̄)も安定化することを証明する

主要補題

  • 補題7:(M,N)が可制御ならば、(M+αM₀, N+αN₀)は有限個のα値を除くすべてのαに対して可制御である
  • 補題9:M+δNがすべてのδ∈[ε,∞)\F(Fは有限)に対してSchurならば、Nはべき零であり、M+δNはすべてのδ∈ℝに対してSchurである

事前知識としての安定化可能性(第IV節)

A. 必要条件(定理10)

データがΣ_stab-情報性を持ちKが安定化ゲインである場合、以下が成立する:

  • (a) (A₀+B₀K)R(A,B) = {0} がすべての(A,B)∈Σ_D∩Σ_stabおよび(A₀,B₀)∈Σ⁰_Dに対して成立
  • (b) rank X⁻ < nの場合、imX⁻;U⁻ = im X⁻ × ℝᵐ
  • (c) im X⁺ ⊆ im X⁻
  • (d) im X⁻はA-不変であり、im Bを含む

注釈11:条件(a)は事前知識がない場合のA₀+B₀K=0の緩和版である;条件(b)-(d)はrank X⁻ = nの場合に自動的に満たされるが、ランク不足の場合は非自明である。

B. 満秩の場合(定理14)

定理14:(A_true,B_true)∈Σ_stabかつrank X⁻ = nの場合、以下が成立する:

  • Σ_stab-情報性 ⟺ 情報性(事前知識なし)

証明の概要

  1. 真のシステムが可制御な場合、定理5から結論が得られる
  2. 真のシステムが不可制御な場合、すべての(A,B)∈Σ_Dに対してA+BK̂ = A_true+B_true K̂となるK̂を構成し、後者がSchurであることを証明する

C. ランク不足の場合(定理15、核心的結果)

定理15:(A_true,B_true)∈Σ_stabかつrank X⁻ < nの場合、データDがΣ_stab-情報性を持つことと以下は等価である:

  • (a) im X⁺ ⊆ im X⁻
  • (b) imX⁻;U⁻ = im X⁻ × ℝᵐ

主要補題(補題17):条件(a)(b)が成立する場合、すべての(A,B)∈Σ_D∩Σ_stabに対して変換行列Sが以下を満たす:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

ここで(A₁₁,B₁)は安定化可能、A₂₂はSchur、かつA₁₁ B₁ = X̂⁺X̂⁻;U⁻

これはデータ駆動型のKalman分解を提供する。

コントローラ設計手法(命題16)

命題16:データがΣ_stab-情報性を持ちrank X⁻ = r < nの場合:

(a) Θ∈ℝᵀˣʳが存在してLMIが実行可能である:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) Θが(11)を満たす場合、K = K₁ K₂Sとすると、ここで:

  • K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  • K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾は任意 すべての(A,B)∈Σ_D∩Σ_stabに対してA+BKはSchurである

設計ステップ

  1. X⁻のQR分解を計算してSとX̂⁻を得る
  2. LMI (11)を解いてΘを得る
  3. K₁ = U⁻Θ(X̂⁻Θ)⁻¹を計算する
  4. K₂を任意に選択し、K = K₁ K₂Sを構成する

実験設定

数値例:3水槽システム

システム説明(図2):

  • 3つの直列水槽、流体は水槽3から水槽2を経由して水槽1へ流れる
  • 状態:x_iは水槽iの液位高さ(i=1,2,3)
  • 制御入力:uは水槽2と貯液池間の流速
  • 構造的特性:一方向流のため、x₃は不可制御

連続時間モデル

ẋ = A_c x + B_c u

ここで:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

離散化(サンプリング時間0.1秒):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

実験データ

開ループ実験(T=5):

t012345
u(t)10-101
x₁11.041.07781.10861.13341.1575
x₂22.04982.00151.85971.82371.8881
x₃000000

データ特性:rank X⁻ = 2 < 3(ランク不足)

求解プロセス

  1. MATLAB + YALMIP + MOSEKを用いてLMI (11)を求解
  2. Θ(5×2行列)を得る
  3. K₁ = -2.7728 -9.7123を計算
  4. K₂ = 0を選択し、K = -2.7728 -9.7123 0を得る

Monte Carlo実験

実験設定

  • 1000個のランダムシナリオ
  • 各シナリオ:t=0からt=100までシステムをシミュレート
  • 入力と初期条件はPoisson分布(λ=1)から独立にサンプリング
  • 異なるサンプル数T = 3, 4, 5, 10, 100の影響を分析

評価指標

  • システム同定情報性(rankX⁻ᵀ U⁻ᵀ = n+m)
  • 事前知識なしの安定化情報性
  • Σ_stab-安定化情報性

実験結果

主要結果(表I)

Tシステム同定情報性安定化情報性(事前知識なし)Σ_stab-安定化情報性
30%8.1%42%
462.4%63.2%99.4%
562.8%63.2%99.8%
1063.2%63.2%100%
10063.2%63.2%100%

主要な知見

  1. T=3時の顕著な優位性
    • システム同定が不可能(T < n+m)
    • 事前知識なし安定化は8.1%のデータのみ利用可能
    • Σ_stab-安定化は42%のデータが利用可能(5倍の向上)
  2. T≥4時の収束挙動
    • システム同定と事前知識なし安定化情報性は63.2%で安定
    • これはランダムデータの約36.8%が必要条件を満たさないためである
  3. T≥10時の完全カバレッジ
    • 100%のデータがΣ_stab-情報性を持つ
    • 安定化可能性事前知識の強力な効果を顕著に示す

ケース検証

与えられたT=5データに対して:

  • X⁻は満秩でなく、命題2が失効(事前知識なし安定化に利用不可)
  • しかし定理15の条件を満たす
  • LMIを成功裏に求解して安定化ゲインKを得る

関連研究

データ駆動型制御

  1. De Persis & Tesi (2019):データから直接安定化フィードバックを設計するLMI手法を初めて提案、持続的励起条件が必要
  2. van Waarde et al. (2020):データ情報性フレームワークを提案、必要十分条件を与え、唯一の同定を必要としない
  3. ノイズ環境:van Waarde et al. (2020)、Li et al. (2026)はノイズデータ下でのコントローラ合成を研究

データ駆動型制御における事前知識

  1. パラメータ範囲制約:Berberich et al. (2022)は線形分数表現の事前知識を研究
  2. 部分的既知パラメータ:Huang et al. (2025)は多項式システムの密度関数手法を研究
  3. 本論文の革新:システム理論的性質(可制御性/安定化可能性)を事前知識として初めて研究

システム同定における事前知識

  1. 安定性制約:van Gestel et al. (2002)、Lacy & Bernstein (2003)
  2. 固有値制約:Miller & De Callafon (2013)
  3. 正性/無受動性:De Santis & Farina (2002)、Goethals et al. (2003)
  4. 本論文の相違:コントローラ設計に焦点を当て、非凸事前知識集合を処理

構造的可制御性

Jia et al. (2020)等はシステム構造から可制御性を推論することを研究しており、本論文はこれらの構造情報をデータ駆動型制御に活用するための橋渡しと見なせる。

結論と議論

主要な結論

  1. 可制御性事前知識の無効性:システムが可制御であることが既知の場合、この事前知識はデータ駆動型安定化の条件を緩和できない(定理5)
  2. 安定化可能性事前知識の有効性
    • 状態データが満秩の場合は無益(定理14)
    • 状態データがランク不足の場合は条件を大幅に緩和(定理15)
  3. 反直感的現象:より強い性質(可制御性)は無益だが、より弱い性質(安定化可能性)は有益である——理由はデータに一致するすべてのシステムが不可制御である可能性があるためである
  4. 実用的設計手法:LMIベースの計算可能なコントローラ設計手法を提供(命題16)

理論的洞察

例4の示唆

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])
  • rank X⁻ = 1 < 2、データは情報性を持たない
  • しかしΣ_D∩Σ_stabのすべてのシステムはK=-1 0で安定化可能
  • 鍵:不可制御システムの自律部分βは安定(|β|<1)である必要がある

補題17の意義:システム行列を知ることなくデータ駆動型分解を提供:

  • 安定化可能部分:(A₁₁,B₁)はデータから直接復元可能
  • 安定な自律部分:A₂₂は安定化性に影響しない

限界

  1. ノイズなし仮定:現在の理論はノイズなしデータのみに適用、ノイズ環境への拡張は未解決問題
  2. オフラインデータ:完全なデータセットを事前に収集する必要があり、オンライン学習シナリオには不適切
  3. 線形システム:LTIシステムのみを考慮、非線形システムへの拡張は課題がある
  4. 二値事前知識:「安定化可能」または「不安定化可能」のみを考慮、到達可能部分空間の次元の上界などより細粒度の事前知識は未考慮
  5. Schur安定性:安定性のみを考慮、性能指標(H∞ノルムなど)は未考慮

今後の方向

  1. ノイズ鲁牢性:ノイズデータへの拡張、鲁牢制御技術(S-lemmaなど)の組み合わせが必要
  2. 到達可能部分空間次元界:「rank R(A,B) ≤ r」を事前知識とする場合の研究
  3. 性能最適化:安定化可能性事前知識と組み合わせた最適コントローラ設計(LQRなど)
  4. オンライン学習:適応アルゴリズムの開発、オンラインコントローラ更新
  5. 非線形拡張:双線形または多項式システムの類似理論の研究
  6. 実用的応用:ロボット工学、電力システムなど分野での方法の検証

深層的評価

利点

1. 理論的貢献の深さ

  • 非凸事前知識の処理:データ駆動型制御で非凸事前知識集合(安定化可能/可制御システム集合は非凸)を初めて処理、技術難度が高い
  • 必要十分条件:定理15はランク不足の場合の必要十分条件を与え、理論的に完全
  • 反直感的結果:可制御性は無益だが安定化可能性は有益という現象を明らかにし、深い洞察を提供

2. 証明技術の精緻さ

  • 補題7(パラメータ化可制御性):Kalman行列の多項式性を利用、可制御性が「ほぼすべての点」で成立することを証明、技術的に巧妙
  • 補題9(行列束分析):トレースの多項式性を通じてべき零性を導出、技術的に工夫されている
  • 補題17(データ駆動型分解):システム行列を知ることなく分解を実現、革新性が高い

3. 手法の実用性

  • LMI可解性:命題16は標準的な凸最適化問題を提供、既存ツールで求解可能
  • パラメータ自由度:K₂の任意性は設計の柔軟性を提供
  • 数値検証:3水槽の例は手法の有効性を明確に示す

4. 実験設計の合理性

  • Monte Carlo分析:1000シナリオの統計は十分
  • 多様なサンプル数分析:T=3から100への影響を系統的に研究
  • 物理システム:3水槽システムは実用的意義があり、構造的可制御性が明確

5. 執筆の明確さと厳密性

  • 定義が正確、定理の陳述が明確
  • 例(例4、6)は理解を助ける
  • 記号体系が一貫している

不足

1. 理論的限界

  • 注釈19の問題:Σ_stab-情報性は二次安定化(quadratic stabilization)を保証しない可能性があり、実用的応用を制限する可能性
  • 保守性分析の欠如:安定化可能性事前知識が事前知識なしと比べてどの程度データを節約できるかの定量化がない
  • 必要性証明の不完全性:定理10(b)-(d)の必要性証明は(a)に依存しており、(a)自体の必要性証明は複雑

2. 実験の不足

  • 単一ケース:3水槽システムのみ、多様性が不足(高次元システム、異なる構造など)
  • ノイズ比較なし:ノイズ環境下での手法の鲁牢性を比較していない
  • 計算複雑度分析なし:LMI求解の計算時間がn、Tとともにどう変化するか分析していない
  • 失敗ケース未提示:定理15の条件を満たさないデータの例を示していない

3. 手法の限界

  • K₂選択の指導なし:命題16(b)のK₂は任意だが、選択指針がない(性能最適化など)
  • データ効率比較なし:モデルベース手法とのデータ効率比較がない
  • 拡張性検討不足:多入力多出力(MIMO)システムの特殊な考慮がない

4. 関連研究との比較

  • 最新の深層強化学習手法との比較がない
  • 適応制御との関連性の議論がない
  • 鲁牢制御(μ-synthesis)との関連がない

5. 実用性の考慮

  • 事前知識の取得:実践でシステムの安定化可能性をいかに検証するか未議論(部分的同定が必要な可能性)
  • 失敗時の対応:LMI (11)が実行不可能な場合の対応がない
  • 閉ループデータ:開ループデータのみ考慮、閉ループデータは未考慮

影響力評価

領域への貢献

  1. 理論基礎:データ駆動型制御にシステム理論的性質を統合する基礎を確立、新研究方向を開拓
  2. 方法論:非凸事前知識を処理する技術は他のシステム性質(無受動性、正性など)に推広可能
  3. 橋渡し役:構造的可制御性理論とデータ駆動型制御を結合

実用的価値

  1. データ要件削減:Monte Carlo実験はデータ要件を1/5に削減可能(T=3時)を示す
  2. ランク不足対応:実践で一般的なランク不足データに対する解決策を提供
  3. 再現性:GitHubコード提供により再現性が高い

潜在的応用

  1. ロボット工学:関節が不可制御な場合の安定化制御
  2. 電力システム:発電機が部分的に不可制御な電力網の安定化
  3. プロセス制御:多水槽、熱交換器などの化学プロセス
  4. 航空宇宙:衛星姿勢制御(特定モードが不可制御だが安定化可能)

限界

  1. 理論的敷居の高さ:深い制御理論の背景が必要、普及を制限
  2. 実験検証の不足:実システム実験がなく、産業界の受け入れに疑問
  3. ノイズ感度:ノイズなし仮定が直接応用を制限

適用シナリオ

理想的シナリオ

  1. 構造既知システム:構造から安定化可能性を推論可能(ネットワーク化システムなど)
  2. ランク不足データ:初期条件によりX⁻がランク不足だがシステムは安定化可能
  3. 低データ環境:データ取得コストが高い(宇宙、医療など)
  4. 安全関键システム:理論的安定性保証が必要

不適用シナリオ

  1. 高ノイズ環境:現在の理論は不適用
  2. 非線形システム:他の手法が必要
  3. 時変システム:LTI仮定が不成立
  4. 厳密な性能要求:安定性のみ保証、性能は保証しない

改善提案

  1. 鲁牢手法との結合:有界ノイズ環境への拡張
  2. 性能最適化:安定化制約下でのLQR最適化
  3. オンライン更新:再帰的アルゴリズムの開発
  4. 実験検証:無人機、産業プロセスでの検証

総合評価

これは制御理論の高品質な理論論文であり、データ駆動型制御領域で重要な貢献をしている。主な強みは:

  1. システム理論的性質を事前知識として初めて系統的に研究
  2. 可制御性と安定化可能性の本質的な違いを明らかに
  3. 完全な必要十分条件と計算可能な手法を提供

主な不足は実験検証が十分でなく、ノイズ鲁牢性が未考慮である点である。

推奨指数:⭐⭐⭐⭐☆ (4/5)

  • 理論的深さ:⭐⭐⭐⭐⭐
  • 実用的価値:⭐⭐⭐⭐
  • 実験の充分性:⭐⭐⭐
  • 執筆品質:⭐⭐⭐⭐⭐
  • 革新性:⭐⭐⭐⭐⭐

制御領域の一流ジャーナル(IEEE TAC、Automatica)への掲載に適しており、データ駆動型制御とシステム理論の研究者にとって重要な参考価値がある。

参考文献(精選)

3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (データ情報性フレームワークの基礎的研究)

4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (初のデータ駆動型安定化LMI手法)

12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (パラメータ範囲事前知識)

25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (構造的可制御性理論)

27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (二次安定化理論)