2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.
This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
academic

マトリックスS-手順を用いたデータ駆動型構造化コントローラ設計

基本情報

  • 論文ID: 2503.14949
  • タイトル: Data-Driven Structured Controller Design Using the Matrix S-Procedure
  • 著者: Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi
  • 分類: math.OC(数学最適化と制御)
  • 発表日時: 2025年10月14日(Automaticaに投稿されたプレプリント)
  • 論文リンク: https://arxiv.org/abs/2503.14949

要約

本論文は、H2H_2性能とHH_\infty性能を考慮した離散時間線形時不変(LTI)システムのデータ駆動型最適構造化コントローラ設計に焦点を当てている。具体的には3つのシナリオを研究する:(i)モデルベースの構造化制御、(ii)データ駆動型の非構造化制御、(iii)データ駆動型の構造化制御。H2H_2性能については、シナリオ(ii)と(iii)を主に研究する。これはシナリオ(i)が既に文献で広く研究されているためである。HH_\infty性能については、3つのシナリオすべてを考察する。構造化制御に対しては、線形化技術を導入し、元の非凸問題を半定値計画法(SDP)問題に変換し、これに基づいて反復線形行列不等式(ILMI)アルゴリズムを開発した。

研究背景と動機

問題背景

  1. ネットワーク化制御システムの課題:大規模ネットワーク化制御システムにおいて、集中型制御戦略は膨大な通信負荷をもたらすため、疎な構造を持つコントローラの設計が必要である。
  2. 構造化コントローラ設計の困難性:構造制約を伴うコントローラ設計はNP困難な複雑性を持ち、既存の方法はLMIベースと勾配ベースの方法に大別される。
  3. データ駆動型制御の必要性:実際の応用では、多くのシステムの動力学モデルが得られないことが多く、これがデータ駆動型制御の研究を促進している。

既存方法の限界

  1. 従来的方法は既知モデルに依存:既存の構造化コントローラ設計方法はシステムモデルが既知であることを仮定している。
  2. データ駆動型方法の保守性:Miller等15の既存データ駆動型方法には以下の問題がある:
    • 瞬時有界ノイズをエネルギー有界ノイズ列に過度に近似し、追加の保守性を導入する
    • 非凸実行可能領域の凸部分集合内でのみ構造化コントローラを設計する
    • 性能単調性の保証が欠ける

核心的貢献

  1. 改善されたデータ駆動型フレームワーク
    • すべての可能なシステム行列の集合を各データ点集合の交集合として表現し、15の集合より小さい集合を得る
    • マトリックスS-手順を利用してすべての可能なシステム行列を処理し、実行可能領域が15の実行可能領域を包含することを証明する
    • データ長に対する性能の単調非減少性を証明する
  2. 新規な線形化技術
    • 元の非凸問題をSDP問題に変換する線形化技術を開発する
    • 構造化コントローラを計算するためのILMIアルゴリズムを提案する
    • 15より大きな実行可能領域を探索できる
  3. 包括的なHH_\infty制御研究
    • モデルベースの構造化制御、データ駆動型非構造化制御、データ駆動型構造化制御を初めて包括的に研究する

方法の詳細

タスク定義

離散時間LTIシステムを考える:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

ここでxkRnxx_k \in \mathbb{R}^{n_x}はシステム状態、ukRnuu_k \in \mathbb{R}^{n_u}は制御入力、ykRnyy_k \in \mathbb{R}^{n_y}は制御出力、dkRndd_k \in \mathbb{R}^{n_d}は外部外乱である。

状態フィードバックコントローラuk=Kxku_k = Kx_kを使用する。ここでKRnu×nxK \in \mathbb{R}^{n_u \times n_x}は構造制約KSK \in Sを満たす必要がある。

データ収集メカニズム

行列A,BA, Bは未知だが確定的であり、行列C,D,G,HC, D, G, Hは既知であると仮定する。収集されたデータは以下を含む:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

重要な仮定:プロセスノイズは有界である、すなわちwk2ϵ\|w_k\|_2 \leq \epsilon

核心的技術革新

1. 改善されたシステム行列集合表現

ii番目の時間ステップのデータ(xi,ui,xi+1)(x_i, u_i, x_{i+1})に基づいて、以下を定義する:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

データと一致するすべてのシステム行列の集合は:

Σ = ∩_{i=0}^{T-1} Σ_i

これは15の集合より正確であり、保守性を低減する。

2. マトリックスS-手順の適用

H2H_2制御に対して、マトリックスS-手順を利用すると、条件(5a)がすべての(A,B)Σ(A,B) \in Σに対して成立するための十分条件は、非負のα0,α1,...,αT1α_0, α_1, ..., α_{T-1}β>0β > 0が存在して以下が成立することである:

P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0$$ #### 3. 線形化技術 構造化制御に対して、主な課題は制約$Y ⪯ P^{-1}$の非凸性である。与えられた点$\tilde{P}$の近傍で$P^{-1}$を線形化することで: ``` Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1} ``` ### アルゴリズムフレームワーク #### アルゴリズム1:非構造化最適コントローラ設計 ``` 入力:データX, U、ノイズ界ε 出力:コントローラK*、性能界γ* 1. 問題の種類に応じて対応するSDP問題を選択する 2. SDPを求解してL*, P*, γ*を得る 3. K* = L*P*^{-1}, γ*を返す ``` #### アルゴリズム2:構造化最適コントローラ設計 ``` 入力:データX, U、構造制約I_S 出力:コントローラK*、性能界γ* 1. λ, μ, δ, ε, P_0 = I, k = 0を初期化する 2. 以下を繰り返す: a. P̃ = P_kとλを用いてSDPを求解する b. K_{k+1}, P_{k+1}, γ_{k+1}を更新する c. λ < δならばλ = μλとする d. k = k + 1 3. 収束するまで繰り返す 4. K_k, γ_kを返す ``` ## 実験設定 ### $H_2$制御ケース **システムパラメータ**: ``` A = [-0.4095 0.4036 -0.0874 0.5154 -0.0815 0.1069 1.6715 0.7718 -0.3376] B = [ 0 0 -0.6359 -0.1098 -0.0325 2.2795] 構造制約:I_S = [1 1 0 0 1 1] ``` ### $H_\infty$制御ケース **システムパラメータ**: ``` A = [0.8 0.2 0.1 0.1 0.7 -0.3 -0.3 0.5 0.9] B = [1 0 0 1 1 1] 構造制約:I_S = [1 1 0 1 1 0] ``` ### 評価指標 - $H_2$/$H_\infty$性能界 - 計算時間 - ベンチマーク方法との性能比較 ## 実験結果 ### $H_2$制御結果 #### 異なるノイズレベルでの性能比較(T=20) | 設計方法 | (A,B)既知 | ε=0.05 | ε=0.1 | ε=0.2 | |----------|-----------|--------|-------|-------| | 非構造化[15] | 2.1537 | 2.3448 | 3.0939 | 5.2814 | | 非構造化(本論文) | 2.1537 | 2.2663 | 2.5660 | 2.7889 | | 構造化[15] | 2.9794 | 3.5494 | 4.6806 | 11.3186 | | 構造化(本論文) | 2.7165 | 2.9154 | 3.2249 | 4.0422 | #### 異なるデータ長での性能比較(ε=0.1) | 設計方法 | (A,B)既知 | T=6 | T=10 | T=15 | |----------|-----------|-----|------|------| | 非構造化[15] | 2.1537 | 2.9911 | 2.8156 | 2.6836 | | 非構造化(本論文) | 2.1537 | 2.7494 | 2.5645 | 2.4374 | | 構造化[15] | 2.9794 | 4.4036 | 4.4323 | 4.4456 | | 構造化(本論文) | 2.7165 | 3.5249 | 3.2429 | 3.1485 | ### $H_\infty$制御結果 #### 異なるノイズレベルでの性能比較(T=50) | 設計方法 | (A,B)既知 | ε=0.01 | ε=0.05 | ε=0.15 | |----------|-----------|--------|--------|--------| | 非構造化[15] | 0.7815 | 0.8035 | 0.9063 | 1.6483 | | 非構造化(本論文) | 0.7815 | 0.7921 | 0.8207 | 1.0303 | | 構造化対角P | 3.7464 | 4.0950 | 6.6234 | 実行不可 | | 構造化(本論文) | 1.0580 | 1.0890 | 1.1826 | 1.5969 | ### 主要な知見 1. **性能優位性**:本論文の方法はすべてのテストシナリオでベンチマーク方法[15]を大幅に上回る 2. **単調性**:本論文の方法はデータ長Tに対する性能界の単調非増加性を保証するが、[15]はこの性質を持たない 3. **計算コスト**:反復プロセスと追加の最適化変数により、計算時間は増加する ## 関連研究 ### 構造化コントローラ設計 - **LMI方法**:Polyak等[2]、Fardad等[5]の研究 - **勾配法**:Lin等[3]の拡張ラグランジュ法 - **内点法**:Yang等[6]の新規アルゴリズム ### データ駆動型制御 - **基礎理論**:Willems等[7]の基本補題 - **ロバスト安定化**:De Persis and Tesi[8]、Berberich等[9]の研究 - **マトリックスS-補題の応用**:van Waarde等[11]、Bisoffi等[12,13]の研究 ## 結論と考察 ### 主要な結論 1. より正確なシステム行列集合表現を提案し、保守性を低減した 2. 構造制約を処理するための効果的な線形化技術を開発した 3. 方法の理論的優位性を証明し、数値実験により検証した ### 限界 1. **計算複雑性**:反復アルゴリズムと追加変数は計算負荷を増加させる 2. **収束性**:アルゴリズムの収束性に関する理論的保証が提供されていない 3. **構造制約の制限**:方法の有効性は合理的な構造制約に依存する ### 今後の方向 1. アルゴリズム収束性の理論的分析 2. 計算効率のさらなる最適化 3. より複雑な構造制約の処理 ## 深層的評価 ### 利点 1. **理論的貢献が堅実**:改善されたシステム集合表現とマトリックスS-手順の応用は理論的価値を持つ 2. **方法の革新性が強い**:線形化技術は非凸制約を巧妙に処理する 3. **実験検証が充分**:多様なシナリオで方法の有効性を検証している 4. **性能向上が顕著**:既存方法と比較して明らかな性能改善を達成している ### 不足 1. **計算オーバーヘッドが大きい**:反復アルゴリズムの計算コストは実際の応用の障害となる 2. **アルゴリズム収束性の保証が欠ける**:理論分析が不完全である 3. **適用範囲が限定的**:方法は構造制約の合理性に要求がある ### 影響力 1. **学術的価値**:データ駆動型構造化制御に新しい理論フレームワークを提供する 2. **実用的価値**:ネットワーク化制御システムにおいて重要な応用前景を持つ 3. **再現性**:アルゴリズム記述が明確で再現が容易である ### 適用シナリオ - 大規模ネットワーク化制御システム - 通信制限のある分散制御 - システムモデルが未知だが履歴データがあるシナリオ - 制御性能に高い要求がある応用 ## 参考文献 論文は42篇の関連文献を引用しており、構造化制御、データ駆動型制御、ロバスト制御など複数の分野の重要な研究をカバーしており、研究に堅実な理論的基礎を提供している。