This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
論文ID : 2503.14949タイトル : Data-Driven Structured Controller Design Using the Matrix S-Procedure著者 : Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi分類 : math.OC(数学最適化と制御)発表日時 : 2025年10月14日(Automaticaに投稿されたプレプリント)論文リンク : https://arxiv.org/abs/2503.14949 本論文は、H 2 H_2 H 2 性能とH ∞ H_\infty H ∞ 性能を考慮した離散時間線形時不変(LTI)システムのデータ駆動型最適構造化コントローラ設計に焦点を当てている。具体的には3つのシナリオを研究する:(i)モデルベースの構造化制御、(ii)データ駆動型の非構造化制御、(iii)データ駆動型の構造化制御。H 2 H_2 H 2 性能については、シナリオ(ii)と(iii)を主に研究する。これはシナリオ(i)が既に文献で広く研究されているためである。H ∞ H_\infty H ∞ 性能については、3つのシナリオすべてを考察する。構造化制御に対しては、線形化技術を導入し、元の非凸問題を半定値計画法(SDP)問題に変換し、これに基づいて反復線形行列不等式(ILMI)アルゴリズムを開発した。
ネットワーク化制御システムの課題 :大規模ネットワーク化制御システムにおいて、集中型制御戦略は膨大な通信負荷をもたらすため、疎な構造を持つコントローラの設計が必要である。構造化コントローラ設計の困難性 :構造制約を伴うコントローラ設計はNP困難な複雑性を持ち、既存の方法はLMIベースと勾配ベースの方法に大別される。データ駆動型制御の必要性 :実際の応用では、多くのシステムの動力学モデルが得られないことが多く、これがデータ駆動型制御の研究を促進している。従来的方法は既知モデルに依存 :既存の構造化コントローラ設計方法はシステムモデルが既知であることを仮定している。データ駆動型方法の保守性 :Miller等15 の既存データ駆動型方法には以下の問題がある:瞬時有界ノイズをエネルギー有界ノイズ列に過度に近似し、追加の保守性を導入する 非凸実行可能領域の凸部分集合内でのみ構造化コントローラを設計する 性能単調性の保証が欠ける 改善されたデータ駆動型フレームワーク :すべての可能なシステム行列の集合を各データ点集合の交集合として表現し、15 の集合より小さい集合を得る マトリックスS-手順を利用してすべての可能なシステム行列を処理し、実行可能領域が15 の実行可能領域を包含することを証明する データ長に対する性能の単調非減少性を証明する 新規な線形化技術 :元の非凸問題をSDP問題に変換する線形化技術を開発する 構造化コントローラを計算するためのILMIアルゴリズムを提案する 15 より大きな実行可能領域を探索できる包括的なH ∞ H_\infty H ∞ 制御研究 :モデルベースの構造化制御、データ駆動型非構造化制御、データ駆動型構造化制御を初めて包括的に研究する 離散時間LTIシステムを考える:
x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k
ここでx k ∈ R n x x_k \in \mathbb{R}^{n_x} x k ∈ R n x はシステム状態、u k ∈ R n u u_k \in \mathbb{R}^{n_u} u k ∈ R n u は制御入力、y k ∈ R n y y_k \in \mathbb{R}^{n_y} y k ∈ R n y は制御出力、d k ∈ R n d d_k \in \mathbb{R}^{n_d} d k ∈ R n d は外部外乱である。
状態フィードバックコントローラu k = K x k u_k = Kx_k u k = K x k を使用する。ここでK ∈ R n u × n x K \in \mathbb{R}^{n_u \times n_x} K ∈ R n u × n x は構造制約K ∈ S K \in S K ∈ S を満たす必要がある。
行列A , B A, B A , B は未知だが確定的であり、行列C , D , G , H C, D, G, H C , D , G , H は既知であると仮定する。収集されたデータは以下を含む:
X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}
重要な仮定 :プロセスノイズは有界である、すなわち∥ w k ∥ 2 ≤ ϵ \|w_k\|_2 \leq \epsilon ∥ w k ∥ 2 ≤ ϵ 。
第i i i 番目の時間ステップのデータ( x i , u i , x i + 1 ) (x_i, u_i, x_{i+1}) ( x i , u i , x i + 1 ) に基づいて、以下を定義する:
Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}
データと一致するすべてのシステム行列の集合は:
これは15 の集合より正確であり、保守性を低減する。
H 2 H_2 H 2 制御に対して、マトリックスS-手順を利用すると、条件(5a)がすべての( A , B ) ∈ Σ (A,B) \in Σ ( A , B ) ∈ Σ に対して成立するための十分条件は、非負のα 0 , α 1 , . . . , α T − 1 α_0, α_1, ..., α_{T-1} α 0 , α 1 , ... , α T − 1 とβ > 0 β > 0 β > 0 が存在して以下が成立することである:
[ P − G G T − β I 0 0 − [ I K ] P [ I K ] T ] − ∑ i = 0 T − 1 α i Ψ i ⪰ 0 \begin{bmatrix}
P - GG^T - βI & 0 \\
0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T
\end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0 P − G G T − β I 0 0 − [ I K ] P [ I K ] T − ∑ i = 0 T − 1 α i Ψ i ⪰ 0
構造化制御に対して、主な課題は制約Y ⪯ P − 1 Y ⪯ P^{-1} Y ⪯ P − 1 の非凸性である。与えられた点P ~ \tilde{P} P ~ の近傍でP − 1 P^{-1} P − 1 を線形化することで:
Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1}
入力:データX, U、ノイズ界ε
出力:コントローラK*、性能界γ*
1. 問題の種類に応じて対応するSDP問題を選択する
2. SDPを求解してL*, P*, γ*を得る
3. K* = L*P*^{-1}, γ*を返す
入力:データX, U、構造制約I_S
出力:コントローラK*、性能界γ*
1. λ, μ, δ, ε, P_0 = I, k = 0を初期化する
2. 以下を繰り返す:
a. P̃ = P_kとλを用いてSDPを求解する
b. K_{k+1}, P_{k+1}, γ_{k+1}を更新する
c. λ < δならばλ = μλとする
d. k = k + 1
3. 収束するまで繰り返す
4. K_k, γ_kを返す
システムパラメータ :
A = [-0.4095 0.4036 -0.0874
0.5154 -0.0815 0.1069
1.6715 0.7718 -0.3376]
B = [ 0 0
-0.6359 -0.1098
-0.0325 2.2795]
構造制約:I_S = [1 1 0
0 1 1]
システムパラメータ :
A = [0.8 0.2 0.1
0.1 0.7 -0.3
-0.3 0.5 0.9]
B = [1 0
0 1
1 1]
構造制約:I_S = [1 1 0
1 1 0]
H 2 H_2 H 2 /H ∞ H_\infty H ∞ 性能界計算時間 ベンチマーク方法との性能比較 設計方法 (A,B)既知 ε=0.05 ε=0.1 ε=0.2 非構造化15 2.1537 2.3448 3.0939 5.2814 非構造化(本論文) 2.1537 2.2663 2.5660 2.7889 構造化15 2.9794 3.5494 4.6806 11.3186 構造化(本論文) 2.7165 2.9154 3.2249 4.0422
設計方法 (A,B)既知 T=6 T=10 T=15 非構造化15 2.1537 2.9911 2.8156 2.6836 非構造化(本論文) 2.1537 2.7494 2.5645 2.4374 構造化15 2.9794 4.4036 4.4323 4.4456 構造化(本論文) 2.7165 3.5249 3.2429 3.1485
設計方法 (A,B)既知 ε=0.01 ε=0.05 ε=0.15 非構造化15 0.7815 0.8035 0.9063 1.6483 非構造化(本論文) 0.7815 0.7921 0.8207 1.0303 構造化対角P 3.7464 4.0950 6.6234 実行不可 構造化(本論文) 1.0580 1.0890 1.1826 1.5969
性能優位性 :本論文の方法はすべてのテストシナリオでベンチマーク方法15 を大幅に上回る単調性 :本論文の方法はデータ長Tに対する性能界の単調非増加性を保証するが、15 はこの性質を持たない計算コスト :反復プロセスと追加の最適化変数により、計算時間は増加するLMI方法 :Polyak等2 、Fardad等5 の研究勾配法 :Lin等3 の拡張ラグランジュ法内点法 :Yang等6 の新規アルゴリズム基礎理論 :Willems等7 の基本補題ロバスト安定化 :De Persis and Tesi8 、Berberich等9 の研究マトリックスS-補題の応用 :van Waarde等11 、Bisoffi等12,13 の研究より正確なシステム行列集合表現を提案し、保守性を低減した 構造制約を処理するための効果的な線形化技術を開発した 方法の理論的優位性を証明し、数値実験により検証した 計算複雑性 :反復アルゴリズムと追加変数は計算負荷を増加させる収束性 :アルゴリズムの収束性に関する理論的保証が提供されていない構造制約の制限 :方法の有効性は合理的な構造制約に依存するアルゴリズム収束性の理論的分析 計算効率のさらなる最適化 より複雑な構造制約の処理 理論的貢献が堅実 :改善されたシステム集合表現とマトリックスS-手順の応用は理論的価値を持つ方法の革新性が強い :線形化技術は非凸制約を巧妙に処理する実験検証が充分 :多様なシナリオで方法の有効性を検証している性能向上が顕著 :既存方法と比較して明らかな性能改善を達成している計算オーバーヘッドが大きい :反復アルゴリズムの計算コストは実際の応用の障害となるアルゴリズム収束性の保証が欠ける :理論分析が不完全である適用範囲が限定的 :方法は構造制約の合理性に要求がある学術的価値 :データ駆動型構造化制御に新しい理論フレームワークを提供する実用的価値 :ネットワーク化制御システムにおいて重要な応用前景を持つ再現性 :アルゴリズム記述が明確で再現が容易である大規模ネットワーク化制御システム 通信制限のある分散制御 システムモデルが未知だが履歴データがあるシナリオ 制御性能に高い要求がある応用 論文は42篇の関連文献を引用しており、構造化制御、データ駆動型制御、ロバスト制御など複数の分野の重要な研究をカバーしており、研究に堅実な理論的基礎を提供している。