2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.
This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
academic

Datengesteuerte strukturierte Reglerentwurf unter Verwendung des Matrix-S-Verfahrens

Grundinformationen

  • Papier-ID: 2503.14949
  • Titel: Data-Driven Structured Controller Design Using the Matrix S-Procedure
  • Autoren: Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi
  • Klassifizierung: math.OC (Mathematische Optimierung und Regelungstheorie)
  • Veröffentlichungsdatum: 14. Oktober 2025 (Preprint eingereicht bei Automatica)
  • Papierlink: https://arxiv.org/abs/2503.14949

Zusammenfassung

Dieses Papier konzentriert sich auf den datengesteuerten optimalen strukturierten Reglerentwurf für diskrete zeitinvariante lineare Systeme (LTI) unter Berücksichtigung von H2H_2- und HH_\infty-Leistung. Es werden drei Szenarien untersucht: (i) modellgestützter strukturierter Regler, (ii) datengesteuerter unstrukturierter Regler, (iii) datengesteuerter strukturierter Regler. Für die H2H_2-Leistung werden hauptsächlich die Szenarien (ii) und (iii) untersucht, da Szenario (i) bereits in der Literatur umfassend behandelt wurde. Für die HH_\infty-Leistung werden alle drei Szenarien berücksichtigt. Für den strukturierten Regler wird eine Linearisierungstechnik eingeführt, die das ursprüngliche nichtkonvexe Problem in ein semidefinites Programm (SDP) umwandelt, und basierend darauf wird ein iterativer Linearmatrix-Ungleichungs-(ILMI-)Algorithmus entwickelt.

Forschungshintergrund und Motivation

Problemhintergrund

  1. Herausforderungen in vernetzten Regelungssystemen: In großen vernetzten Regelungssystemen führt eine zentralisierte Regelungsstrategie zu enormem Kommunationsaufwand, daher ist der Entwurf von Reglern mit spärlicher Struktur erforderlich.
  2. Schwierigkeiten beim strukturierten Reglerentwurf: Der Reglerentwurf mit Strukturbeschränkungen hat NP-schwere Komplexität. Bestehende Methoden lassen sich hauptsächlich in LMI-basierte und gradientenbasierte Verfahren unterteilen.
  3. Bedarf an datengesteuerten Regelungen: In praktischen Anwendungen sind die Dynamikmodelle vieler Systeme oft nicht verfügbar, was die Forschung zu datengesteuerten Regelungen vorantreibt.

Einschränkungen bestehender Methoden

  1. Traditionelle Methoden setzen bekannte Modelle voraus: Bestehende Methoden zum strukturierten Reglerentwurf gehen davon aus, dass das Systemmodell bekannt ist.
  2. Konservativität datengesteuerter Methoden: Bestehende datengesteuerte Methoden wie die Arbeit von Miller et al. 15 weisen folgende Probleme auf:
    • Momentan begrenzte Störungen werden übermäßig als energiebegrenzte Störungssequenzen approximiert, was zusätzliche Konservativität einführt
    • Strukturierte Regler werden nur in konvexen Teilmengen der nichtkonvexen zulässigen Region entworfen
    • Fehlende Garantien für Leistungsmonotonie

Kernbeiträge

  1. Verbesserter datengesteuerter Rahmen:
    • Die Menge aller möglichen Systemmatrizen wird als Schnittmenge von Mengen jedes Datenpunkts dargestellt, was kleiner als die Menge in 15 ist
    • Verwendung des Matrix-S-Verfahrens zur Behandlung aller möglichen Systemmatrizen; es wird nachgewiesen, dass die zulässige Region die zulässige Region in 15 enthält
    • Nachweis der monoton nichtabnehmenden Leistung bezüglich der Datenlänge
  2. Neuartige Linearisierungstechnik:
    • Entwicklung einer Linearisierungstechnik zur Umwandlung des ursprünglichen nichtkonvexen Problems in ein SDP-Problem
    • Vorschlag des ILMI-Algorithmus zur Berechnung strukturierter Regler
    • Ermöglicht die Erkundung einer größeren zulässigen Region als 15
  3. Umfassende HH_\infty-Regelungsforschung:
    • Erste umfassende Untersuchung von modellgestützter strukturierter Regelung, datengesteuerter unstrukturierter Regelung und datengesteuerter strukturierter Regelung

Methodische Details

Aufgabendefinition

Betrachten Sie ein diskretes zeitinvariantes lineares System:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

wobei xkRnxx_k \in \mathbb{R}^{n_x} der Systemzustand ist, ukRnuu_k \in \mathbb{R}^{n_u} die Regelungseingabe ist, ykRnyy_k \in \mathbb{R}^{n_y} die Regelungsausgabe ist und dkRndd_k \in \mathbb{R}^{n_d} die externe Störung ist.

Verwenden Sie einen Zustandsrückkopplungsregler uk=Kxku_k = Kx_k, wobei KRnu×nxK \in \mathbb{R}^{n_u \times n_x} die Strukturbeschränkung KSK \in S erfüllen muss.

Datenerfassungsmechanismus

Angenommen, die Matrizen A,BA, B sind unbekannt aber bestimmt, die Matrizen C,D,G,HC, D, G, H sind bekannt. Die erfassten Daten umfassen:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

Schlüsselannahme: Die Prozessstörung ist begrenzt, d.h. wk2ϵ\|w_k\|_2 \leq \epsilon.

Kernmethodische Innovationen

1. Verbesserte Darstellung der Systemmatrixmenge

Basierend auf den Daten (xi,ui,xi+1)(x_i, u_i, x_{i+1}) zum Zeitpunkt ii definieren Sie:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

Die Menge aller mit den Daten konsistenten Systemmatrizen ist:

Σ = ∩_{i=0}^{T-1} Σ_i

Dies ist präziser als die Menge in 15 und reduziert die Konservativität.

2. Anwendung des Matrix-S-Verfahrens

Für die H2H_2-Regelung wird unter Verwendung des Matrix-S-Verfahrens die hinreichende Bedingung dafür, dass Bedingung (5a) für alle (A,B)Σ(A,B) \in Σ erfüllt ist, durch die Existenz von nichtnegativen α0,α1,...,αT1α_0, α_1, ..., α_{T-1} und β>0β > 0 gegeben:

P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0$$ #### 3. Linearisierungstechnik Für die strukturierte Regelung ist die Hauptherausforderung die Nichtkonvexität der Beschränkung $Y ⪯ P^{-1}$. Durch Linearisierung von $P^{-1}$ in der Nähe eines gegebenen Punktes $\tilde{P}$: ``` Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1} ``` ### Algorithmusrahmen #### Algorithmus 1: Entwurf des unstrukturierten optimalen Reglers ``` Eingabe: Daten X, U, Störungsgrenze ε Ausgabe: Regler K*, Leistungsgrenze γ* 1. Wählen Sie das entsprechende SDP-Problem basierend auf dem Problemtyp 2. Lösen Sie das SDP, um L*, P*, γ* zu erhalten 3. Geben Sie K* = L*P*^{-1}, γ* zurück ``` #### Algorithmus 2: Entwurf des strukturierten optimalen Reglers ``` Eingabe: Daten X, U, Strukturbeschränkung I_S Ausgabe: Regler K*, Leistungsgrenze γ* 1. Initialisieren Sie λ, μ, δ, ε, P_0 = I, k = 0 2. Wiederholen Sie: a. Lösen Sie das SDP mit P̃ = P_k und λ b. Aktualisieren Sie K_{k+1}, P_{k+1}, γ_{k+1} c. Wenn λ < δ, dann λ = μλ d. k = k + 1 3. Bis zur Konvergenz 4. Geben Sie K_k, γ_k zurück ``` ## Experimentelle Einrichtung ### $H_2$-Regelungsfall **Systemparameter**: ``` A = [-0.4095 0.4036 -0.0874 0.5154 -0.0815 0.1069 1.6715 0.7718 -0.3376] B = [ 0 0 -0.6359 -0.1098 -0.0325 2.2795] Strukturbeschränkung: I_S = [1 1 0 0 1 1] ``` ### $H_\infty$-Regelungsfall **Systemparameter**: ``` A = [0.8 0.2 0.1 0.1 0.7 -0.3 -0.3 0.5 0.9] B = [1 0 0 1 1 1] Strukturbeschränkung: I_S = [1 1 0 1 1 0] ``` ### Bewertungskriterien - $H_2$/$H_\infty$-Leistungsgrenze - Rechenzeit - Leistungsvergleich mit Referenzmethoden ## Experimentelle Ergebnisse ### $H_2$-Regelungsergebnisse #### Leistungsvergleich bei verschiedenen Störungsniveaus (T=20) | Entwurfsmethode | (A,B) bekannt | ε=0.05 | ε=0.1 | ε=0.2 | |-----------------|---------------|--------|-------|-------| | Unstrukturiert [15] | 2.1537 | 2.3448 | 3.0939 | 5.2814 | | Unstrukturiert (dieses Papier) | 2.1537 | 2.2663 | 2.5660 | 2.7889 | | Strukturiert [15] | 2.9794 | 3.5494 | 4.6806 | 11.3186 | | Strukturiert (dieses Papier) | 2.7165 | 2.9154 | 3.2249 | 4.0422 | #### Leistungsvergleich bei verschiedenen Datenlängen (ε=0.1) | Entwurfsmethode | (A,B) bekannt | T=6 | T=10 | T=15 | |-----------------|---------------|-----|------|------| | Unstrukturiert [15] | 2.1537 | 2.9911 | 2.8156 | 2.6836 | | Unstrukturiert (dieses Papier) | 2.1537 | 2.7494 | 2.5645 | 2.4374 | | Strukturiert [15] | 2.9794 | 4.4036 | 4.4323 | 4.4456 | | Strukturiert (dieses Papier) | 2.7165 | 3.5249 | 3.2429 | 3.1485 | ### $H_\infty$-Regelungsergebnisse #### Leistungsvergleich bei verschiedenen Störungsniveaus (T=50) | Entwurfsmethode | (A,B) bekannt | ε=0.01 | ε=0.05 | ε=0.15 | |-----------------|---------------|--------|--------|--------| | Unstrukturiert [15] | 0.7815 | 0.8035 | 0.9063 | 1.6483 | | Unstrukturiert (dieses Papier) | 0.7815 | 0.7921 | 0.8207 | 1.0303 | | Strukturiert diagonal P | 3.7464 | 4.0950 | 6.6234 | nicht zulässig | | Strukturiert (dieses Papier) | 1.0580 | 1.0890 | 1.1826 | 1.5969 | ### Hauptergebnisse 1. **Leistungsvorteil**: Die Methode dieses Papiers ist in allen Testszenarien deutlich besser als die Referenzmethode [15] 2. **Monotonie**: Die Methode dieses Papiers garantiert, dass die Leistungsgrenze mit der Datenlänge T monoton nichtabnehmend ist, während [15] diese Eigenschaft nicht hat 3. **Rechenkosten**: Aufgrund des iterativen Prozesses und zusätzlicher Optimierungsvariablen ist die Rechenzeit leicht erhöht ## Verwandte Arbeiten ### Strukturierter Reglerentwurf - **LMI-Methoden**: Arbeiten von Polyak et al. [2], Fardad et al. [5] - **Gradientenmethoden**: Augmentierte Lagrange-Methode von Lin et al. [3] - **Innenpunktmethoden**: Neuer Algorithmus von Yang et al. [6] ### Datengesteuerte Regelung - **Grundlegende Theorie**: Fundamentales Lemma von Willems et al. [7] - **Robuste Stabilisierung**: Arbeiten von De Persis und Tesi [8], Berberich et al. [9] - **Anwendung des Matrix-S-Lemmas**: Forschung von van Waarde et al. [11], Bisoffi et al. [12,13] ## Schlussfolgerungen und Diskussion ### Hauptschlussfolgerungen 1. Eine präzisere Darstellung der Systemmatrixmenge wird vorgeschlagen, die Konservativität reduziert 2. Eine effektive Linearisierungstechnik zur Behandlung von Strukturbeschränkungen wird entwickelt 3. Die theoretischen Vorteile der Methode werden nachgewiesen und durch numerische Experimente validiert ### Einschränkungen 1. **Rechenkomplexität**: Der iterative Algorithmus und zusätzliche Variablen erhöhen die Rechenlast 2. **Konvergenz**: Es werden keine theoretischen Garantien für die Algorithmuskonvergenz bereitgestellt 3. **Strukturbeschränkungen**: Die Effektivität der Methode hängt von angemessenen Strukturbeschränkungen ab ### Zukünftige Richtungen 1. Theoretische Analyse der Algorithmuskonvergenz 2. Weitere Optimierung der Recheneffizienz 3. Behandlung komplexerer Strukturbeschränkungen ## Tiefgreifende Bewertung ### Stärken 1. **Solide theoretische Beiträge**: Die verbesserte Systemmengendarstellung und die Anwendung des Matrix-S-Verfahrens haben theoretischen Wert 2. **Starke methodische Innovation**: Die Linearisierungstechnik behandelt geschickt nichtkonvexe Beschränkungen 3. **Ausreichende experimentelle Validierung**: Die Methode wird in verschiedenen Szenarien validiert 4. **Signifikante Leistungsverbesserung**: Deutliche Verbesserung gegenüber bestehenden Methoden ### Mängel 1. **Großer Rechenaufwand**: Die Rechenkosten des iterativen Algorithmus sind ein Hindernis für praktische Anwendungen 2. **Fehlende Konvergenzgarantie**: Die theoretische Analyse ist unvollständig 3. **Begrenzte Anwendbarkeit**: Die Methode stellt Anforderungen an die Angemessenheit von Strukturbeschränkungen ### Auswirkungen 1. **Akademischer Wert**: Bietet einen neuen theoretischen Rahmen für datengesteuerte strukturierte Regelung 2. **Praktischer Wert**: Hat wichtige Anwendungsaussichten in vernetzten Regelungssystemen 3. **Reproduzierbarkeit**: Klare Algorithmusbeschreibung ermöglicht einfache Reproduktion ### Anwendungsszenarien - Großflächige vernetzte Regelungssysteme - Verteilte Regelung mit Kommunikationsbeschränkungen - Szenarien mit unbekanntem Systemmodell aber verfügbaren historischen Daten - Anwendungen mit hohen Anforderungen an Regelungsleistung ## Literaturverzeichnis Das Papier zitiert 42 relevante Literaturquellen, die wichtige Arbeiten in den Bereichen strukturierte Regelung, datengesteuerte Regelung und robuste Regelung abdecken und eine solide theoretische Grundlage für die Forschung bieten.