2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic

Datengesteuerte Stabilisierung unter Verwendung von Vorwissen über Stabilisierbarkeit und Steuerbarkeit

Grundlegende Informationen

  • Papier-ID: 2510.25452
  • Titel: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
  • Autoren: Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels
  • Institutionen: Universität Groningen (Shakouri, van Waarde), Technische Universität Eindhoven (Baltussen, Heemels)
  • Klassifikation: math.OC (Optimierung und Regelung), cs.SY, eess.SY (Systeme und Regelung)
  • Veröffentlichungsdatum: arXiv v2, 30. Oktober 2025
  • Papier-Link: https://arxiv.org/abs/2510.25452v2

Zusammenfassung

Dieses Papier untersucht das Problem der datengesteuerten Stabilisierung linearer zeitinvarianter Systeme unter Verwendung von Systemtheorieeigenschaften (insbesondere Stabilisierbarkeit und Steuerbarkeit) als Vorwissen. Die Autoren erweitern das Konzept der Dateninformativität mit der Anforderung, dass ein Regler existiert, der alle mit den Daten und dem Vorwissen konsistenten Systeme stabilisiert. Die Forschung zeigt: (1) Wenn das System steuerbar ist, bietet die Verwendung dieser Eigenschaft als Vorwissen keine Lockerung der Bedingungen für datengesteuerte Stabilisierung; (2) Wenn das System stabilisierbar ist, ermöglicht die Verwendung dieses Vorwissens schwächere notwendige und hinreichende Bedingungen im Vergleich zu Fällen ohne Vorwissen. Mit anderen Worten: Wenn bekannt ist, dass das zugrunde liegende System stabilisierbar ist, wird datengesteuerte Stabilisierung leichter erreichbar. Der Artikel bietet auch neue datengesteuerte Kontrolldesignmethoden basierend auf linearen Matrixungleichungen (LMI).

Forschungshintergrund und Motivation

Kernproblem

Das Papier adressiert die Frage: Wie entwirft man einen Stabilisierungsregler unter Bedingungen begrenzter Daten, wenn man Vorwissen über die Stabilisierbarkeit oder Steuerbarkeit des Systems hat?

Die traditionelle datengesteuerte Regelung geht davon aus, dass Systemparameter völlig unbekannt sind, aber für die meisten physikalischen Systeme ist diese Annahme zu konservativ. In der Praxis verfügen wir häufig über Vorwissen (wie Bereiche physikalischer Größen wie Masse oder Federkonstanten, oder aus der Systemstruktur ableitbare Steuerbarkeits-/Stabilisierbarkeitseigenschaften).

Bedeutung des Problems

  1. Reduzierung des Datenbedarfs: Der direkte Entwurf von Reglern aus Daten kann große Datenmengen erfordern, um Persistenzanregungsbedingungen zu erfüllen, aber die Kombination mit Vorwissen könnte Stabilisierung mit weniger Daten ermöglichen
  2. Praktische Machbarkeit: In einigen Fällen ist es unmöglich, Stabilisierungsregler nur aus Daten zu entwerfen (z.B. wenn Zustandsdaten rangdefizitär sind), aber die Hinzunahme von Vorwissen könnte den Entwurf machbar machen
  3. Theoretische Vollständigkeit: Systemtheorieeigenschaften (Steuerbarkeit, Stabilisierbarkeit) sind grundlegende Konzepte der Regelungstheorie, wurden aber im datengesteuerten Rahmen noch nicht ausreichend untersucht

Einschränkungen bestehender Methoden

  1. Datengesteuerte Regelung: Bestehende Arbeiten (wie De Persis & Tesi 2019, van Waarde et al. 2020) untersuchen hauptsächlich Fälle ohne Vorwissen und erfordern strikte Datenbedingungen (wie Persistenzanregung, Vollrang der Zustandsdaten)
  2. Integration von Vorwissen: Bisherige Forschung beschränkt sich auf Parametergrenzen 12-14 oder teilweise bekannte Parameter 15, berücksichtigt aber nicht Systemtheorieeigenschaften
  3. Nichtkonvexitätsherausforderung: Die Mengen stabilisierbarer und steuerbarer Systeme sind nichtkonvex, anders als die konvexen Systemmengen in bestehenden Arbeiten

Forschungsmotivation

In vielen praktischen Anwendungen kann die Steuerbarkeit oder Stabilisierbarkeit aus der Systemstruktur abgeleitet werden (strukturelle Steuerbarkeitstheorie), aber solches Vorwissen wird in der datengesteuerten Regelung noch nicht genutzt. Dieses Papier schließt diese theoretische Lücke.

Kernbeiträge

Die Hauptbeiträge dieses Papiers sind:

  1. Erweiterung des theoretischen Rahmens: Erweiterung des Konzepts der Dateninformativität zur Einbeziehung von Vorwissen mit der Definition von Σ_pk-Informativität (Definition 3)
  2. Äquivalenzsatz für Steuerbarkeitsvorwissen (Theorem 5): Beweis, dass die Verwendung von Steuerbarkeit als Vorwissen äquivalent zum Fall ohne Vorwissen ist, d.h. Steuerbarkeitsvorwissen kann Datenbedingungen nicht lockern
  3. Vorteilssätze für Stabilisierbarkeitvorwissen (Theoreme 14, 15):
    • Wenn Zustandsdaten vollrangig sind (rank X⁻ = n), bietet Stabilisierbarkeitvorwissen keine zusätzliche Hilfe
    • Wenn Zustandsdaten rangdefizitär sind (rank X⁻ < n), lockert Stabilisierbarkeitvorwissen die Bedingungen erheblich und liefert notwendige und hinreichende Bedingungen
  4. Berechenbare Entwurfsmethode (Proposition 16): Bereitstellung einer LMI-basierten Methode zur Berechnung von Stabilisierungsreglern direkt aus Σ_stab-informativen Daten
  5. Theoretische Einsichten: Offenlegung des scheinbar paradoxen Phänomens, dass eine stärkere Eigenschaft (Steuerbarkeit) die Bedingungen nicht lockert, während eine schwächere Eigenschaft (Stabilisierbarkeit) dies tut – dies liegt daran, dass in einigen Fällen alle datenkonsistenten Systeme nicht steuerbar sind

Methodische Details

Aufgabendefinition

Systemmodell: Betrachtung eines diskreten LTI-Systems

x(t+1) = A_true x(t) + B_true u(t)

wobei x(t)∈ℝⁿ der Zustand, u(t)∈ℝᵐ die Eingabe und die Systemmatrizen (A_true, B_true) unbekannt sind.

Daten: Von Zeit 0 bis T gesammelte Eingabe-Zustandsdaten

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

Definition der Datenmatrizen:

  • U⁻ = u(0),...,u(T-1)
  • X⁻ = x(0),...,x(T-1)
  • X⁺ = x(1),...,x(T)

Datenkonsistente Systemenmenge:

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

Ziel: Finden einer Rückkopplungsverstärkung K, sodass A+BK für alle (A,B)∈Σ_D∩Σ_pk Schur-stabil ist (alle Eigenwerte mit Betrag <1)

Kernkonzepte

Definition 3 (Σ_pk-Informativität für Stabilisierung): Daten D heißen Σ_pk-informativ für Stabilisierung, wenn ein K∈ℝᵐˣⁿ existiert, sodass A+BK für alle (A,B)∈Σ_D∩Σ_pk Schur-stabil ist.

Vorwissensmengen:

  • Σ_cont: Menge aller steuerbaren Systempaare
  • Σ_stab: Menge aller stabilisierbaren Systempaare

Steuerbarkeit als Vorwissen (Abschnitt III)

Theorem 5 (Kernergebnis): Angenommen (A_true, B_true)∈Σ_cont, dann sind folgende äquivalent:

  • (a) Daten D sind Σ_cont-informativ für Stabilisierung
  • (b) Daten D sind informativ für Stabilisierung (ohne Vorwissen)

Beweisidee:

  1. (b)⇒(a) ist offensichtlich
  2. (a)⇒(b) ist der Schlüssel:
    • Wenn Σ_D⊆Σ_cont, ist die Schlussfolgerung offensichtlich
    • Wenn ein nicht-steuerbares (Ā,B̄)∈Σ_D existiert, nutze Lemma 7 (Parametrisierung von Systemfamilien, die fast überall steuerbar sind) und Lemma 9 (Stabilität von Matrizenbündeln), um zu zeigen, dass der Stabilisierungsregler K auch (Ā,B̄) stabilisiert

Schlüssellemmata:

  • Lemma 7: Wenn (M,N) steuerbar ist, dann ist (M+αM₀, N+αN₀) für alle außer höchstens n² Werte von α steuerbar
  • Lemma 9: Wenn M+δN für alle δ∈[ε,∞)\F (F endlich) Schur-stabil ist, dann ist N nilpotent und M+δN ist für alle δ∈ℝ Schur-stabil

Stabilisierbarkeit als Vorwissen (Abschnitt IV)

A. Notwendige Bedingungen (Theorem 10)

Wenn Daten Σ_stab-informativ sind und K ein Stabilisierungsgewinn ist, dann:

  • (a) (A₀+B₀K)R(A,B) = {0} für alle (A,B)∈Σ_D∩Σ_stab und (A₀,B₀)∈Σ⁰_D
  • (b) Wenn rank X⁻ < n, dann imX⁻;U⁻ = im X⁻ × ℝᵐ
  • (c) im X⁺ ⊆ im X⁻
  • (d) im X⁻ ist A-invariant und enthält im B

Bemerkung 11: Bedingung (a) ist eine Lockerung von A₀+B₀K=0 aus dem Fall ohne Vorwissen; Bedingungen (b)-(d) sind automatisch erfüllt, wenn rank X⁻ = n, aber nicht-trivial im rangdefizitären Fall.

B. Vollrangiger Fall (Theorem 14)

Theorem 14: Wenn (A_true,B_true)∈Σ_stab und rank X⁻ = n, dann:

  • Σ_stab-Informativität ⟺ Informativität (ohne Vorwissen)

Beweisidee:

  1. Wenn das wahre System steuerbar ist, folgt die Schlussfolgerung aus Theorem 5
  2. Wenn das wahre System nicht steuerbar ist, konstruiere K̂ sodass für alle (A,B)∈Σ_D gilt A+BK̂ = A_true+B_true K̂, dann zeige, dass letzteres Schur-stabil ist

C. Rangdefizitärer Fall (Theorem 15, Kernergebnis)

Theorem 15: Wenn (A_true,B_true)∈Σ_stab und rank X⁻ < n, dann sind Daten D Σ_stab-informativ genau dann, wenn:

  • (a) im X⁺ ⊆ im X⁻
  • (b) imX⁻;U⁻ = im X⁻ × ℝᵐ

Schlüssellemma (Lemma 17): Wenn Bedingungen (a)(b) erfüllt sind, dann existiert für alle (A,B)∈Σ_D∩Σ_stab eine Transformationsmatrix S mit:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

wobei (A₁₁,B₁) stabilisierbar ist, A₂₂ Schur-stabil ist, und A₁₁ B₁ = X̂⁺X̂⁻;U⁻

Dies bietet eine datengesteuerte Kalman-Zerlegung.

Reglersynthesemethode (Proposition 16)

Proposition 16: Wenn Daten Σ_stab-informativ sind und rank X⁻ = r < n:

(a) Es existiert Θ∈ℝᵀˣʳ, sodass die LMI lösbar ist:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) Wenn Θ Bedingung (11) erfüllt, setze K = K₁ K₂S, wobei:

  • K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  • K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾ beliebig dann ist A+BK für alle (A,B)∈Σ_D∩Σ_stab Schur-stabil

Entwurfsschritte:

  1. Berechne QR-Zerlegung von X⁻ zur Gewinnung von S und X̂⁻
  2. Löse LMI (11) zur Gewinnung von Θ
  3. Berechne K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  4. Wähle K₂ beliebig und konstruiere K = K₁ K₂S

Experimentelle Einrichtung

Numerisches Beispiel: Drei-Tank-System

Systembeschreibung (Abbildung 2):

  • 3 hintereinander geschaltete Tanks, Flüssigkeit fließt von Tank 3 zu Tank 2 zu Tank 1
  • Zustand: x_i ist die Flüssigkeitshöhe in Tank i (i=1,2,3)
  • Steuereingang: u ist die Durchflussrate zwischen Tank 2 und Speicherbehälter
  • Strukturelle Eigenschaft: Aufgrund der Einwegströmung ist x₃ nicht steuerbar

Kontinuierliches Zeitmodell:

ẋ = A_c x + B_c u

wobei:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

Diskretisierung (Abtastzeit 0,1s):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

Experimentelle Daten

Offenschleife-Experiment (T=5):

t012345
u(t)10-101
x₁11.041.07781.10861.13341.1575
x₂22.04982.00151.85971.82371.8881
x₃000000

Dateneigenschaften: rank X⁻ = 2 < 3 (rangdefizitär)

Lösungsprozess

  1. Verwendung von MATLAB + YALMIP + MOSEK zur Lösung der LMI (11)
  2. Gewinnung von Θ (5×2-Matrix)
  3. Berechnung von K₁ = -2.7728 -9.7123
  4. Setzen von K₂ = 0, Gewinnung von K = -2.7728 -9.7123 0

Monte-Carlo-Experiment

Experimentelle Einrichtung:

  • 1000 zufällige Szenarien
  • Jedes Szenario: Simulation des Systems von t=0 bis t=100
  • Eingaben und Anfangsbedingungen unabhängig aus Poisson-Verteilung (λ=1) gezogen
  • Analyse der Dateninformativität für verschiedene Stichprobengrößen T = 3, 4, 5, 10, 100

Bewertungsmetriken:

  • Systemidentifikationsinformativität (rankX⁻ᵀ U⁻ᵀ = n+m)
  • Stabilisierungsinformativität ohne Vorwissen
  • Σ_stab-Stabilisierungsinformativität

Experimentelle Ergebnisse

Hauptergebnisse (Tabelle I)

TSystemidentifikationsinformativitätStabilisierungsinformativität (ohne Vorwissen)Σ_stab-Stabilisierungsinformativität
30%8.1%42%
462.4%63.2%99.4%
562.8%63.2%99.8%
1063.2%63.2%100%
10063.2%63.2%100%

Schlüsselfunde

  1. Signifikanter Vorteil bei T=3:
    • Systemidentifikation unmöglich (T < n+m)
    • Nur 8,1% der Daten für Stabilisierung ohne Vorwissen nutzbar
    • 42% der Daten für Σ_stab-Stabilisierung nutzbar (5-fache Verbesserung)
  2. Konvergenzverhalten bei T≥4:
    • Systemidentifikations- und Stabilisierungsinformativität ohne Vorwissen stabilisieren sich bei 63,2%
    • Dies liegt daran, dass etwa 36,8% der zufälligen Daten notwendige Bedingungen nicht erfüllen
  3. Vollständige Abdeckung bei T≥10:
    • 100% der Daten sind Σ_stab-informativ
    • Zeigt deutlich die Stärke des Stabilisierbarkeitvorwissens

Fallvalidierung

Für die gegebenen T=5-Daten:

  • X⁻ nicht vollrangig, Proposition 2 nicht anwendbar (nicht nutzbar für Stabilisierung ohne Vorwissen)
  • Aber erfüllt Bedingungen von Theorem 15
  • Erfolgreiche Lösung der LMI zur Gewinnung des Stabilisierungsgewinns K

Verwandte Arbeiten

Datengesteuerte Regelung

  1. De Persis & Tesi (2019): Erste Arbeit zum direkten Entwurf von Stabilisierungsreglern aus Daten mit LMI-Methode, erfordert Persistenzanregung
  2. van Waarde et al. (2020): Einführung des Dateninformativitätsrahmens mit notwendigen und hinreichenden Bedingungen, keine eindeutige Identifikation erforderlich
  3. Rauschfall: van Waarde et al. (2020), Li et al. (2026) untersuchen Reglersynthese mit verrauschten Daten

Vorwissen in datengesteuerter Regelung

  1. Parametergrenzen: Berberich et al. (2022) untersuchen Vorwissen in linearer Bruchform
  2. Teilweise bekannte Parameter: Huang et al. (2025) untersuchen Dichtefunktionsmethoden für polynomiale Systeme
  3. Neuheit dieses Papiers: Erste systematische Untersuchung von Systemtheorieeigenschaften (Steuerbarkeit/Stabilisierbarkeit) als Vorwissen

Systemidentifikation mit Vorwissen

  1. Stabilitätsbeschränkungen: van Gestel et al. (2002), Lacy & Bernstein (2003)
  2. Eigenwertbeschränkungen: Miller & De Callafon (2013)
  3. Positivität/Passivität: De Santis & Farina (2002), Goethals et al. (2003)
  4. Unterschied dieses Papiers: Fokus auf Reglersynthese statt Identifikation, Behandlung nichtkonvexer Vorwissensmengen

Strukturelle Steuerbarkeit

Jia et al. (2020) und andere untersuchen die Ableitung von Steuerbarkeit aus Systemstruktur; dieses Papier kann als Brücke zur Nutzung dieser Strukturinformation in datengesteuerter Regelung betrachtet werden.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Unwirksamkeit des Steuerbarkeitsvorwissens: Wenn bekannt ist, dass das System steuerbar ist, kann dieses Vorwissen die Bedingungen für datengesteuerte Stabilisierung nicht lockern (Theorem 5)
  2. Wirksamkeit des Stabilisierbarkeitvorwissens:
    • Wenn Zustandsdaten vollrangig sind, ist es nicht hilfreich (Theorem 14)
    • Wenn Zustandsdaten rangdefizitär sind, lockert es die Bedingungen erheblich (Theorem 15)
  3. Kontraintuitives Phänomen: Eine stärkere Eigenschaft (Steuerbarkeit) ist nicht hilfreich, eine schwächere Eigenschaft (Stabilisierbarkeit) ist es – der Grund liegt darin, dass möglicherweise alle datenkonsistenten Systeme nicht steuerbar sind
  4. Praktische Entwurfsmethode: Bereitstellung einer berechenbaren LMI-basierten Reglersynthesemethode (Proposition 16)

Theoretische Einsichten

Lehren aus Beispiel 4:

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])
  • rank X⁻ = 1 < 2, Daten nicht informativ
  • Aber alle Systeme in Σ_D∩Σ_stab können durch K=-1 0 stabilisiert werden
  • Schlüssel: Der autonome Teil β nicht-steuerbarer Systeme muss stabil sein (|β|<1)

Bedeutung von Lemma 17: Bietet datengesteuerte Systemzerlegung ohne Kenntnis der Systemmatrizen:

  • Stabilisierbarer Teil: (A₁₁,B₁) direkt aus Daten wiederherstellbar
  • Stabiler autonomer Teil: A₂₂ beeinflusst Stabilisierbarkeit nicht

Einschränkungen

  1. Annahme fehlender Rauschen: Aktuelle Theorie gilt nur für rauschfreie Daten, Erweiterung auf Rauschfall ist offenes Problem
  2. Offline-Daten: Erfordert Vorsammlung eines vollständigen Datensatzes, nicht geeignet für Online-Lernszenarien
  3. Lineare Systeme: Nur LTI-Systeme betrachtet, Erweiterung auf nichtlineare Systeme ist herausfordernd
  4. Binäres Vorwissen: Nur "stabilisierbar" oder "nicht stabilisierbar" betrachtet, keine feinkörnigeren Vorkenntnisse wie Obergrenzen für erreichbare Unterraumdimensionen
  5. Schur-Stabilität: Nur Stabilität betrachtet, keine Leistungsindikatoren (wie H∞-Norm)

Zukünftige Richtungen

  1. Rausch-Robustheit: Erweiterung auf verrauschte Daten, möglicherweise unter Verwendung robuster Regelungstechniken (wie S-Lemma)
  2. Erreichbare Unterraumdimension: Untersuchung von "rank R(A,B) ≤ r" als Vorwissen
  3. Leistungsoptimierung: Kombination von Stabilisierbarkeitvorwissen mit optimalem Reglerentwurf (wie LQR)
  4. Online-Lernen: Entwicklung adaptiver Algorithmen zur Online-Aktualisierung des Reglers
  5. Nichtlineare Erweiterung: Untersuchung ähnlicher Theorie für bilineare oder polynomiale Systeme
  6. Praktische Anwendungen: Validierung der Methode in Robotik, Elektrizitätssystemen und anderen Bereichen

Tiefgreifende Bewertung

Stärken

1. Tiefe theoretischer Beiträge

  • Behandlung nichtkonvexer Vorkenntnisse: Erste Behandlung nichtkonvexer Vorwissensmengen (stabilisierbare/steuerbare Systemmengen sind nichtkonvex) in datengesteuerter Regelung, hohe technische Schwierigkeit
  • Notwendige und hinreichende Bedingungen: Theorem 15 liefert notwendige und hinreichende Bedingungen für rangdefizitären Fall, theoretische Vollständigkeit
  • Kontraintuitive Ergebnisse: Offenlegung des Phänomens, dass Steuerbarkeit nicht hilfreich ist, aber Stabilisierbarkeit ist, mit tiefgreifenden Einsichten

2. Raffinierte Beweistechniken

  • Lemma 7 (Parametrisierte Steuerbarkeit): Nutzung der Polynomialität der Kalman-Matrix, Beweis, dass Steuerbarkeit "fast überall" gilt, technisch geschickt
  • Lemma 9 (Matrizenbündelanalyse): Ableitung von Nilpotenz durch Spureneigenschaften, innovative Technik
  • Lemma 17 (Datengesteuerte Zerlegung): Realisierung der Zerlegung ohne Kenntnis der Systemmatrizen, starke Innovationskraft

3. Starke praktische Anwendbarkeit der Methode

  • LMI-Lösbarkeit: Proposition 16 bietet standardmäßige konvexe Optimierungsprobleme, lösbar mit bestehenden Werkzeugen
  • Designfreiheitsgrade: Beliebigkeit von K₂ bietet Designflexibilität
  • Numerische Validierung: Drei-Tank-Beispiel zeigt Methodenwirksamkeit klar

4. Angemessene experimentelle Gestaltung

  • Monte-Carlo-Analyse: 1000 Szenarien bieten ausreichende statistische Aussagekraft
  • Mehrere Stichprobengrößen: Systematische Untersuchung des Einflusses von T von 3 bis 100
  • Physikalisches System: Drei-Tank-System hat praktische Bedeutung und klare strukturelle Steuerbarkeit

5. Klare und strenge Darstellung

  • Präzise Definitionen, klare Theoremformulierungen
  • Beispiele (Beispiel 4, 6) fördern Verständnis
  • Konsistente Symbolik

Schwächen

1. Theoretische Einschränkungen

  • Problem in Bemerkung 19: Σ_stab-Informativität garantiert keine quadratische Stabilisierung, könnte praktische Anwendungen einschränken
  • Fehlende Konservativitätsanalyse: Keine Quantifizierung, wie viel Daten durch Stabilisierbarkeitvorwissen im Vergleich zu keinem Vorwissen gespart werden
  • Unvollständiger Notwendigkeitsbeweis: Beweis der Notwendigkeit in Theorem 10(b)-(d) hängt von (a) ab, aber Notwendigkeit von (a) selbst ist komplex

2. Unzureichende Experimente

  • Einzelnes Beispiel: Nur Drei-Tank-System, mangelnde Vielfalt (z.B. hochdimensionale Systeme, verschiedene Strukturen)
  • Kein Rauschvergleich: Keine Vergleiche der Robustheit der Methode unter Rauschbedingungen
  • Fehlende Komplexitätsanalyse: Keine Analyse der LMI-Lösungszeit als Funktion von n,T
  • Keine Fehlerfälle: Keine Demonstration von Daten, die Bedingungen von Theorem 15 nicht erfüllen

3. Methodische Einschränkungen

  • K₂-Auswahl: In Proposition 16(b) ist K₂ beliebig, aber keine Auswahlrichtlinien gegeben (z.B. Leistungsoptimierung)
  • Dateneffizienz: Kein Vergleich mit modellgestützten Methoden bezüglich Dateneffizienz
  • Erweiterbarkeit: Keine Diskussion spezieller Überlegungen für MIMO-Systeme

4. Vergleich verwandter Arbeiten

  • Kein Vergleich mit neuesten Deep-Reinforcement-Learning-Methoden
  • Keine Diskussion der Beziehung zu adaptiver Regelung
  • Fehlende Verbindung zu robuster Regelung (wie μ-Synthese)

5. Praktische Überlegungen

  • Vorkenntniserwerb: Keine Diskussion, wie man in der Praxis Systemstabilisierbarkeit verifiziert (könnte teilweise Identifikation erfordern)
  • Fehlerbehandlung: Was tun, wenn LMI (11) nicht lösbar ist?
  • Geschlossenschleife-Daten: Nur offene Daten betrachtet, Geschlossenschleife-Daten nicht behandelt

Bewertung der Auswirkungen

Beitrag zum Bereich

  1. Theoretische Grundlagen: Legt Grundlagen für Integration von Systemtheorieeigenschaften in datengesteuerte Regelung, eröffnet neue Forschungsrichtung
  2. Methodologie: Techniken zur Behandlung nichtkonvexer Vorkenntnisse können auf andere Systemtheorieeigenschaften (wie Passivität, Positivität) verallgemeinert werden
  3. Brückenfunktion: Verbindet strukturelle Steuerbarkeitstheorie mit datengesteuerter Regelung

Praktischer Wert

  1. Reduzierter Datenbedarf: Monte-Carlo-Experimente zeigen Datenbedarf kann auf 1/5 reduziert werden (T=3)
  2. Rangdefizitäre Fälle: Bietet Lösung für in der Praxis häufige rangdefizitäre Daten
  3. Open-Source-Code: GitHub-Code verfügbar, hohe Reproduzierbarkeit

Potenzielle Anwendungen

  1. Robotik: Stabilisierung bei nicht steuerbaren Gelenken
  2. Elektrizitätssysteme: Netzstabilität mit teilweise nicht steuerbaren Generatoren
  3. Prozessregelung: Multi-Tank-, Wärmetauscher-Systeme
  4. Luft- und Raumfahrt: Satellitenlagereglung (bestimmte Modi nicht steuerbar aber stabilisierbar)

Einschränkungen

  1. Hohe theoretische Hürde: Erfordert tiefe Regelungstheorie-Kenntnisse, begrenzte Verbreitung
  2. Unzureichende praktische Validierung: Mangel echter Systemexperimente, Akzeptanz in der Industrie fragwürdig
  3. Rauschempfindlichkeit: Annahme fehlenden Rauschens begrenzt direkte Anwendbarkeit

Anwendbare Szenarien

Ideale Szenarien

  1. Strukturbekannte Systeme: Steuerbarkeit aus Struktur ableitbar (z.B. vernetzte Systeme)
  2. Rangdefizitäre Daten: Anfangsbedingungen führen zu rangdefizitären X⁻, aber System stabilisierbar
  3. Datenarm: Hohe Datenerfassungskosten (z.B. Raumfahrt, Medizin)
  4. Sicherheitskritische Systeme: Theoretische Stabilitätsgarantien erforderlich

Ungeeignete Szenarien

  1. Hochrausch-Umgebung: Aktuelle Theorie nicht anwendbar
  2. Nichtlineare Systeme: Andere Methoden erforderlich
  3. Zeitvariable Systeme: LTI-Annahme nicht erfüllt
  4. Strikte Leistungsanforderungen: Nur Stabilität garantiert, nicht Leistung

Verbesserungsvorschläge

  1. Robuste Methoden: Erweiterung auf beschränktes Rauschen
  2. Leistungsoptimierung: LQR-Kosten unter Stabilisierungsbeschränkung
  3. Online-Aktualisierung: Rekursive Algorithmen
  4. Experimentelle Validierung: Verifikation an realen Systemen (z.B. Drohnen, Industrieprozesse)

Gesamtbewertung

Dies ist ein hochqualitatives theoretisches Regelungspapier mit wichtigen Beiträgen zum Bereich der datengesteuerten Regelung. Hauptmerkmale sind:

  1. Erste systematische Untersuchung von Systemtheorieeigenschaften als Vorwissen
  2. Offenlegung des wesentlichen Unterschieds zwischen Steuerbarkeit und Stabilisierbarkeit
  3. Vollständige notwendige und hinreichende Bedingungen mit berechenbarer Methode

Hauptmängel sind unzureichende experimentelle Validierung und fehlende Rausch-Robustheit.

Empfehlungsindex: ⭐⭐⭐⭐☆ (4/5)

  • Theoretische Tiefe: ⭐⭐⭐⭐⭐
  • Praktischer Wert: ⭐⭐⭐⭐
  • Experimentelle Vollständigkeit: ⭐⭐⭐
  • Darstellungsqualität: ⭐⭐⭐⭐⭐
  • Innovativität: ⭐⭐⭐⭐⭐

Geeignet für Veröffentlichung in Top-Regelungszeitschriften (wie IEEE TAC, Automatica), von großem Referenzwert für Forscher in datengesteuerter Regelung und Systemtheorie.

Ausgewählte Literaturverzeichnis

3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Grundlegende Arbeit zum Dateninformativitätsrahmen)

4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Erste LMI-Methode für datengesteuerte Stabilisierung)

12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Parametergrenzen als Vorwissen)

25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Strukturelle Steuerbarkeitstheorie)

27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Quadratische Stabilisierungstheorie)