Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
Datengesteuerte Stabilisierung unter Verwendung von Vorwissen über Stabilisierbarkeit und Steuerbarkeit
Dieses Papier untersucht das Problem der datengesteuerten Stabilisierung linearer zeitinvarianter Systeme unter Verwendung von Systemtheorieeigenschaften (insbesondere Stabilisierbarkeit und Steuerbarkeit) als Vorwissen. Die Autoren erweitern das Konzept der Dateninformativität mit der Anforderung, dass ein Regler existiert, der alle mit den Daten und dem Vorwissen konsistenten Systeme stabilisiert. Die Forschung zeigt: (1) Wenn das System steuerbar ist, bietet die Verwendung dieser Eigenschaft als Vorwissen keine Lockerung der Bedingungen für datengesteuerte Stabilisierung; (2) Wenn das System stabilisierbar ist, ermöglicht die Verwendung dieses Vorwissens schwächere notwendige und hinreichende Bedingungen im Vergleich zu Fällen ohne Vorwissen. Mit anderen Worten: Wenn bekannt ist, dass das zugrunde liegende System stabilisierbar ist, wird datengesteuerte Stabilisierung leichter erreichbar. Der Artikel bietet auch neue datengesteuerte Kontrolldesignmethoden basierend auf linearen Matrixungleichungen (LMI).
Das Papier adressiert die Frage: Wie entwirft man einen Stabilisierungsregler unter Bedingungen begrenzter Daten, wenn man Vorwissen über die Stabilisierbarkeit oder Steuerbarkeit des Systems hat?
Die traditionelle datengesteuerte Regelung geht davon aus, dass Systemparameter völlig unbekannt sind, aber für die meisten physikalischen Systeme ist diese Annahme zu konservativ. In der Praxis verfügen wir häufig über Vorwissen (wie Bereiche physikalischer Größen wie Masse oder Federkonstanten, oder aus der Systemstruktur ableitbare Steuerbarkeits-/Stabilisierbarkeitseigenschaften).
Reduzierung des Datenbedarfs: Der direkte Entwurf von Reglern aus Daten kann große Datenmengen erfordern, um Persistenzanregungsbedingungen zu erfüllen, aber die Kombination mit Vorwissen könnte Stabilisierung mit weniger Daten ermöglichen
Praktische Machbarkeit: In einigen Fällen ist es unmöglich, Stabilisierungsregler nur aus Daten zu entwerfen (z.B. wenn Zustandsdaten rangdefizitär sind), aber die Hinzunahme von Vorwissen könnte den Entwurf machbar machen
Theoretische Vollständigkeit: Systemtheorieeigenschaften (Steuerbarkeit, Stabilisierbarkeit) sind grundlegende Konzepte der Regelungstheorie, wurden aber im datengesteuerten Rahmen noch nicht ausreichend untersucht
Datengesteuerte Regelung: Bestehende Arbeiten (wie De Persis & Tesi 2019, van Waarde et al. 2020) untersuchen hauptsächlich Fälle ohne Vorwissen und erfordern strikte Datenbedingungen (wie Persistenzanregung, Vollrang der Zustandsdaten)
Integration von Vorwissen: Bisherige Forschung beschränkt sich auf Parametergrenzen 12-14 oder teilweise bekannte Parameter 15, berücksichtigt aber nicht Systemtheorieeigenschaften
Nichtkonvexitätsherausforderung: Die Mengen stabilisierbarer und steuerbarer Systeme sind nichtkonvex, anders als die konvexen Systemmengen in bestehenden Arbeiten
In vielen praktischen Anwendungen kann die Steuerbarkeit oder Stabilisierbarkeit aus der Systemstruktur abgeleitet werden (strukturelle Steuerbarkeitstheorie), aber solches Vorwissen wird in der datengesteuerten Regelung noch nicht genutzt. Dieses Papier schließt diese theoretische Lücke.
Erweiterung des theoretischen Rahmens: Erweiterung des Konzepts der Dateninformativität zur Einbeziehung von Vorwissen mit der Definition von Σ_pk-Informativität (Definition 3)
Äquivalenzsatz für Steuerbarkeitsvorwissen (Theorem 5): Beweis, dass die Verwendung von Steuerbarkeit als Vorwissen äquivalent zum Fall ohne Vorwissen ist, d.h. Steuerbarkeitsvorwissen kann Datenbedingungen nicht lockern
Vorteilssätze für Stabilisierbarkeitvorwissen (Theoreme 14, 15):
Wenn Zustandsdaten vollrangig sind (rank X⁻ = n), bietet Stabilisierbarkeitvorwissen keine zusätzliche Hilfe
Wenn Zustandsdaten rangdefizitär sind (rank X⁻ < n), lockert Stabilisierbarkeitvorwissen die Bedingungen erheblich und liefert notwendige und hinreichende Bedingungen
Berechenbare Entwurfsmethode (Proposition 16): Bereitstellung einer LMI-basierten Methode zur Berechnung von Stabilisierungsreglern direkt aus Σ_stab-informativen Daten
Theoretische Einsichten: Offenlegung des scheinbar paradoxen Phänomens, dass eine stärkere Eigenschaft (Steuerbarkeit) die Bedingungen nicht lockert, während eine schwächere Eigenschaft (Stabilisierbarkeit) dies tut – dies liegt daran, dass in einigen Fällen alle datenkonsistenten Systeme nicht steuerbar sind
Definition 3 (Σ_pk-Informativität für Stabilisierung):
Daten D heißen Σ_pk-informativ für Stabilisierung, wenn ein K∈ℝᵐˣⁿ existiert, sodass A+BK für alle (A,B)∈Σ_D∩Σ_pk Schur-stabil ist.
Theorem 5 (Kernergebnis): Angenommen (A_true, B_true)∈Σ_cont, dann sind folgende äquivalent:
(a) Daten D sind Σ_cont-informativ für Stabilisierung
(b) Daten D sind informativ für Stabilisierung (ohne Vorwissen)
Beweisidee:
(b)⇒(a) ist offensichtlich
(a)⇒(b) ist der Schlüssel:
Wenn Σ_D⊆Σ_cont, ist die Schlussfolgerung offensichtlich
Wenn ein nicht-steuerbares (Ā,B̄)∈Σ_D existiert, nutze Lemma 7 (Parametrisierung von Systemfamilien, die fast überall steuerbar sind) und Lemma 9 (Stabilität von Matrizenbündeln), um zu zeigen, dass der Stabilisierungsregler K auch (Ā,B̄) stabilisiert
Schlüssellemmata:
Lemma 7: Wenn (M,N) steuerbar ist, dann ist (M+αM₀, N+αN₀) für alle außer höchstens n² Werte von α steuerbar
Lemma 9: Wenn M+δN für alle δ∈[ε,∞)\F (F endlich) Schur-stabil ist, dann ist N nilpotent und M+δN ist für alle δ∈ℝ Schur-stabil
Wenn Daten Σ_stab-informativ sind und K ein Stabilisierungsgewinn ist, dann:
(a) (A₀+B₀K)R(A,B) = {0} für alle (A,B)∈Σ_D∩Σ_stab und (A₀,B₀)∈Σ⁰_D
(b) Wenn rank X⁻ < n, dann imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ ist A-invariant und enthält im B
Bemerkung 11: Bedingung (a) ist eine Lockerung von A₀+B₀K=0 aus dem Fall ohne Vorwissen; Bedingungen (b)-(d) sind automatisch erfüllt, wenn rank X⁻ = n, aber nicht-trivial im rangdefizitären Fall.
Wenn das wahre System steuerbar ist, folgt die Schlussfolgerung aus Theorem 5
Wenn das wahre System nicht steuerbar ist, konstruiere K̂ sodass für alle (A,B)∈Σ_D gilt A+BK̂ = A_true+B_true K̂, dann zeige, dass letzteres Schur-stabil ist
De Persis & Tesi (2019): Erste Arbeit zum direkten Entwurf von Stabilisierungsreglern aus Daten mit LMI-Methode, erfordert Persistenzanregung
van Waarde et al. (2020): Einführung des Dateninformativitätsrahmens mit notwendigen und hinreichenden Bedingungen, keine eindeutige Identifikation erforderlich
Rauschfall: van Waarde et al. (2020), Li et al. (2026) untersuchen Reglersynthese mit verrauschten Daten
Jia et al. (2020) und andere untersuchen die Ableitung von Steuerbarkeit aus Systemstruktur; dieses Papier kann als Brücke zur Nutzung dieser Strukturinformation in datengesteuerter Regelung betrachtet werden.
Unwirksamkeit des Steuerbarkeitsvorwissens: Wenn bekannt ist, dass das System steuerbar ist, kann dieses Vorwissen die Bedingungen für datengesteuerte Stabilisierung nicht lockern (Theorem 5)
Wirksamkeit des Stabilisierbarkeitvorwissens:
Wenn Zustandsdaten vollrangig sind, ist es nicht hilfreich (Theorem 14)
Wenn Zustandsdaten rangdefizitär sind, lockert es die Bedingungen erheblich (Theorem 15)
Kontraintuitives Phänomen: Eine stärkere Eigenschaft (Steuerbarkeit) ist nicht hilfreich, eine schwächere Eigenschaft (Stabilisierbarkeit) ist es – der Grund liegt darin, dass möglicherweise alle datenkonsistenten Systeme nicht steuerbar sind
Praktische Entwurfsmethode: Bereitstellung einer berechenbaren LMI-basierten Reglersynthesemethode (Proposition 16)
Annahme fehlender Rauschen: Aktuelle Theorie gilt nur für rauschfreie Daten, Erweiterung auf Rauschfall ist offenes Problem
Offline-Daten: Erfordert Vorsammlung eines vollständigen Datensatzes, nicht geeignet für Online-Lernszenarien
Lineare Systeme: Nur LTI-Systeme betrachtet, Erweiterung auf nichtlineare Systeme ist herausfordernd
Binäres Vorwissen: Nur "stabilisierbar" oder "nicht stabilisierbar" betrachtet, keine feinkörnigeren Vorkenntnisse wie Obergrenzen für erreichbare Unterraumdimensionen
Schur-Stabilität: Nur Stabilität betrachtet, keine Leistungsindikatoren (wie H∞-Norm)
Behandlung nichtkonvexer Vorkenntnisse: Erste Behandlung nichtkonvexer Vorwissensmengen (stabilisierbare/steuerbare Systemmengen sind nichtkonvex) in datengesteuerter Regelung, hohe technische Schwierigkeit
Notwendige und hinreichende Bedingungen: Theorem 15 liefert notwendige und hinreichende Bedingungen für rangdefizitären Fall, theoretische Vollständigkeit
Kontraintuitive Ergebnisse: Offenlegung des Phänomens, dass Steuerbarkeit nicht hilfreich ist, aber Stabilisierbarkeit ist, mit tiefgreifenden Einsichten
Problem in Bemerkung 19: Σ_stab-Informativität garantiert keine quadratische Stabilisierung, könnte praktische Anwendungen einschränken
Fehlende Konservativitätsanalyse: Keine Quantifizierung, wie viel Daten durch Stabilisierbarkeitvorwissen im Vergleich zu keinem Vorwissen gespart werden
Unvollständiger Notwendigkeitsbeweis: Beweis der Notwendigkeit in Theorem 10(b)-(d) hängt von (a) ab, aber Notwendigkeit von (a) selbst ist komplex
Theoretische Grundlagen: Legt Grundlagen für Integration von Systemtheorieeigenschaften in datengesteuerte Regelung, eröffnet neue Forschungsrichtung
Methodologie: Techniken zur Behandlung nichtkonvexer Vorkenntnisse können auf andere Systemtheorieeigenschaften (wie Passivität, Positivität) verallgemeinert werden
Brückenfunktion: Verbindet strukturelle Steuerbarkeitstheorie mit datengesteuerter Regelung
Dies ist ein hochqualitatives theoretisches Regelungspapier mit wichtigen Beiträgen zum Bereich der datengesteuerten Regelung. Hauptmerkmale sind:
Erste systematische Untersuchung von Systemtheorieeigenschaften als Vorwissen
Offenlegung des wesentlichen Unterschieds zwischen Steuerbarkeit und Stabilisierbarkeit
Vollständige notwendige und hinreichende Bedingungen mit berechenbarer Methode
Hauptmängel sind unzureichende experimentelle Validierung und fehlende Rausch-Robustheit.
Empfehlungsindex: ⭐⭐⭐⭐☆ (4/5)
Theoretische Tiefe: ⭐⭐⭐⭐⭐
Praktischer Wert: ⭐⭐⭐⭐
Experimentelle Vollständigkeit: ⭐⭐⭐
Darstellungsqualität: ⭐⭐⭐⭐⭐
Innovativität: ⭐⭐⭐⭐⭐
Geeignet für Veröffentlichung in Top-Regelungszeitschriften (wie IEEE TAC, Automatica), von großem Referenzwert für Forscher in datengesteuerter Regelung und Systemtheorie.
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Grundlegende Arbeit zum Dateninformativitätsrahmen)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Erste LMI-Methode für datengesteuerte Stabilisierung)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Parametergrenzen als Vorwissen)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Strukturelle Steuerbarkeitstheorie)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Quadratische Stabilisierungstheorie)