2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.

In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.

academic

Datengesteuerte Stabilisierung unter Verwendung von Vorwissen über Stabilisierbarkeit und Steuerbarkeit

Grundlegende Informationen

Papier-ID: 2510.25452
Titel: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Autoren: Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels
Institutionen: Universität Groningen (Shakouri, van Waarde), Technische Universität Eindhoven (Baltussen, Heemels)
Klassifikation: math.OC (Optimierung und Regelung), cs.SY, eess.SY (Systeme und Regelung)
Veröffentlichungsdatum: arXiv v2, 30. Oktober 2025
Papier-Link: https://arxiv.org/abs/2510.25452v2

Zusammenfassung

Dieses Papier untersucht das Problem der datengesteuerten Stabilisierung linearer zeitinvarianter Systeme unter Verwendung von Systemtheorieeigenschaften (insbesondere Stabilisierbarkeit und Steuerbarkeit) als Vorwissen. Die Autoren erweitern das Konzept der Dateninformativität mit der Anforderung, dass ein Regler existiert, der alle mit den Daten und dem Vorwissen konsistenten Systeme stabilisiert. Die Forschung zeigt: (1) Wenn das System steuerbar ist, bietet die Verwendung dieser Eigenschaft als Vorwissen keine Lockerung der Bedingungen für datengesteuerte Stabilisierung; (2) Wenn das System stabilisierbar ist, ermöglicht die Verwendung dieses Vorwissens schwächere notwendige und hinreichende Bedingungen im Vergleich zu Fällen ohne Vorwissen. Mit anderen Worten: Wenn bekannt ist, dass das zugrunde liegende System stabilisierbar ist, wird datengesteuerte Stabilisierung leichter erreichbar. Der Artikel bietet auch neue datengesteuerte Kontrolldesignmethoden basierend auf linearen Matrixungleichungen (LMI).

Forschungshintergrund und Motivation

Kernproblem

Das Papier adressiert die Frage: Wie entwirft man einen Stabilisierungsregler unter Bedingungen begrenzter Daten, wenn man Vorwissen über die Stabilisierbarkeit oder Steuerbarkeit des Systems hat?

Die traditionelle datengesteuerte Regelung geht davon aus, dass Systemparameter völlig unbekannt sind, aber für die meisten physikalischen Systeme ist diese Annahme zu konservativ. In der Praxis verfügen wir häufig über Vorwissen (wie Bereiche physikalischer Größen wie Masse oder Federkonstanten, oder aus der Systemstruktur ableitbare Steuerbarkeits-/Stabilisierbarkeitseigenschaften).

Bedeutung des Problems

Reduzierung des Datenbedarfs: Der direkte Entwurf von Reglern aus Daten kann große Datenmengen erfordern, um Persistenzanregungsbedingungen zu erfüllen, aber die Kombination mit Vorwissen könnte Stabilisierung mit weniger Daten ermöglichen
Praktische Machbarkeit: In einigen Fällen ist es unmöglich, Stabilisierungsregler nur aus Daten zu entwerfen (z.B. wenn Zustandsdaten rangdefizitär sind), aber die Hinzunahme von Vorwissen könnte den Entwurf machbar machen
Theoretische Vollständigkeit: Systemtheorieeigenschaften (Steuerbarkeit, Stabilisierbarkeit) sind grundlegende Konzepte der Regelungstheorie, wurden aber im datengesteuerten Rahmen noch nicht ausreichend untersucht

Einschränkungen bestehender Methoden

Datengesteuerte Regelung: Bestehende Arbeiten (wie De Persis & Tesi 2019, van Waarde et al. 2020) untersuchen hauptsächlich Fälle ohne Vorwissen und erfordern strikte Datenbedingungen (wie Persistenzanregung, Vollrang der Zustandsdaten)
Integration von Vorwissen: Bisherige Forschung beschränkt sich auf Parametergrenzen 12-14 oder teilweise bekannte Parameter 15, berücksichtigt aber nicht Systemtheorieeigenschaften
Nichtkonvexitätsherausforderung: Die Mengen stabilisierbarer und steuerbarer Systeme sind nichtkonvex, anders als die konvexen Systemmengen in bestehenden Arbeiten

Forschungsmotivation

In vielen praktischen Anwendungen kann die Steuerbarkeit oder Stabilisierbarkeit aus der Systemstruktur abgeleitet werden (strukturelle Steuerbarkeitstheorie), aber solches Vorwissen wird in der datengesteuerten Regelung noch nicht genutzt. Dieses Papier schließt diese theoretische Lücke.

Kernbeiträge

Die Hauptbeiträge dieses Papiers sind:

Erweiterung des theoretischen Rahmens: Erweiterung des Konzepts der Dateninformativität zur Einbeziehung von Vorwissen mit der Definition von Σ_pk-Informativität (Definition 3)
Äquivalenzsatz für Steuerbarkeitsvorwissen (Theorem 5): Beweis, dass die Verwendung von Steuerbarkeit als Vorwissen äquivalent zum Fall ohne Vorwissen ist, d.h. Steuerbarkeitsvorwissen kann Datenbedingungen nicht lockern
Vorteilssätze für Stabilisierbarkeitvorwissen (Theoreme 14, 15):
- Wenn Zustandsdaten vollrangig sind (rank X⁻ = n), bietet Stabilisierbarkeitvorwissen keine zusätzliche Hilfe
- Wenn Zustandsdaten rangdefizitär sind (rank X⁻ < n), lockert Stabilisierbarkeitvorwissen die Bedingungen erheblich und liefert notwendige und hinreichende Bedingungen
Berechenbare Entwurfsmethode (Proposition 16): Bereitstellung einer LMI-basierten Methode zur Berechnung von Stabilisierungsreglern direkt aus Σ_stab-informativen Daten
Theoretische Einsichten: Offenlegung des scheinbar paradoxen Phänomens, dass eine stärkere Eigenschaft (Steuerbarkeit) die Bedingungen nicht lockert, während eine schwächere Eigenschaft (Stabilisierbarkeit) dies tut – dies liegt daran, dass in einigen Fällen alle datenkonsistenten Systeme nicht steuerbar sind

Methodische Details

Aufgabendefinition

Systemmodell: Betrachtung eines diskreten LTI-Systems

x(t+1) = A_true x(t) + B_true u(t)

wobei x(t)∈ℝⁿ der Zustand, u(t)∈ℝᵐ die Eingabe und die Systemmatrizen (A_true, B_true) unbekannt sind.

Daten: Von Zeit 0 bis T gesammelte Eingabe-Zustandsdaten

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

Definition der Datenmatrizen:

U⁻ = u(0),...,u(T-1)
X⁻ = x(0),...,x(T-1)
X⁺ = x(1),...,x(T)

Datenkonsistente Systemenmenge:

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

Ziel: Finden einer Rückkopplungsverstärkung K, sodass A+BK für alle (A,B)∈Σ_D∩Σ_pk Schur-stabil ist (alle Eigenwerte mit Betrag <1)

Kernkonzepte

Definition 3 (Σ_pk-Informativität für Stabilisierung): Daten D heißen Σ_pk-informativ für Stabilisierung, wenn ein K∈ℝᵐˣⁿ existiert, sodass A+BK für alle (A,B)∈Σ_D∩Σ_pk Schur-stabil ist.

Vorwissensmengen:

Σ_cont: Menge aller steuerbaren Systempaare
Σ_stab: Menge aller stabilisierbaren Systempaare

Steuerbarkeit als Vorwissen (Abschnitt III)

Theorem 5 (Kernergebnis): Angenommen (A_true, B_true)∈Σ_cont, dann sind folgende äquivalent:

(a) Daten D sind Σ_cont-informativ für Stabilisierung
(b) Daten D sind informativ für Stabilisierung (ohne Vorwissen)

Beweisidee:

(b)⇒(a) ist offensichtlich
(a)⇒(b) ist der Schlüssel:
- Wenn Σ_D⊆Σ_cont, ist die Schlussfolgerung offensichtlich
- Wenn ein nicht-steuerbares (Ā,B̄)∈Σ_D existiert, nutze Lemma 7 (Parametrisierung von Systemfamilien, die fast überall steuerbar sind) und Lemma 9 (Stabilität von Matrizenbündeln), um zu zeigen, dass der Stabilisierungsregler K auch (Ā,B̄) stabilisiert

Schlüssellemmata:

Lemma 7: Wenn (M,N) steuerbar ist, dann ist (M+αM₀, N+αN₀) für alle außer höchstens n² Werte von α steuerbar
Lemma 9: Wenn M+δN für alle δ∈[ε,∞)\F (F endlich) Schur-stabil ist, dann ist N nilpotent und M+δN ist für alle δ∈ℝ Schur-stabil

Stabilisierbarkeit als Vorwissen (Abschnitt IV)

A. Notwendige Bedingungen (Theorem 10)

Wenn Daten Σ_stab-informativ sind und K ein Stabilisierungsgewinn ist, dann:

(a) (A₀+B₀K)R(A,B) = {0} für alle (A,B)∈Σ_D∩Σ_stab und (A₀,B₀)∈Σ⁰_D
(b) Wenn rank X⁻ < n, dann imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ ist A-invariant und enthält im B

Bemerkung 11: Bedingung (a) ist eine Lockerung von A₀+B₀K=0 aus dem Fall ohne Vorwissen; Bedingungen (b)-(d) sind automatisch erfüllt, wenn rank X⁻ = n, aber nicht-trivial im rangdefizitären Fall.

B. Vollrangiger Fall (Theorem 14)

Theorem 14: Wenn (A_true,B_true)∈Σ_stab und rank X⁻ = n, dann:

Σ_stab-Informativität ⟺ Informativität (ohne Vorwissen)

Beweisidee:

Wenn das wahre System steuerbar ist, folgt die Schlussfolgerung aus Theorem 5
Wenn das wahre System nicht steuerbar ist, konstruiere K̂ sodass für alle (A,B)∈Σ_D gilt A+BK̂ = A_true+B_true K̂, dann zeige, dass letzteres Schur-stabil ist

C. Rangdefizitärer Fall (Theorem 15, Kernergebnis)

Theorem 15: Wenn (A_true,B_true)∈Σ_stab und rank X⁻ < n, dann sind Daten D Σ_stab-informativ genau dann, wenn:

(a) im X⁺ ⊆ im X⁻
(b) imX⁻;U⁻ = im X⁻ × ℝᵐ

Schlüssellemma (Lemma 17): Wenn Bedingungen (a)(b) erfüllt sind, dann existiert für alle (A,B)∈Σ_D∩Σ_stab eine Transformationsmatrix S mit:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

wobei (A₁₁,B₁) stabilisierbar ist, A₂₂ Schur-stabil ist, und A₁₁ B₁ = X̂⁺X̂⁻;U⁻†

Dies bietet eine datengesteuerte Kalman-Zerlegung.

Reglersynthesemethode (Proposition 16)

Proposition 16: Wenn Daten Σ_stab-informativ sind und rank X⁻ = r < n:

(a) Es existiert Θ∈ℝᵀˣʳ, sodass die LMI lösbar ist:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) Wenn Θ Bedingung (11) erfüllt, setze K = K₁ K₂S, wobei:

K₁ = U⁻Θ(X̂⁻Θ)⁻¹
K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾ beliebig dann ist A+BK für alle (A,B)∈Σ_D∩Σ_stab Schur-stabil

Entwurfsschritte:

Berechne QR-Zerlegung von X⁻ zur Gewinnung von S und X̂⁻
Löse LMI (11) zur Gewinnung von Θ
Berechne K₁ = U⁻Θ(X̂⁻Θ)⁻¹
Wähle K₂ beliebig und konstruiere K = K₁ K₂S

Experimentelle Einrichtung

Numerisches Beispiel: Drei-Tank-System

Systembeschreibung (Abbildung 2):

3 hintereinander geschaltete Tanks, Flüssigkeit fließt von Tank 3 zu Tank 2 zu Tank 1
Zustand: x_i ist die Flüssigkeitshöhe in Tank i (i=1,2,3)
Steuereingang: u ist die Durchflussrate zwischen Tank 2 und Speicherbehälter
Strukturelle Eigenschaft: Aufgrund der Einwegströmung ist x₃ nicht steuerbar

Kontinuierliches Zeitmodell:

ẋ = A_c x + B_c u

wobei:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

Diskretisierung (Abtastzeit 0,1s):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

Experimentelle Daten

Offenschleife-Experiment (T=5):

t	0	1	2	3	4	5
u(t)		1	0	-1	0	1
x₁	1	1.04	1.0778	1.1086	1.1334	1.1575
x₂	2	2.0498	2.0015	1.8597	1.8237	1.8881
x₃	0	0	0	0	0	0

Dateneigenschaften: rank X⁻ = 2 < 3 (rangdefizitär)

Lösungsprozess

Verwendung von MATLAB + YALMIP + MOSEK zur Lösung der LMI (11)
Gewinnung von Θ (5×2-Matrix)
Berechnung von K₁ = -2.7728 -9.7123
Setzen von K₂ = 0, Gewinnung von K = -2.7728 -9.7123 0

Monte-Carlo-Experiment

Experimentelle Einrichtung:

1000 zufällige Szenarien
Jedes Szenario: Simulation des Systems von t=0 bis t=100
Eingaben und Anfangsbedingungen unabhängig aus Poisson-Verteilung (λ=1) gezogen
Analyse der Dateninformativität für verschiedene Stichprobengrößen T = 3, 4, 5, 10, 100

Bewertungsmetriken:

Systemidentifikationsinformativität (rankX⁻ᵀ U⁻ᵀ = n+m)
Stabilisierungsinformativität ohne Vorwissen
Σ_stab-Stabilisierungsinformativität

Experimentelle Ergebnisse

Hauptergebnisse (Tabelle I)

T	Systemidentifikationsinformativität	Stabilisierungsinformativität (ohne Vorwissen)	Σ_stab-Stabilisierungsinformativität
3	0%	8.1%	42%
4	62.4%	63.2%	99.4%
5	62.8%	63.2%	99.8%
10	63.2%	63.2%	100%
100	63.2%	63.2%	100%

Schlüsselfunde

Signifikanter Vorteil bei T=3:
- Systemidentifikation unmöglich (T < n+m)
- Nur 8,1% der Daten für Stabilisierung ohne Vorwissen nutzbar
- 42% der Daten für Σ_stab-Stabilisierung nutzbar (5-fache Verbesserung)
Konvergenzverhalten bei T≥4:
- Systemidentifikations- und Stabilisierungsinformativität ohne Vorwissen stabilisieren sich bei 63,2%
- Dies liegt daran, dass etwa 36,8% der zufälligen Daten notwendige Bedingungen nicht erfüllen
Vollständige Abdeckung bei T≥10:
- 100% der Daten sind Σ_stab-informativ
- Zeigt deutlich die Stärke des Stabilisierbarkeitvorwissens

Fallvalidierung

Für die gegebenen T=5-Daten:

X⁻ nicht vollrangig, Proposition 2 nicht anwendbar (nicht nutzbar für Stabilisierung ohne Vorwissen)
Aber erfüllt Bedingungen von Theorem 15
Erfolgreiche Lösung der LMI zur Gewinnung des Stabilisierungsgewinns K

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Unwirksamkeit des Steuerbarkeitsvorwissens: Wenn bekannt ist, dass das System steuerbar ist, kann dieses Vorwissen die Bedingungen für datengesteuerte Stabilisierung nicht lockern (Theorem 5)
Wirksamkeit des Stabilisierbarkeitvorwissens:
- Wenn Zustandsdaten vollrangig sind, ist es nicht hilfreich (Theorem 14)
- Wenn Zustandsdaten rangdefizitär sind, lockert es die Bedingungen erheblich (Theorem 15)
Kontraintuitives Phänomen: Eine stärkere Eigenschaft (Steuerbarkeit) ist nicht hilfreich, eine schwächere Eigenschaft (Stabilisierbarkeit) ist es – der Grund liegt darin, dass möglicherweise alle datenkonsistenten Systeme nicht steuerbar sind
Praktische Entwurfsmethode: Bereitstellung einer berechenbaren LMI-basierten Reglersynthesemethode (Proposition 16)

Theoretische Einsichten

Lehren aus Beispiel 4:

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])

rank X⁻ = 1 < 2, Daten nicht informativ
Aber alle Systeme in Σ_D∩Σ_stab können durch K=-1 0 stabilisiert werden
Schlüssel: Der autonome Teil β nicht-steuerbarer Systeme muss stabil sein (|β|<1)

Bedeutung von Lemma 17: Bietet datengesteuerte Systemzerlegung ohne Kenntnis der Systemmatrizen:

Stabilisierbarer Teil: (A₁₁,B₁) direkt aus Daten wiederherstellbar
Stabiler autonomer Teil: A₂₂ beeinflusst Stabilisierbarkeit nicht

Einschränkungen

Annahme fehlender Rauschen: Aktuelle Theorie gilt nur für rauschfreie Daten, Erweiterung auf Rauschfall ist offenes Problem
Offline-Daten: Erfordert Vorsammlung eines vollständigen Datensatzes, nicht geeignet für Online-Lernszenarien
Lineare Systeme: Nur LTI-Systeme betrachtet, Erweiterung auf nichtlineare Systeme ist herausfordernd
Binäres Vorwissen: Nur "stabilisierbar" oder "nicht stabilisierbar" betrachtet, keine feinkörnigeren Vorkenntnisse wie Obergrenzen für erreichbare Unterraumdimensionen
Schur-Stabilität: Nur Stabilität betrachtet, keine Leistungsindikatoren (wie H∞-Norm)

Zukünftige Richtungen

Rausch-Robustheit: Erweiterung auf verrauschte Daten, möglicherweise unter Verwendung robuster Regelungstechniken (wie S-Lemma)
Erreichbare Unterraumdimension: Untersuchung von "rank R(A,B) ≤ r" als Vorwissen
Leistungsoptimierung: Kombination von Stabilisierbarkeitvorwissen mit optimalem Reglerentwurf (wie LQR)
Online-Lernen: Entwicklung adaptiver Algorithmen zur Online-Aktualisierung des Reglers
Nichtlineare Erweiterung: Untersuchung ähnlicher Theorie für bilineare oder polynomiale Systeme
Praktische Anwendungen: Validierung der Methode in Robotik, Elektrizitätssystemen und anderen Bereichen

Tiefgreifende Bewertung

Stärken

1. Tiefe theoretischer Beiträge

Behandlung nichtkonvexer Vorkenntnisse: Erste Behandlung nichtkonvexer Vorwissensmengen (stabilisierbare/steuerbare Systemmengen sind nichtkonvex) in datengesteuerter Regelung, hohe technische Schwierigkeit
Notwendige und hinreichende Bedingungen: Theorem 15 liefert notwendige und hinreichende Bedingungen für rangdefizitären Fall, theoretische Vollständigkeit
Kontraintuitive Ergebnisse: Offenlegung des Phänomens, dass Steuerbarkeit nicht hilfreich ist, aber Stabilisierbarkeit ist, mit tiefgreifenden Einsichten

2. Raffinierte Beweistechniken

Lemma 7 (Parametrisierte Steuerbarkeit): Nutzung der Polynomialität der Kalman-Matrix, Beweis, dass Steuerbarkeit "fast überall" gilt, technisch geschickt
Lemma 9 (Matrizenbündelanalyse): Ableitung von Nilpotenz durch Spureneigenschaften, innovative Technik
Lemma 17 (Datengesteuerte Zerlegung): Realisierung der Zerlegung ohne Kenntnis der Systemmatrizen, starke Innovationskraft

3. Starke praktische Anwendbarkeit der Methode

LMI-Lösbarkeit: Proposition 16 bietet standardmäßige konvexe Optimierungsprobleme, lösbar mit bestehenden Werkzeugen
Designfreiheitsgrade: Beliebigkeit von K₂ bietet Designflexibilität
Numerische Validierung: Drei-Tank-Beispiel zeigt Methodenwirksamkeit klar

4. Angemessene experimentelle Gestaltung

Monte-Carlo-Analyse: 1000 Szenarien bieten ausreichende statistische Aussagekraft
Mehrere Stichprobengrößen: Systematische Untersuchung des Einflusses von T von 3 bis 100
Physikalisches System: Drei-Tank-System hat praktische Bedeutung und klare strukturelle Steuerbarkeit

5. Klare und strenge Darstellung

Präzise Definitionen, klare Theoremformulierungen
Beispiele (Beispiel 4, 6) fördern Verständnis
Konsistente Symbolik

Schwächen

1. Theoretische Einschränkungen

Problem in Bemerkung 19: Σ_stab-Informativität garantiert keine quadratische Stabilisierung, könnte praktische Anwendungen einschränken
Fehlende Konservativitätsanalyse: Keine Quantifizierung, wie viel Daten durch Stabilisierbarkeitvorwissen im Vergleich zu keinem Vorwissen gespart werden
Unvollständiger Notwendigkeitsbeweis: Beweis der Notwendigkeit in Theorem 10(b)-(d) hängt von (a) ab, aber Notwendigkeit von (a) selbst ist komplex

2. Unzureichende Experimente

Einzelnes Beispiel: Nur Drei-Tank-System, mangelnde Vielfalt (z.B. hochdimensionale Systeme, verschiedene Strukturen)
Kein Rauschvergleich: Keine Vergleiche der Robustheit der Methode unter Rauschbedingungen
Fehlende Komplexitätsanalyse: Keine Analyse der LMI-Lösungszeit als Funktion von n,T
Keine Fehlerfälle: Keine Demonstration von Daten, die Bedingungen von Theorem 15 nicht erfüllen

3. Methodische Einschränkungen

K₂-Auswahl: In Proposition 16(b) ist K₂ beliebig, aber keine Auswahlrichtlinien gegeben (z.B. Leistungsoptimierung)
Dateneffizienz: Kein Vergleich mit modellgestützten Methoden bezüglich Dateneffizienz
Erweiterbarkeit: Keine Diskussion spezieller Überlegungen für MIMO-Systeme

4. Vergleich verwandter Arbeiten

Kein Vergleich mit neuesten Deep-Reinforcement-Learning-Methoden
Keine Diskussion der Beziehung zu adaptiver Regelung
Fehlende Verbindung zu robuster Regelung (wie μ-Synthese)

5. Praktische Überlegungen

Vorkenntniserwerb: Keine Diskussion, wie man in der Praxis Systemstabilisierbarkeit verifiziert (könnte teilweise Identifikation erfordern)
Fehlerbehandlung: Was tun, wenn LMI (11) nicht lösbar ist?
Geschlossenschleife-Daten: Nur offene Daten betrachtet, Geschlossenschleife-Daten nicht behandelt

Bewertung der Auswirkungen

Beitrag zum Bereich

Theoretische Grundlagen: Legt Grundlagen für Integration von Systemtheorieeigenschaften in datengesteuerte Regelung, eröffnet neue Forschungsrichtung
Methodologie: Techniken zur Behandlung nichtkonvexer Vorkenntnisse können auf andere Systemtheorieeigenschaften (wie Passivität, Positivität) verallgemeinert werden
Brückenfunktion: Verbindet strukturelle Steuerbarkeitstheorie mit datengesteuerter Regelung

Praktischer Wert

Reduzierter Datenbedarf: Monte-Carlo-Experimente zeigen Datenbedarf kann auf 1/5 reduziert werden (T=3)
Rangdefizitäre Fälle: Bietet Lösung für in der Praxis häufige rangdefizitäre Daten
Open-Source-Code: GitHub-Code verfügbar, hohe Reproduzierbarkeit

Potenzielle Anwendungen

Robotik: Stabilisierung bei nicht steuerbaren Gelenken
Elektrizitätssysteme: Netzstabilität mit teilweise nicht steuerbaren Generatoren
Prozessregelung: Multi-Tank-, Wärmetauscher-Systeme
Luft- und Raumfahrt: Satellitenlagereglung (bestimmte Modi nicht steuerbar aber stabilisierbar)

Einschränkungen

Hohe theoretische Hürde: Erfordert tiefe Regelungstheorie-Kenntnisse, begrenzte Verbreitung
Unzureichende praktische Validierung: Mangel echter Systemexperimente, Akzeptanz in der Industrie fragwürdig
Rauschempfindlichkeit: Annahme fehlenden Rauschens begrenzt direkte Anwendbarkeit

Anwendbare Szenarien

Ideale Szenarien

Strukturbekannte Systeme: Steuerbarkeit aus Struktur ableitbar (z.B. vernetzte Systeme)
Rangdefizitäre Daten: Anfangsbedingungen führen zu rangdefizitären X⁻, aber System stabilisierbar
Datenarm: Hohe Datenerfassungskosten (z.B. Raumfahrt, Medizin)
Sicherheitskritische Systeme: Theoretische Stabilitätsgarantien erforderlich

Ungeeignete Szenarien

Hochrausch-Umgebung: Aktuelle Theorie nicht anwendbar
Nichtlineare Systeme: Andere Methoden erforderlich
Zeitvariable Systeme: LTI-Annahme nicht erfüllt
Strikte Leistungsanforderungen: Nur Stabilität garantiert, nicht Leistung

Verbesserungsvorschläge

Robuste Methoden: Erweiterung auf beschränktes Rauschen
Leistungsoptimierung: LQR-Kosten unter Stabilisierungsbeschränkung
Online-Aktualisierung: Rekursive Algorithmen
Experimentelle Validierung: Verifikation an realen Systemen (z.B. Drohnen, Industrieprozesse)

Gesamtbewertung

Dies ist ein hochqualitatives theoretisches Regelungspapier mit wichtigen Beiträgen zum Bereich der datengesteuerten Regelung. Hauptmerkmale sind:

Erste systematische Untersuchung von Systemtheorieeigenschaften als Vorwissen
Offenlegung des wesentlichen Unterschieds zwischen Steuerbarkeit und Stabilisierbarkeit
Vollständige notwendige und hinreichende Bedingungen mit berechenbarer Methode

Hauptmängel sind unzureichende experimentelle Validierung und fehlende Rausch-Robustheit.

Empfehlungsindex: ⭐⭐⭐⭐☆ (4/5)

Theoretische Tiefe: ⭐⭐⭐⭐⭐
Praktischer Wert: ⭐⭐⭐⭐
Experimentelle Vollständigkeit: ⭐⭐⭐
Darstellungsqualität: ⭐⭐⭐⭐⭐
Innovativität: ⭐⭐⭐⭐⭐

Geeignet für Veröffentlichung in Top-Regelungszeitschriften (wie IEEE TAC, Automatica), von großem Referenzwert für Forscher in datengesteuerter Regelung und Systemtheorie.

Ausgewählte Literaturverzeichnis

3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Grundlegende Arbeit zum Dateninformativitätsrahmen)

4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Erste LMI-Methode für datengesteuerte Stabilisierung)

12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Parametergrenzen als Vorwissen)

25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Strukturelle Steuerbarkeitstheorie)

27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Quadratische Stabilisierungstheorie)