2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

Entwurf von Kontrollbarrierefunktionen unter Verwendung einer dynamischen Sicherungsstrategie

Grundinformationen

  • Papier-ID: 2510.09810
  • Titel: Designing Control Barrier Functions Using a Dynamic Backup Policy
  • Autoren: Victor Freire, Marco M. Nicotra (University of Colorado, Boulder)
  • Klassifizierung: eess.SY cs.SY
  • Veröffentlichungsdatum: arXiv preprint, Oktober 2025
  • Papierlink: https://arxiv.org/abs/2510.09810

Zusammenfassung

Dieses Papier schlägt eine systematische Methode zur Konstruktion von Kontrollbarrierefunktionen für nichtlineare kontrollaffine Systeme unter beliebigen Zustands- und Eingangsbeschränkungen vor. Inspiriert durch die Literatur zu Referenzreglern definiert die Methode eine Familie von Sicherungsstrategien, die durch die Gleichgewichtsmannigfaltigkeit des Systems parametrisiert werden. Die Kontrollbarrierefunktion wird im erweiterten Zustands-Referenz-Raum definiert: Für ein gegebenes Zustands-Referenz-Paar quantifiziert die Methode den Abstand zu einer zukünftigen Beschränkungsverletzung zu einem beliebigen Zeitpunkt, während die Referenz der Sicherungsstrategie konstant bleibt. Anschließend wird eine Sensitivitätsanalyse verwendet, um die (möglicherweise nicht-glatte) Jacobi-Matrix bezüglich des erweiterten Zustandsvektors zu berechnen.

Forschungshintergrund und Motivation

Kernproblem

Kontrollbarrierefunktionen (CBFs) sind leistungsstarke Werkzeuge für den Entwurf sicherheitskritischer Regler, aber ihre systematische Synthese für allgemeine Systeme unter beliebigen Zustands- und Eingangsbeschränkungen ist schwierig. Obwohl die moderne Definition von CBF 2017 etabliert wurde, bleibt ihr systematischer Entwurf ein offenes Problem.

Bedeutung des Problems

In vielen Anwendungen müssen Praktiker Kandidaten-CBFs verwenden, da diese leichter zu entwerfen sind und durch Parameteroptimierung und Relaxationsvariablen gute Leistungen erzielen, aber es fehlen strenge Sicherheitsgarantien für effektive CBFs.

Einschränkungen bestehender Methoden

  1. Maschinelles Lernen: Mangelnde theoretische Garantien
  2. Sum-of-Squares-Methoden: Nur für polynomiale Systeme geeignet
  3. Methoden mit Expertendemonstrationen: Abhängig von hochwertigen Trainingsdaten
  4. Sicherungs-CBF-Methoden: Mangelnde systematische Methoden zum Entwurf von Sicherungsstrategien

Forschungsmotivation

Frühere Arbeiten der Autoren zeigten, dass dynamische Sicherheitsgrenzen (DSMs) im erweiterten Zustands-Referenz-Raum CBFs sind. Dieses Papier erweitert die trajektorienbasierte DSM zur CBF-Konstruktion und bietet eine systematischere und allgemeinere Methode.

Kernbeiträge

  1. Systematische CBF-Entwurfsmethode: Schlägt eine trajektorienvorhersage-basierte DSM-CBF-Konstruktionsmethode vor, die auf nichtlineare kontrollaffine Systeme mit beliebigen Zustands- und Eingangsbeschränkungen anwendbar ist
  2. Dynamische Sicherungsstrategien: Sicherungsstrategien werden durch die Gleichgewichtsmannigfaltigkeit des Systems parametrisiert, wobei die Parametrisierung zeitvariabel ist und größere Flexibilität als feste Sicherungsstrategien bietet
  3. Theoretische Garantien: Beweist unter milden Annahmen die asymptotische Stabilität der zugrunde liegenden Sensitivitätsmatrix und behandelt streng die Probleme, die sich aus der möglichen Nicht-Glattheit der CBF ergeben
  4. Praktische Überlegungen: Behandelt Probleme mit endlichem Zeithorizont und Glattheit, schlägt leichter implementierbare Strategien vor und beweist deren Hinlänglichkeit und Machbarkeit

Methodische Details

Aufgabendefinition

Betrachten Sie das kontrollaffine System:

ẋ = f(x) + g(x)u

unter Zustandsbeschränkungen x ∈ X und Eingangsbeschränkungen u ∈ U, mit dem Ziel, eine CBF zu entwerfen, um die Einhaltung von Beschränkungen zu erzwingen.

Kernhypothesen

Annahme 3: Das System lässt eine durch v ∈ ℝˡ parametrisierte Gleichgewichtsmannigfaltigkeit zu, für die stetige Funktionen x̄(v) und ū(v) existieren, sodass:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

und es existiert eine Vorstabilisierungskontrollstrategie π(x,v), die x̄(v) zu einem asymptotisch stabilen Gleichgewichtspunkt macht.

Trajektorienbasierte DSM-CBF-Konstruktion

1. Definition der dynamischen Sicherheitsgrenze

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

wobei:

  • c(x,v) die referenzabhängige Zustandsbeschränkung beschreibt
  • Φ(τ,x,v) die Lösung der Vorstabilisierungsdynamik ist

2. Sensitivitätsanalyse

Berechnung der Strömungs-Sensitivitäts-Jacobi-Matrix:

Zustandssensitivität:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

Referenzsensitivität:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. Implementierung mit endlichem Zeithorizont

Da ein unendlicher Zeithorizont numerisch nicht machbar ist, wird ein endlicher Zeithorizont T verwendet und eine terminale DSM eingeführt:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

Technische Innovationen

  1. Parametrisierte Sicherungsstrategie-Familie: Im Gegensatz zu festen Sicherungsstrategien bietet die Parametrisierung durch die Gleichgewichtsmannigfaltigkeit eine ganze Strategiefamilie
  2. Erweiterte Raum-CBF: CBF wird im erweiterten Zustands-Referenz-Raum definiert und behandelt natürlich die Referenzdynamik
  3. Nicht-glatte Behandlung: Verwendet die Clarke-verallgemeinerte Jacobi-Matrix zur strengen Behandlung der potenziellen Nicht-Glattheit der CBF
  4. Machbarkeitsgarantie: Beweist die Machbarkeit des Sicherheitsfilters; u = π(x,v), w = 0 ist immer eine machbare Lösung

Experimentelle Einrichtung

Systemmodell

Inverses Pendel-Wagen-System:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

Parameter:

  • Wagenmasse m_c = 1 kg
  • Pendelmasse m_p = 0,5 kg
  • Pendellänge L = 0,7 m

Beschränkungsbedingungen

  • Zustandsbeschränkungen: |x| ≤ 4,5 m, |θ-π| ≤ π/9
  • Eingangsbeschränkungen: |u| ≤ 20 N

Reglerentwurf

  • Vorstabilisierungsregler: LQR-Entwurf, K_π = -0,44, 35,3, -1,4, 8,0
  • Nominaler Regler: K_κ = -35, 150, -20, 50
  • Vorhersage-Zeithorizont: T = 10 Sekunden
  • Klasse-K∞-Funktion: α(c) = 100c (Beschränkung), α(c) = 400c (terminale DSM)

Vergleichsmethoden

  1. Nominale Kontrolle: Nur nominaler Regler (unsicher)
  2. Lyapunov-basierte DSM-CBF: DSM-Methode basierend auf Lyapunov-Funktionen
  3. ERG: Expliziter Referenzregler
  4. Sicherungs-CBF: Traditionelle Sicherungs-CBF-Methode

Experimentelle Ergebnisse

Hauptergebnisse

Aus den Simulationsergebnissen ist ersichtlich:

  1. Sicherheit: Die vorgeschlagene Methode erhält erfolgreich alle Beschränkungen, wobei die Wagenposition im Bereich ±4,5 m und die Pendelabweichung im Bereich ±20° bleibt
  2. Leistungsvorteil:
    • Im Vergleich zu Lyapunov-basierter DSM-CBF: schnellere Konvergenz, glattere Trajektorie
    • Im Vergleich zu ERG: deutlich schnellere Reaktion
    • Im Vergleich zu traditioneller Sicherungs-CBF: bessere Leistung dank zusätzlicher Freiheitsgrade durch die parametrisierte Sicherungsstrategie-Familie
  3. Steuereingabe: Die Eingabe erfüllt durchgehend die ±20-N-Beschränkung und ist im Vergleich zu anderen Methoden glatter

Leistungsanalyse

  • Trajektorienqualität: Die vorgeschlagene Methode realisiert einen sanften Übergang von der Ausgangsposition zur Zielposition
  • Beschränkungseinhaltung: Strikte Einhaltung aller Zustands- und Eingangsbeschränkungen
  • Konvergenz: Zeigt bessere Konvergenzeigenschaften im Vergleich zu Vergleichsmethoden

Verifikation von Methodenvorteilen

Das Experiment verifiziert die folgenden theoretischen Erwartungen:

  1. Parametrisierte Sicherungsstrategie-Familie bietet bessere Leistung als feste Sicherungsstrategien
  2. Effektivität der Trajektorienvorhersage-Methode bei der Behandlung von Systemen mit hohem relativem Grad und nicht-minimaler Phase
  3. Praktikabilität der erweiterten Raum-CBF-Methode

Verwandte Arbeiten

CBF-Entwurfsmethoden

  1. Maschinelles Lernen (Harms et al. 2024): Verwendung von maschinellem Lernen zum Entwurf von CBFs
  2. Sum-of-Squares-Methoden (Dai et al. 2024): Entwurf polynomialer CBFs
  3. Methoden mit Expertendemonstrationen (Lindemann et al. 2024): Lernen von CBFs aus sicheren Demonstrationen

Verwandte Arbeiten zu Sicherungs-CBF

  1. Chen et al. (2021): Einführung des Sicherungs-CBF-Konzepts
  2. Van Wijk et al. (2024): Störungsrobuste Sicherungs-CBF
  3. Choi et al. (2021): Robuste Kontrollbarriere-Wertfunktion

Referenzregler-Literatur

Diese Arbeit ist stark von der Referenzregler-Literatur inspiriert, insbesondere vom Konzept der dynamischen Sicherheitsgrenze, erweitert dieses aber auf das CBF-Framework.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Systematischer Entwurf: Bietet eine systematische Methode zur Konstruktion effektiver CBFs für nichtlineare Systeme mit beliebigen Beschränkungen
  2. Theoretische Garantien: Bietet unter milden Annahmen strenge theoretische Analysen und Machbarkeitsgarantien
  3. Praktikabilität: Methode ist einfach zu implementieren mit relativ niedriger Rechenkomplexität

Einschränkungen

  1. Annahmabhängigkeit: Erfordert, dass das System eine Gleichgewichtsmannigfaltigkeit zulässt und ein Vorstabilisierungsregler entworfen werden kann
  2. Rechenkomplexität: Obwohl niedriger als MPC, erfordert immer noch Trajektorienvorhersage und Sensitivitätsberechnung
  3. Parameteroptimierung: Parameter wie Klasse-K∞-Funktionen und Vorhersage-Zeithorizont müssen angemessen gewählt werden

Zukünftige Richtungen

  1. Robustheitsforschung: Untersuchung der Robustheitseigenschaften unter beschränkten Störungen
  2. Alternative Vorhersagetechniken: Erkundung anderer Trajektorienvorhersage-Techniken
  3. Rechneroptimierung: Methoden zur weiteren Reduzierung der Rechenkomplexität

Tiefgreifende Bewertung

Stärken

  1. Theoretische Strenge: Bietet vollständige theoretische Analysen, einschließlich Existenz-, Machbarkeits- und Konvergenznachweise
  2. Methodenuniversalität: Anwendbar auf ein breites Spektrum nichtlinearer kontrollaffiner Systeme
  3. Implementierungseinfachheit: Relativ leichte Rechenlast im Vergleich zu MPC und anderen Methoden
  4. Komplexitätsbehandlung: Kann Eingangssättigung, mehrfache Beschränkungen, starke Nichtlinearität und andere komplexe Situationen behandeln

Mängel

  1. Annahmebeschränkungen: Die Gleichgewichtsmannigfaltigkeits-Annahme kann den Anwendungsbereich der Methode einschränken
  2. Parameterempfindlichkeit: Die Methodenleistung kann relativ empfindlich gegenüber Parameterwahlentscheidungen sein
  3. Experimenteller Umfang: Validierung nur auf einem System durchgeführt, es fehlt eine breitere experimentelle Verifikation

Auswirkungen

  1. Akademischer Beitrag: Bietet neuen theoretischen Rahmen und praktische Methode für CBF-Entwurf
  2. Praktischer Wert: Methode ist relativ einfach und hat Anwendungspotenzial in praktischen Systemen
  3. Reproduzierbarkeit: Autoren stellen Open-Source-Code bereit, was die Reproduzierbarkeit verbessert

Anwendungsszenarien

  1. Sicherheitskritische Systeme: Wie Roboter, autonome Fahrzeuge und andere Systeme, die strikte Beschränkungseinhaltung erfordern
  2. Nichtlineare Systeme: Besonders geeignet für nichtlineare Kontrollsysteme mit komplexen Beschränkungen
  3. Echtzeitsteuerung: Mit niedrigerer Rechenkomplexität als MPC geeignet für Echtzeitanwendungen

Literaturverzeichnis

Das Papier zitiert Hauptarbeiten in diesem Bereich, einschließlich:

  • Ames et al. (2017): Moderne Definition von CBF
  • Chen et al. (2021): Sicherungs-CBF-Konzept
  • Nicotra und Garone (2018): Expliziter Referenzregler
  • Frühere Arbeiten der Autoren: Theoretische Grundlagen von DSM-CBF

Gesamtbewertung: Dies ist ein theoretisch streng verfasstes Papier mit innovativer Methodik, das eine systematische Methode für den CBF-Entwurf bietet. Bei Wahrung theoretischer Strenge zeigt es gleichzeitig gute Praktikabilität. Die Universalität der Methode und die relativ einfache Implementierung verleihen ihr hohen praktischen Wert.