2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

Conception de Fonctions de Barrière de Contrôle Utilisant une Politique de Secours Dynamique

Informations Fondamentales

  • ID de l'article : 2510.09810
  • Titre : Designing Control Barrier Functions Using a Dynamic Backup Policy
  • Auteurs : Victor Freire, Marco M. Nicotra (University of Colorado, Boulder)
  • Classification : eess.SY cs.SY
  • Date de publication : arXiv preprint, octobre 2025
  • Lien de l'article : https://arxiv.org/abs/2510.09810

Résumé

Cet article propose une méthode systématique pour construire des fonctions de barrière de contrôle (FBC) pour des systèmes non-linéaires affines en contrôle sous des contraintes d'état et d'entrée arbitraires. Inspirée par la littérature sur les régulateurs de référence, la méthode définit une famille de politiques de secours paramétrées par la variété d'équilibre du système. La fonction de barrière de contrôle est définie dans l'espace augmenté état-référence : pour une paire état-référence donnée, la méthode quantifie la distance à une violation de contrainte à tout moment futur lorsque la référence de la politique de secours reste constante. Une analyse de sensibilité est ensuite utilisée pour calculer la matrice jacobienne (potentiellement non-lisse) par rapport au vecteur d'état augmenté.

Contexte et Motivation de la Recherche

Problème Central

Les fonctions de barrière de contrôle (FBC) constituent un outil puissant pour la conception de contrôleurs pour systèmes critiques de sécurité, mais leur synthèse systématique pour des systèmes généraux sous des contraintes d'état et d'entrée arbitraires reste difficile. Bien que la définition moderne des FBC ait été établie en 2017, leur conception systématique demeure un problème ouvert.

Importance du Problème

Dans de nombreuses applications, les praticiens doivent adopter des candidates FBC car elles sont plus faciles à concevoir, et peuvent obtenir de bonnes performances par ajustement de paramètres et variables de relaxation, mais manquent de garanties de sécurité rigoureuses des FBC efficaces.

Limitations des Approches Existantes

  1. Méthodes d'apprentissage automatique : manquent de garanties théoriques
  2. Méthodes de sommes de carrés : applicables uniquement aux systèmes polynomiaux
  3. Méthodes de démonstration par experts : dépendent de données d'entraînement de haute qualité
  4. Méthodes de FBC de secours : manquent d'approche systématisée pour la conception de politiques de secours

Motivation de la Recherche

Les travaux antérieurs des auteurs ont démontré que les marges de sécurité dynamiques (MSD) dans l'espace augmenté état-référence sont des FBC. Cet article étend les MSD basées sur trajectoires pour construire des FBC, fournissant une approche plus systématisée et générale.

Contributions Principales

  1. Méthode systématisée de conception de FBC : propose une méthode de construction MSD-FBC basée sur la prédiction de trajectoires, applicable aux systèmes non-linéaires affines en contrôle avec contraintes d'état et d'entrée arbitraires
  2. Politique de secours dynamique : la politique de secours est paramétrée par la variété d'équilibre du système avec paramétrisation variant dans le temps, offrant plus de flexibilité que les politiques de secours fixes
  3. Garanties théoriques : démontre la stabilité asymptotique de la matrice de sensibilité sous-jacente sous des hypothèses modérées, et traite rigoureusement les problèmes découlant de la non-lissité potentielle de la FBC
  4. Considérations pratiques : résout les problèmes d'horizon fini et de lissité, propose des stratégies plus faciles à implémenter et prouve leur suffisance et faisabilité

Détails de la Méthode

Définition de la Tâche

Considérons le système affine en contrôle :

ẋ = f(x) + g(x)u

soumis aux contraintes d'état x ∈ X et d'entrée u ∈ U, l'objectif est de concevoir une FBC pour forcer la satisfaction des contraintes.

Hypothèses Fondamentales

Hypothèse 3 : le système admet une variété d'équilibre paramétrée par v ∈ ℝˡ, avec existence de fonctions continues x̄(v) et ū(v) telles que :

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

et existence d'une stratégie de contrôle pré-stabilisante π(x,v) rendant x̄(v) un point d'équilibre asymptotiquement stable.

Construction de MSD-FBC Basée sur Trajectoires

1. Définition de la Marge de Sécurité Dynamique

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

où :

  • c(x,v) décrit la contrainte d'état dépendante de la référence
  • Φ(τ,x,v) est la solution de la dynamique pré-stabilisante

2. Analyse de Sensibilité

Calcul de la matrice jacobienne de sensibilité du flux :

Sensibilité d'état :

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

Sensibilité de référence :

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. Implémentation à Horizon Fini

Puisque l'horizon infini est numériquement non-réalisable, on adopte un horizon fini T avec introduction d'une MSD terminale :

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

Points d'Innovation Technique

  1. Famille de politiques de secours paramétrées : contrairement aux politiques de secours fixes, la paramétrisation par variété d'équilibre fournit une famille entière de stratégies
  2. FBC dans l'espace augmenté : définition de la FBC dans l'espace augmenté état-référence, traitant naturellement la dynamique de référence
  3. Traitement de la non-lissité : utilisation de la matrice jacobienne généralisée de Clarke pour traiter rigoureusement la non-lissité potentielle de la FBC
  4. Garanties de faisabilité : preuve que le filtre de sécurité est réalisable, u = π(x,v), w = 0 est toujours une solution réalisable

Configuration Expérimentale

Modèle du Système

Système chariot-pendule inversé :

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

Paramètres :

  • Masse du chariot m_c = 1 kg
  • Masse du pendule m_p = 0,5 kg
  • Longueur du pendule L = 0,7 m

Conditions de Contrainte

  • Contraintes d'état : |x| ≤ 4,5 m, |θ-π| ≤ π/9
  • Contraintes d'entrée : |u| ≤ 20 N

Conception du Contrôleur

  • Contrôleur pré-stabilisant : conception LQR, K_π = -0,44, 35,3, -1,4, 8,0
  • Contrôleur nominal : K_κ = -35, 150, -20, 50
  • Horizon de prédiction : T = 10 secondes
  • Fonction classe K∞ : α(c) = 100c (contrainte), α(c) = 400c (MSD terminale)

Méthodes de Comparaison

  1. Contrôle nominal : utilisation uniquement du contrôleur nominal (non-sûr)
  2. MSD-FBC basée sur Lyapunov : méthode MSD basée sur fonction de Lyapunov
  3. ERG : régulateur de référence explicite
  4. FBC de secours : méthode traditionnelle de FBC de secours

Résultats Expérimentaux

Résultats Principaux

Les résultats de simulation montrent que :

  1. Sécurité : la méthode proposée maintient avec succès la satisfaction de toutes les contraintes, la position du chariot reste dans la plage ±4,5 m, l'écart d'angle du pendule reste dans la plage ±20°
  2. Avantages de Performance :
    • Comparé à MSD-FBC basée sur Lyapunov : convergence plus rapide, trajectoires plus lisses
    • Comparé à ERG : réponse significativement plus rapide
    • Comparé à FBC de secours traditionnelle : performance supérieure, grâce aux degrés de liberté supplémentaires fournis par la famille de politiques de secours paramétrées
  3. Entrée de Contrôle : l'entrée satisfait toujours la contrainte ±20 N et est plus lisse que les autres méthodes

Analyse de Performance

  • Qualité de trajectoire : la méthode proposée réalise une transition lisse de la position initiale à la position cible
  • Satisfaction des contraintes : satisfaction stricte de toutes les contraintes d'état et d'entrée
  • Convergence : démonstration de meilleures caractéristiques de convergence comparées aux méthodes de comparaison

Vérification des Avantages de la Méthode

L'expérience valide les prédictions théoriques suivantes :

  1. La famille de politiques de secours paramétrées fournit de meilleures performances que les politiques de secours fixes
  2. L'efficacité de la méthode de prédiction de trajectoires dans le traitement de systèmes à degré relatif élevé et phase non-minimale
  3. La praticité de la méthode FBC dans l'espace augmenté

Travaux Connexes

Méthodes de Conception de FBC

  1. Méthodes d'apprentissage automatique (Harms et al. 2024) : conception de FBC utilisant l'apprentissage automatique
  2. Méthodes de sommes de carrés (Dai et al. 2024) : conception de FBC polynomiales
  3. Méthodes de démonstration par experts (Lindemann et al. 2024) : apprentissage de FBC à partir de démonstrations sûres

Travaux Connexes sur FBC de Secours

  1. Chen et al. (2021) : introduction du concept de FBC de secours
  2. Van Wijk et al. (2024) : FBC de secours robuste aux perturbations
  3. Choi et al. (2021) : fonction de valeur de barrière de contrôle robuste

Littérature sur Régulateurs de Référence

La méthode proposée s'inspire fortement de la littérature sur régulateurs de référence, en particulier du concept de marges de sécurité dynamiques, mais l'étend au cadre des FBC.

Conclusion et Discussion

Conclusions Principales

  1. Conception systématisée : fournit une méthode systématisée pour construire des FBC efficaces, applicable aux systèmes non-linéaires avec contraintes arbitraires
  2. Garanties théoriques : fournit une analyse théorique rigoureuse et des garanties de faisabilité sous des hypothèses modérées
  3. Praticité : la méthode est simple à implémenter avec une complexité de calcul relativement faible

Limitations

  1. Dépendance aux hypothèses : nécessite que le système admette une variété d'équilibre et permette la conception d'un contrôleur pré-stabilisant
  2. Complexité de calcul : bien que inférieure à MPC, nécessite toujours prédiction de trajectoires et calcul de sensibilité
  3. Ajustement de paramètres : les paramètres tels que fonction classe K∞ et horizon de prédiction nécessitent une sélection appropriée

Directions Futures

  1. Études de robustesse : étude des propriétés de robustesse sous perturbations bornées
  2. Techniques de prédiction différentes : exploration d'autres techniques de prédiction de trajectoires
  3. Optimisation de calcul : méthodes pour réduire davantage la complexité de calcul

Évaluation Approfondie

Avantages

  1. Rigueur théorique : fournit une analyse théorique complète incluant preuves d'existence, faisabilité et convergence
  2. Généralité de la méthode : applicable à une large gamme de systèmes non-linéaires affines en contrôle
  3. Simplicité d'implémentation : charge de calcul relativement légère comparée à des méthodes comme MPC
  4. Traitement de complexité : capable de traiter saturation d'entrée, contraintes multiples, forte non-linéarité et autres cas complexes

Insuffisances

  1. Limitations des hypothèses : l'hypothèse de variété d'équilibre peut limiter le champ d'application de la méthode
  2. Sensibilité aux paramètres : la performance de la méthode peut être relativement sensible au choix des paramètres
  3. Portée expérimentale : validation effectuée uniquement sur un système, manquant de vérification expérimentale plus large

Impact

  1. Contribution académique : fournit un nouveau cadre théorique et une méthode pratique pour la conception de FBC
  2. Valeur pratique : la méthode est relativement simple et prometteuse pour application dans des systèmes réels
  3. Reproductibilité : les auteurs fournissent du code open-source, renforçant la reproductibilité

Scénarios d'Application

  1. Systèmes critiques de sécurité : tels que robots, véhicules autonomes et autres systèmes nécessitant satisfaction stricte des contraintes
  2. Systèmes non-linéaires : particulièrement adaptés aux systèmes de contrôle non-linéaires avec contraintes complexes
  3. Contrôle en temps réel : complexité de calcul inférieure à MPC, adapté aux applications en temps réel

Références

L'article cite les travaux majeurs du domaine, incluant :

  • Ames et al. (2017) : définition moderne des FBC
  • Chen et al. (2021) : concept de FBC de secours
  • Nicotra and Garone (2018) : régulateur de référence explicite
  • Travaux antérieurs des auteurs : fondations théoriques MSD-FBC

Évaluation Globale : Ceci est un article de haute qualité théoriquement rigoureux et méthodologiquement novateur, fournissant une méthode systématisée pour la conception de FBC. Tout en maintenant la rigueur théorique, il possède une bonne praticité. La généralité de la méthode et la relative simplicité d'implémentation lui confèrent une valeur pratique considérable.