2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

Diseño de Funciones de Barrera de Control Utilizando una Política de Respaldo Dinámica

Información Básica

  • ID del Artículo: 2510.09810
  • Título: Designing Control Barrier Functions Using a Dynamic Backup Policy
  • Autores: Victor Freire, Marco M. Nicotra (Universidad de Colorado, Boulder)
  • Clasificación: eess.SY cs.SY
  • Fecha de Publicación: preprint arXiv, octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.09810

Resumen

En este artículo se propone un método sistemático para construir funciones de barrera de control en sistemas no lineales de control afín bajo restricciones arbitrarias de estado e entrada. Inspirado por la literatura de reguladores de referencia, el método define una familia de políticas de respaldo parametrizadas por las variedades de equilibrio del sistema. La función de barrera de control se define en el espacio aumentado de estado-referencia: dado un par estado-referencia, el método cuantifica la distancia en cualquier momento futuro hasta la violación de restricción mientras la referencia de la política de respaldo permanece constante. Posteriormente, se utiliza análisis de sensibilidad para calcular la matriz jacobiana (potencialmente no suave) con respecto al vector de estado aumentado.

Contexto de Investigación y Motivación

Problema Central

Las funciones de barrera de control (CBF) son herramientas poderosas para diseñar controladores de sistemas críticos para la seguridad, pero su síntesis sistemática es difícil para sistemas generales bajo restricciones arbitrarias de estado e entrada. Aunque la definición moderna de CBF se estableció en 2017, su diseño sistemático sigue siendo un problema abierto.

Importancia del Problema

En muchas aplicaciones, los profesionales deben adoptar candidatos de CBF porque son más fáciles de diseñar y pueden lograr buen desempeño mediante ajuste de parámetros y variables de relajación, pero carecen de garantías de seguridad rigurosas de CBF efectivas.

Limitaciones de Métodos Existentes

  1. Métodos de aprendizaje automático: carecen de garantías teóricas
  2. Métodos de suma de cuadrados: aplicables solo a sistemas polinomiales
  3. Métodos de demostración de expertos: dependen de datos de entrenamiento de alta calidad
  4. Métodos de CBF de respaldo: carecen de métodos sistemáticos para diseñar políticas de respaldo

Motivación de la Investigación

Trabajos previos de los autores demostraron que los márgenes de seguridad dinámicos (DSM) en el espacio aumentado de estado-referencia son CBF. Este artículo extiende los DSM basados en trayectorias para construir CBF, proporcionando un método más sistemático y general.

Contribuciones Principales

  1. Método Sistemático de Diseño de CBF: propone el método de construcción DSM-CBF basado en predicción de trayectorias, aplicable a sistemas no lineales de control afín con restricciones arbitrarias de estado e entrada
  2. Política de Respaldo Dinámica: la política de respaldo se parametriza mediante variedades de equilibrio del sistema, y la parametrización es variante en el tiempo, proporcionando mayor flexibilidad que políticas de respaldo fijas
  3. Garantías Teóricas: demuestra la estabilidad asintótica de la matriz de sensibilidad subyacente bajo supuestos moderados, y maneja rigurosamente los problemas derivados de la posible no suavidad de la CBF
  4. Consideraciones Prácticas: aborda problemas de horizonte finito y suavidad, propone estrategias más fáciles de implementar y demuestra su suficiencia y viabilidad

Detalles del Método

Definición de la Tarea

Considérese el sistema de control afín:

ẋ = f(x) + g(x)u

sujeto a restricciones de estado x ∈ X y restricciones de entrada u ∈ U, con el objetivo de diseñar una CBF para forzar el cumplimiento de restricciones.

Supuestos Principales

Supuesto 3: El sistema admite una variedad de equilibrio parametrizada por v ∈ ℝˡ, existen funciones continuas x̄(v) y ū(v) tales que:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

y existe una política de control preestabilizante π(x,v) tal que x̄(v) es un punto de equilibrio asintóticamente estable.

Construcción de DSM-CBF Basada en Trayectorias

1. Definición de Margen de Seguridad Dinámico

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

donde:

  • c(x,v) describe la restricción de estado dependiente de la referencia
  • Φ(τ,x,v) es la solución de la dinámica preestabilizante

2. Análisis de Sensibilidad

Cálculo de la matriz jacobiana de sensibilidad del flujo:

Sensibilidad de Estado:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

Sensibilidad de Referencia:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. Implementación de Horizonte Finito

Dado que el horizonte infinito es numéricamente inviable, se adopta un horizonte finito T e introduce un DSM terminal:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

Puntos de Innovación Técnica

  1. Familia de Políticas de Respaldo Parametrizadas: a diferencia de políticas de respaldo fijas, proporciona una familia completa de estrategias parametrizadas mediante variedades de equilibrio
  2. CBF en Espacio Aumentado: define CBF en el espacio aumentado estado-referencia, manejando naturalmente la dinámica de referencia
  3. Manejo de No Suavidad: utiliza la matriz jacobiana generalizada de Clarke para manejar rigurosamente la posible no suavidad de la CBF
  4. Garantías de Viabilidad: demuestra la viabilidad del filtro de seguridad, u = π(x,v), w = 0 siempre es una solución viable

Configuración Experimental

Modelo del Sistema

Sistema de péndulo invertido sobre carro:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

Parámetros:

  • Masa del carro m_c = 1kg
  • Masa del péndulo m_p = 0.5kg
  • Longitud del péndulo L = 0.7m

Condiciones de Restricción

  • Restricciones de estado: |x| ≤ 4.5m, |θ-π| ≤ π/9
  • Restricciones de entrada: |u| ≤ 20N

Diseño del Controlador

  • Controlador preestabilizante: diseño LQR, K_π = -0.44, 35.3, -1.4, 8.0
  • Controlador nominal: K_κ = -35, 150, -20, 50
  • Horizonte de predicción: T = 10 segundos
  • Función clase K∞: α(c) = 100c (restricción), α(c) = 400c (DSM terminal)

Métodos de Comparación

  1. Control Nominal: solo utiliza el controlador nominal (inseguro)
  2. DSM-CBF Basado en Lyapunov: método DSM basado en función de Lyapunov
  3. ERG: regulador de referencia explícito
  4. CBF de Respaldo: método tradicional de CBF de respaldo

Resultados Experimentales

Resultados Principales

De los resultados de simulación se puede observar:

  1. Seguridad: el método propuesto mantiene exitosamente todas las restricciones satisfechas, la posición del carro se mantiene dentro del rango ±4.5m, la desviación del ángulo del péndulo se mantiene dentro de ±20°
  2. Ventajas de Desempeño:
    • Comparado con DSM-CBF basado en Lyapunov: convergencia más rápida, trayectorias más suaves
    • Comparado con ERG: mejora significativa en velocidad de respuesta
    • Comparado con CBF de respaldo tradicional: mejor desempeño, gracias a los grados de libertad adicionales proporcionados por la familia de políticas de respaldo parametrizadas
  3. Entrada de Control: la entrada siempre satisface la restricción ±20N, y es más suave comparada con otros métodos

Análisis de Desempeño

  • Calidad de Trayectoria: el método propuesto logra una transición suave desde la posición inicial hasta la posición objetivo
  • Satisfacción de Restricciones: cumple estrictamente todas las restricciones de estado e entrada
  • Convergencia: exhibe mejores características de convergencia comparado con métodos de comparación

Verificación de Ventajas del Método

Los experimentos verifican las siguientes expectativas teóricas:

  1. La familia de políticas de respaldo parametrizadas proporciona mejor desempeño que políticas de respaldo fijas
  2. La efectividad del método de predicción de trayectorias en el manejo de sistemas con alto grado relativo y fase no mínima
  3. La practicidad del método de CBF en espacio aumentado

Trabajo Relacionado

Métodos de Diseño de CBF

  1. Métodos de aprendizaje automático (Harms et al. 2024): diseño de CBF mediante aprendizaje automático
  2. Métodos de suma de cuadrados (Dai et al. 2024): diseño de CBF polinomiales
  3. Métodos de demostración de expertos (Lindemann et al. 2024): aprendizaje de CBF a partir de demostraciones seguras

Trabajo Relacionado con CBF de Respaldo

  1. Chen et al. (2021): propone el concepto de CBF de respaldo
  2. Van Wijk et al. (2024): CBF de respaldo robusto a perturbaciones
  3. Choi et al. (2021): función de valor de barrera de control robusto

Literatura de Reguladores de Referencia

El método de este artículo está inspirado en la literatura de reguladores de referencia, particularmente en el concepto de márgenes de seguridad dinámicos, pero lo extiende al marco de CBF.

Conclusiones y Discusión

Conclusiones Principales

  1. Diseño Sistemático: proporciona un método sistemático para construir CBF efectivas, aplicable a sistemas no lineales con restricciones arbitrarias
  2. Garantías Teóricas: proporciona análisis teórico riguroso y garantías de viabilidad bajo supuestos moderados
  3. Practicidad: el método es simple de implementar, con complejidad computacional relativamente baja

Limitaciones

  1. Dependencia de Supuestos: requiere que el sistema admita una variedad de equilibrio y que se pueda diseñar un controlador preestabilizante
  2. Complejidad Computacional: aunque menor que MPC, aún requiere predicción de trayectorias y cálculo de sensibilidad
  3. Ajuste de Parámetros: parámetros como funciones clase K∞ y horizonte de predicción requieren selección apropiada

Direcciones Futuras

  1. Investigación de Robustez: estudio de propiedades de robustez bajo perturbaciones acotadas
  2. Técnicas de Predicción Alternativas: exploración de otras técnicas de predicción de trayectorias
  3. Optimización Computacional: métodos para reducir aún más la complejidad computacional

Evaluación Profunda

Fortalezas

  1. Rigor Teórico: proporciona análisis teórico completo, incluyendo pruebas de existencia, viabilidad y convergencia
  2. Generalidad del Método: aplicable a una amplia gama de sistemas no lineales de control afín
  3. Simplicidad de Implementación: comparado con métodos como MPC, la carga computacional es relativamente ligera
  4. Manejo de Complejidad: puede manejar saturación de entrada, múltiples restricciones, fuerte no linealidad y otros casos complejos

Deficiencias

  1. Limitaciones de Supuestos: el supuesto de variedad de equilibrio puede limitar el rango de aplicabilidad del método
  2. Sensibilidad a Parámetros: el desempeño del método puede ser relativamente sensible a la selección de parámetros
  3. Alcance Experimental: la verificación se realizó solo en un sistema, careciendo de validación experimental más amplia

Impacto

  1. Contribución Académica: proporciona un nuevo marco teórico y método práctico para el diseño de CBF
  2. Valor Práctico: el método es relativamente simple, con potencial para aplicación en sistemas reales
  3. Reproducibilidad: los autores proporcionan código de código abierto, mejorando la reproducibilidad

Escenarios de Aplicación

  1. Sistemas Críticos para la Seguridad: como robots, vehículos autónomos y otros sistemas que requieren cumplimiento estricto de restricciones
  2. Sistemas No Lineales: particularmente adecuado para sistemas de control no lineales con restricciones complejas
  3. Control en Tiempo Real: con menor complejidad computacional que MPC, es adecuado para aplicaciones en tiempo real

Referencias

El artículo cita trabajos principales en el campo, incluyendo:

  • Ames et al. (2017): definición moderna de CBF
  • Chen et al. (2021): concepto de CBF de respaldo
  • Nicotra and Garone (2018): regulador de referencia explícito
  • Trabajos previos de los autores: fundamentos teóricos de DSM-CBF

Evaluación General: Este es un artículo de alta calidad con teoría rigurosa y método novedoso, que proporciona un enfoque sistemático para el diseño de CBF. Mientras mantiene rigor teórico, posee buena practicidad. La generalidad del método y la implementación relativamente simple le confieren alto valor práctico.