2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

Progettazione di Funzioni di Barriera di Controllo Utilizzando una Politica di Backup Dinamica

Informazioni Fondamentali

  • ID Articolo: 2510.09810
  • Titolo: Designing Control Barrier Functions Using a Dynamic Backup Policy
  • Autori: Victor Freire, Marco M. Nicotra (University of Colorado, Boulder)
  • Classificazione: eess.SY cs.SY
  • Data di Pubblicazione: arXiv preprint, Ottobre 2025
  • Link Articolo: https://arxiv.org/abs/2510.09810

Riassunto

Il presente articolo propone un metodo sistematico per costruire funzioni di barriera di controllo (CBF) per sistemi non lineari affini nel controllo sotto vincoli arbitrari di stato e ingresso. Ispirato dalla letteratura sui regolatori di riferimento, il metodo definisce una famiglia di politiche di backup parametrizzate da varietà di equilibrio del sistema. La funzione di barriera di controllo è definita nello spazio aumentato stato-riferimento: dato una coppia stato-riferimento, il metodo quantifica la distanza dal futuro arbitrario nel tempo alla violazione del vincolo, mantenendo costante il riferimento della politica di backup. Successivamente, l'analisi di sensibilità calcola la matrice jacobiana (potenzialmente non liscia) rispetto al vettore di stato aumentato.

Contesto di Ricerca e Motivazione

Problema Fondamentale

Le funzioni di barriera di controllo (CBF) sono strumenti potenti per la progettazione di controllori per sistemi critici per la sicurezza, ma la loro sintesi sistematica per sistemi generali sotto vincoli arbitrari di stato e ingresso rimane difficile. Sebbene la definizione moderna di CBF sia stata stabilita nel 2017, la loro progettazione sistematica rimane un problema aperto.

Importanza del Problema

In molte applicazioni, i professionisti sono costretti ad adottare candidati CBF perché più facili da progettare, ottenendo buone prestazioni attraverso sintonizzazione dei parametri e variabili di rilassamento, ma mancano di garanzie di sicurezza rigorose di CBF efficaci.

Limitazioni dei Metodi Esistenti

  1. Metodi di apprendimento automatico: mancanza di garanzie teoriche
  2. Metodi di somma di quadrati: applicabili solo a sistemi polinomiali
  3. Metodi basati su dimostrazioni di esperti: dipendenti da dati di addestramento di alta qualità
  4. Metodi di CBF di backup: mancanza di approcci sistematici per la progettazione di politiche di backup

Motivazione della Ricerca

Lavori precedenti degli autori hanno dimostrato che i margini di sicurezza dinamici (DSM) nello spazio aumentato stato-riferimento sono CBF. Il presente articolo estende i DSM basati su traiettorie per costruire CBF, fornendo un metodo più sistematico e generale.

Contributi Principali

  1. Metodo Sistematico di Progettazione CBF: propone un metodo di costruzione DSM-CBF basato su predizione di traiettoria, applicabile a sistemi non lineari affini nel controllo con vincoli arbitrari di stato e ingresso
  2. Politica di Backup Dinamica: la politica di backup è parametrizzata attraverso la varietà di equilibrio del sistema con parametrizzazione variante nel tempo, fornendo maggiore flessibilità rispetto a politiche di backup fisse
  3. Garanzie Teoriche: dimostra la stabilità asintotica della matrice di sensibilità sottostante sotto ipotesi moderate e affronta rigorosamente i problemi derivanti dalla potenziale non-levigatezza della CBF
  4. Considerazioni Pratiche: risolve i problemi di orizzonte temporale finito e levigatezza, proponendo strategie più facili da implementare e provandone la sufficienza e la fattibilità

Dettagli del Metodo

Definizione del Compito

Considerare il sistema affine nel controllo:

ẋ = f(x) + g(x)u

soggetto a vincoli di stato x ∈ X e vincoli di ingresso u ∈ U, l'obiettivo è progettare una CBF per forzare il soddisfacimento dei vincoli.

Ipotesi Fondamentali

Ipotesi 3: Il sistema ammette una varietà di equilibrio parametrizzata da v ∈ ℝˡ, esistono funzioni continue x̄(v) e ū(v) tali che:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

ed esiste una politica di controllo pre-stabilizzante π(x,v) tale che x̄(v) sia un punto di equilibrio asintoticamente stabile.

Costruzione DSM-CBF Basata su Traiettoria

1. Definizione del Margine di Sicurezza Dinamico

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

dove:

  • c(x,v) descrive il vincolo di stato dipendente dal riferimento
  • Φ(τ,x,v) è la soluzione della dinamica pre-stabilizzante

2. Analisi di Sensibilità

Calcolo della matrice jacobiana di sensibilità del flusso:

Sensibilità di Stato:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

Sensibilità di Riferimento:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. Implementazione ad Orizzonte Temporale Finito

Poiché l'orizzonte temporale infinito non è numericamente fattibile, si adotta un orizzonte temporale finito T e si introduce un DSM terminale:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

Punti di Innovazione Tecnica

  1. Famiglia di Politiche di Backup Parametrizzate: diversamente dalle politiche di backup fisse, fornisce un'intera famiglia di strategie attraverso la parametrizzazione della varietà di equilibrio
  2. CBF nello Spazio Aumentato: definisce la CBF nello spazio aumentato stato-riferimento, gestendo naturalmente la dinamica del riferimento
  3. Gestione della Non-Levigatezza: utilizza rigorosamente la matrice jacobiana generalizzata di Clarke per affrontare la potenziale non-levigatezza della CBF
  4. Garanzie di Fattibilità: dimostra la fattibilità del filtro di sicurezza, u = π(x,v), w = 0 è sempre una soluzione fattibile

Configurazione Sperimentale

Modello del Sistema

Sistema del carrello con pendolo inverso:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

Parametri:

  • Massa del carrello m_c = 1kg
  • Massa del pendolo m_p = 0.5kg
  • Lunghezza del pendolo L = 0.7m

Condizioni di Vincolo

  • Vincoli di stato: |x| ≤ 4.5m, |θ-π| ≤ π/9
  • Vincoli di ingresso: |u| ≤ 20N

Progettazione del Controllore

  • Controllore pre-stabilizzante: progettazione LQR, K_π = -0.44, 35.3, -1.4, 8.0
  • Controllore nominale: K_κ = -35, 150, -20, 50
  • Orizzonte di predizione: T = 10 secondi
  • Funzione di classe K∞: α(c) = 100c (vincolo), α(c) = 400c (DSM terminale)

Metodi di Confronto

  1. Controllo Nominale: utilizzo solo del controllore nominale (non sicuro)
  2. DSM-CBF Basato su Lyapunov: metodo DSM basato su funzione di Lyapunov
  3. ERG: Regolatore di Riferimento Esplicito
  4. CBF di Backup: metodo tradizionale di CBF di backup

Risultati Sperimentali

Risultati Principali

Dai risultati della simulazione si può osservare:

  1. Sicurezza: il metodo proposto mantiene con successo il soddisfacimento di tutti i vincoli, la posizione del carrello rimane nell'intervallo ±4.5m, la deviazione dell'angolo del pendolo rimane nell'intervallo ±20°
  2. Vantaggi di Prestazione:
    • Rispetto a DSM-CBF basato su Lyapunov: convergenza più veloce, traiettorie più lisce
    • Rispetto a ERG: velocità di risposta significativamente migliorata
    • Rispetto a CBF di backup tradizionale: prestazioni superiori, grazie ai gradi di libertà aggiuntivi forniti dalla famiglia di politiche di backup parametrizzate
  3. Ingresso di Controllo: l'ingresso soddisfa sempre il vincolo ±20N ed è più liscio rispetto ad altri metodi

Analisi delle Prestazioni

  • Qualità della Traiettoria: il metodo proposto realizza una transizione liscia dalla posizione iniziale alla posizione obiettivo
  • Soddisfacimento dei Vincoli: soddisfa rigorosamente tutti i vincoli di stato e ingresso
  • Convergenza: mostra caratteristiche di convergenza migliori rispetto ai metodi di confronto

Verifica dei Vantaggi del Metodo

L'esperimento verifica le seguenti previsioni teoriche:

  1. La famiglia di politiche di backup parametrizzate fornisce prestazioni migliori rispetto alle politiche di backup fisse
  2. L'efficacia del metodo di predizione di traiettoria nel trattamento di sistemi con grado relativo elevato e fase non minima
  3. La praticità del metodo CBF nello spazio aumentato

Lavori Correlati

Metodi di Progettazione CBF

  1. Metodi di apprendimento automatico (Harms et al. 2024): utilizzo dell'apprendimento automatico per la progettazione di CBF
  2. Metodi di somma di quadrati (Dai et al. 2024): progettazione di CBF polinomiali
  3. Metodi basati su dimostrazioni di esperti (Lindemann et al. 2024): apprendimento di CBF da dimostrazioni sicure

Lavori Correlati su CBF di Backup

  1. Chen et al. (2021): propone il concetto di CBF di backup
  2. Van Wijk et al. (2024): CBF di backup robusto a perturbazioni
  3. Choi et al. (2021): funzione di valore di barriera di controllo robusto

Letteratura sui Regolatori di Riferimento

Il metodo del presente articolo è profondamente ispirato dalla letteratura sui regolatori di riferimento, in particolare dal concetto di margine di sicurezza dinamico, ma lo estende al framework CBF.

Conclusioni e Discussione

Conclusioni Principali

  1. Progettazione Sistematica: fornisce un metodo sistematico per costruire CBF efficaci, applicabile a sistemi non lineari con vincoli arbitrari
  2. Garanzie Teoriche: fornisce analisi teorica rigorosa e garanzie di fattibilità sotto ipotesi moderate
  3. Praticità: il metodo è semplice da implementare con complessità computazionale relativamente bassa

Limitazioni

  1. Dipendenza dalle Ipotesi: richiede che il sistema ammetta una varietà di equilibrio e che sia possibile progettare un controllore pre-stabilizzante
  2. Complessità Computazionale: sebbene inferiore a MPC, richiede comunque predizione di traiettoria e calcolo di sensibilità
  3. Sintonizzazione dei Parametri: parametri come funzioni di classe K∞ e orizzonte di predizione richiedono una scelta appropriata

Direzioni Future

  1. Ricerca di Robustezza: studio delle proprietà di robustezza sotto perturbazioni limitate
  2. Tecniche di Predizione Diverse: esplorazione di altre tecniche di predizione di traiettoria
  3. Ottimizzazione Computazionale: metodi per ridurre ulteriormente la complessità computazionale

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: fornisce analisi teorica completa, incluse prove di esistenza, fattibilità e convergenza
  2. Generalità del Metodo: applicabile a un'ampia gamma di sistemi non lineari affini nel controllo
  3. Semplicità di Implementazione: carico computazionale relativamente leggero rispetto a metodi come MPC
  4. Gestione della Complessità: in grado di gestire saturazione di ingresso, vincoli multipli, forte non linearità e altre situazioni complesse

Insufficienze

  1. Limitazioni delle Ipotesi: l'ipotesi di varietà di equilibrio potrebbe limitare l'applicabilità del metodo
  2. Sensibilità ai Parametri: le prestazioni del metodo potrebbero essere relativamente sensibili alla scelta dei parametri
  3. Portata Sperimentale: la verifica è stata condotta solo su un sistema, mancano validazioni sperimentali più ampie

Impatto

  1. Contributo Accademico: fornisce un nuovo framework teorico e metodo pratico per la progettazione di CBF
  2. Valore Pratico: il metodo è relativamente semplice e promettente per l'applicazione in sistemi reali
  3. Riproducibilità: gli autori forniscono codice open source, migliorando la riproducibilità

Scenari di Applicazione

  1. Sistemi Critici per la Sicurezza: come robot, veicoli autonomi e altri sistemi che richiedono il rigoroso soddisfacimento dei vincoli
  2. Sistemi Non Lineari: particolarmente adatto a sistemi di controllo non lineari con vincoli complessi
  3. Controllo in Tempo Reale: complessità computazionale inferiore rispetto a MPC, adatto per applicazioni in tempo reale

Bibliografia

L'articolo cita i principali lavori nel campo, inclusi:

  • Ames et al. (2017): definizione moderna di CBF
  • Chen et al. (2021): concetto di CBF di backup
  • Nicotra e Garone (2018): regolatore di riferimento esplicito
  • Lavori precedenti degli autori: fondamenti teorici di DSM-CBF

Valutazione Complessiva: Si tratta di un articolo di alta qualità con teoria rigorosa e metodo innovativo, che fornisce un approccio sistematico alla progettazione di CBF. Mantenendo il rigore teorico, il metodo possiede buona praticità. La generalità e la relativa semplicità di implementazione del metodo gli conferiscono elevato valore pratico.