2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

Проектирование функций управления барьерами с использованием динамической политики резервного копирования

Основная информация

  • ID статьи: 2510.09810
  • Название: Designing Control Barrier Functions Using a Dynamic Backup Policy
  • Авторы: Victor Freire, Marco M. Nicotra (University of Colorado, Boulder)
  • Классификация: eess.SY cs.SY
  • Время публикации: препринт arXiv, октябрь 2025
  • Ссылка на статью: https://arxiv.org/abs/2510.09810

Аннотация

В статье предложен систематический метод конструирования функций управления барьерами (ФУБ) для нелинейных управляемых аффинных систем при произвольных ограничениях на состояние и управление. Вдохновленный литературой по регуляторам с переменной уставкой, метод определяет семейство политик резервного копирования, параметризованных многообразием равновесия системы. Функция управления барьером определяется в расширенном пространстве состояние-уставка: для заданной пары состояние-уставка метод количественно определяет расстояние в будущий момент времени до нарушения ограничения при условии, что уставка политики резервного копирования остается постоянной. Затем анализ чувствительности используется для вычисления (возможно негладкой) матрицы Якоби относительно расширенного вектора состояния.

Исследовательский контекст и мотивация

Основная проблема

Функции управления барьерами (ФУБ) являются мощным инструментом для проектирования контроллеров критичных по безопасности систем, однако их систематический синтез для общих систем при произвольных ограничениях остается сложной задачей. Несмотря на то, что современное определение ФУБ было установлено в 2017 году, их систематическое проектирование остается открытой проблемой.

Важность проблемы

На практике специалисты часто вынуждены использовать кандидатные ФУБ, поскольку их проще проектировать, они обеспечивают хорошую производительность при настройке параметров и использовании переменных ослабления, но не имеют строгих гарантий безопасности эффективных ФУБ.

Ограничения существующих методов

  1. Методы машинного обучения: отсутствие теоретических гарантий
  2. Методы сумм квадратов: применимы только к полиномиальным системам
  3. Методы обучения на примерах: зависят от высокого качества обучающих данных
  4. Методы резервных ФУБ: отсутствие систематизированного подхода к проектированию политик резервного копирования

Исследовательская мотивация

Предыдущая работа авторов доказала, что динамические границы безопасности (ДГБ) в расширенном пространстве состояние-уставка являются ФУБ. В данной работе расширяется подход на основе траекторий для конструирования ФУБ, обеспечивая более систематизированный и общий метод.

Основные вклады

  1. Систематизированный метод проектирования ФУБ: предложен метод конструирования ДГБ-ФУБ на основе предсказания траектории, применимый к нелинейным управляемым аффинным системам с произвольными ограничениями на состояние и управление
  2. Динамическая политика резервного копирования: политика резервного копирования параметризуется многообразием равновесия системы с нестационарной параметризацией, обеспечивая большую гибкость по сравнению с фиксированными политиками
  3. Теоретические гарантии: при мягких предположениях доказана асимптотическая устойчивость базовой матрицы чувствительности и строго рассмотрены проблемы, возникающие из-за потенциальной негладкости ФУБ
  4. Практические соображения: решены проблемы конечного горизонта и гладкости, предложены более простые для реализации стратегии с доказательством их достаточности и осуществимости

Описание метода

Постановка задачи

Рассмотрим управляемую аффинную систему:

ẋ = f(x) + g(x)u

при ограничениях на состояние x ∈ X и управление u ∈ U. Целью является проектирование ФУБ для обеспечения выполнения ограничений.

Основные предположения

Предположение 3: Система допускает многообразие равновесия, параметризованное v ∈ ℝˡ, существуют непрерывные функции x̄(v) и ū(v) такие, что:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

и существует предстабилизирующая управляющая стратегия π(x,v), для которой x̄(v) является асимптотически устойчивой точкой равновесия.

Конструирование ДГБ-ФУБ на основе траекторий

1. Определение динамической границы безопасности

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

где:

  • c(x,v) описывает зависящие от уставки ограничения на состояние
  • Φ(τ,x,v) — решение предстабилизирующей динамики

2. Анализ чувствительности

Вычисление матрицы Якоби чувствительности потока:

Чувствительность по состоянию:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

Чувствительность по уставке:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. Реализация с конечным горизонтом

Поскольку бесконечный горизонт численно неосуществим, используется конечный горизонт T с введением терминальной ДГБ:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

Технические инновации

  1. Параметризованное семейство политик резервного копирования: в отличие от фиксированных политик, параметризация через многообразие равновесия обеспечивает целое семейство стратегий
  2. ФУБ в расширенном пространстве: определение ФУБ в расширенном пространстве состояние-уставка естественным образом обрабатывает динамику уставки
  3. Обработка негладкости: использование обобщенной матрицы Якоби Кларка для строгой обработки потенциальной негладкости ФУБ
  4. Гарантии осуществимости: доказано, что фильтр безопасности всегда имеет осуществимое решение: u = π(x,v), w = 0

Экспериментальная установка

Модель системы

Система перевернутого маятника на тележке:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

Параметры:

  • Масса тележки m_c = 1 кг
  • Масса маятника m_p = 0,5 кг
  • Длина маятника L = 0,7 м

Условия ограничений

  • Ограничения на состояние: |x| ≤ 4,5 м, |θ-π| ≤ π/9
  • Ограничения на управление: |u| ≤ 20 Н

Проектирование контроллера

  • Предстабилизирующий контроллер: проектирование LQR, K_π = -0,44, 35,3, -1,4, 8,0
  • Номинальный контроллер: K_κ = -35, 150, -20, 50
  • Горизонт предсказания: T = 10 секунд
  • Функция класса K∞: α(c) = 100c (ограничения), α(c) = 400c (терминальная ДГБ)

Методы сравнения

  1. Номинальное управление: использование только номинального контроллера (небезопасно)
  2. Ляпуновская ДГБ-ФУБ: метод ДГБ на основе функции Ляпунова
  3. ERG: явный регулятор с переменной уставкой
  4. Резервная ФУБ: традиционный метод резервной ФУБ

Результаты экспериментов

Основные результаты

Из результатов моделирования видно:

  1. Безопасность: предложенный метод успешно поддерживает выполнение всех ограничений, положение тележки остается в диапазоне ±4,5 м, отклонение угла маятника — в диапазоне ±20°
  2. Преимущества производительности:
    • По сравнению с ляпуновской ДГБ-ФУБ: более быстрая сходимость, более гладкие траектории
    • По сравнению с ERG: значительное улучшение скорости отклика
    • По сравнению с традиционной резервной ФУБ: лучшая производительность благодаря дополнительной степени свободы, обеспечиваемой параметризованным семейством политик резервного копирования
  3. Управляющее воздействие: управление всегда удовлетворяет ограничению ±20 Н и более гладко по сравнению с другими методами

Анализ производительности

  • Качество траектории: предложенный метод обеспечивает плавный переход от начального положения к целевому
  • Выполнение ограничений: строгое выполнение всех ограничений на состояние и управление
  • Сходимость: демонстрирует лучшие характеристики сходимости по сравнению с методами сравнения

Проверка преимуществ метода

Эксперименты подтверждают следующие теоретические ожидания:

  1. Параметризованное семейство политик резервного копирования обеспечивает лучшую производительность, чем фиксированные политики
  2. Метод предсказания траектории эффективен при работе с системами высокого относительного порядка и неминимальной фазы
  3. Практическая применимость метода ФУБ в расширенном пространстве

Связанные работы

Методы проектирования ФУБ

  1. Методы машинного обучения (Harms et al. 2024): использование машинного обучения для проектирования ФУБ
  2. Методы сумм квадратов (Dai et al. 2024): проектирование полиномиальных ФУБ
  3. Методы обучения на примерах (Lindemann et al. 2024): обучение ФУБ на основе безопасных демонстраций

Работы по резервным ФУБ

  1. Chen et al. (2021): введение концепции резервной ФУБ
  2. Van Wijk et al. (2024): возмущенно-робастные резервные ФУБ
  3. Choi et al. (2021): робастные функции значения управления барьером

Литература по регуляторам с переменной уставкой

Метод данной работы вдохновлен литературой по регуляторам с переменной уставкой, в частности концепцией динамических границ безопасности, но расширяет ее на рамки ФУБ.

Заключение и обсуждение

Основные выводы

  1. Систематизированное проектирование: обеспечивает систематизированный метод конструирования эффективных ФУБ, применимый к нелинейным системам с произвольными ограничениями
  2. Теоретические гарантии: при мягких предположениях обеспечивает строгий теоретический анализ и гарантии осуществимости
  3. Практичность: метод прост в реализации с относительно низкой вычислительной сложностью

Ограничения

  1. Зависимость от предположений: требует, чтобы система допускала многообразие равновесия и возможности проектирования предстабилизирующего контроллера
  2. Вычислительная сложность: хотя ниже, чем у МПУ, все еще требует предсказания траектории и вычисления чувствительности
  3. Настройка параметров: требует надлежащего выбора функций класса K∞ и горизонта предсказания

Направления будущих исследований

  1. Исследование робастности: изучение свойств робастности при ограниченных возмущениях
  2. Альтернативные методы предсказания: исследование других методов предсказания траектории
  3. Оптимизация вычислений: методы дальнейшего снижения вычислительной сложности

Глубокая оценка

Преимущества

  1. Теоретическая строгость: обеспечивает полный теоретический анализ, включая доказательства существования, осуществимости и сходимости
  2. Универсальность метода: применим к широкому классу нелинейных управляемых аффинных систем
  3. Простота реализации: относительно низкие вычислительные затраты по сравнению с МПУ и другими методами
  4. Обработка сложности: способен обрабатывать насыщение управления, множественные ограничения, сильную нелинейность и другие сложные случаи

Недостатки

  1. Ограничения предположений: предположение о многообразии равновесия может ограничить область применения метода
  2. Чувствительность к параметрам: производительность метода может быть чувствительна к выбору параметров
  3. Объем экспериментов: проверка проведена только на одной системе, отсутствует более широкая экспериментальная валидация

Влияние

  1. Научный вклад: обеспечивает новую теоретическую базу и практический метод для проектирования ФУБ
  2. Практическая ценность: относительно простой метод, перспективный для применения в реальных системах
  3. Воспроизводимость: авторы предоставили открытый исходный код, повышая воспроизводимость

Области применения

  1. Критичные по безопасности системы: роботы, автономные транспортные средства и другие системы, требующие строгого выполнения ограничений
  2. Нелинейные системы: особенно подходит для нелинейных систем управления со сложными ограничениями
  3. Управление в реальном времени: благодаря более низкой вычислительной сложности по сравнению с МПУ, подходит для приложений реального времени

Список литературы

Статья ссылается на основные работы в этой области, включая:

  • Ames et al. (2017): современное определение ФУБ
  • Chen et al. (2021): концепция резервной ФУБ
  • Nicotra and Garone (2018): явный регулятор с переменной уставкой
  • Предыдущие работы авторов: теоретическая база ДГБ-ФУБ

Общая оценка: Это высокого качества статья с теоретически строгим и новаторским методом, обеспечивающая систематизированный подход к проектированию ФУБ. Метод сочетает теоретическую строгость с хорошей практической применимостью. Универсальность и относительная простота реализации обеспечивают высокую практическую ценность.