2025-11-10T03:02:44.593935

Viscosity CBFs: Bridging the Control Barrier Function and Hamilton-Jacobi Reachability Frameworks in Safe Control Theory

Hirsch, Fisac, Herbert
Control barrier functions (CBFs) and Hamilton-Jacobi reachability (HJR) are central frameworks in safe control. Traditionally, these frameworks have been viewed as distinct, with the former focusing on optimally safe controller design and the latter providing sufficient conditions for safety. A previous work introduced the notion of a control barrier value function (CB-VF), which is defined similarly to the other value functions studied in HJR but has certain CBF-like properties. In this work, we proceed the other direction by generalizing CBFs to non-differentiable ``viscosity'' CBFs. We show the deep connection between viscosity CBFs and CB-VFs, bridging the CBF and HJR frameworks. Through this bridge, we characterize the viscosity CBFs as precisely those functions which provide CBF-like safety guarantees (control invariance and smooth approach to the boundary). We then further show nice theoretical properties of viscosity CBFs, including their desirable closure under maximum and limit operations. In the process, we also extend CB-VFs to non-exponential anti-discounting and update the corresponding theory for CB-VFs along these lines.
academic

Вязкостные CBFs: Связывание фреймворков функций управления барьером и достижимости Гамильтона-Якоби в теории безопасного управления

Основная информация

  • ID статьи: 2510.09929
  • Название: Viscosity CBFs: Bridging the Control Barrier Function and Hamilton-Jacobi Reachability Frameworks in Safe Control Theory
  • Авторы: Dylan Hirsch, Jaime Fernández Fisac, Sylvia Herbert
  • Классификация: eess.SY (Системы и управление), cs.SY (Системы и управление)
  • Дата публикации: 11 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.09929

Аннотация

Функции управления барьером (CBFs) и достижимость Гамильтона-Якоби (HJR) являются двумя основными фреймворками в теории безопасного управления. Традиционно эти два фреймворка рассматривались как различные подходы, первый сосредоточен на проектировании оптимальных контроллеров безопасности, второй предоставляет достаточные условия для безопасности. Предыдущие работы ввели концепцию функций стоимости управления барьером (CB-VF), определённые аналогично другим функциям стоимости, изучаемым в HJR, но с определёнными свойствами CBF. В данной работе авторы идут в другом направлении, обобщая CBFs на недифференцируемые "вязкостные" CBFs. Авторы демонстрируют глубокую связь между вязкостными CBFs и CB-VFs, связывая фреймворки CBF и HJR. Через эту связь авторы точно характеризуют вязкостные CBFs как функции, обеспечивающие гарантии безопасности класса CBF (управляемую инвариантность и гладкое приближение границы). Кроме того, показаны хорошие теоретические свойства вязкостных CBFs, включая идеальную замкнутость при операциях максимума и предела.

Исследовательский контекст и мотивация

Проблемный фон

  1. Разделение двух основных фреймворков безопасного управления: CBFs и HJR являются двумя главными фреймворками в теории безопасного управления, но традиционно рассматриваются как независимые методы
  2. Ограничения традиционных CBFs: Традиционные CBFs требуют непрерывной дифференцируемости, что в некоторых приложениях слишком строго и ограничивает их применимость
  3. Отсутствие теоретической связи: Недостаёт единого теоретического фреймворка для понимания внутренней связи между этими двумя подходами

Исследовательская мотивация

  1. Теоретическое объединение: Установление глубокой теоретической связи между CBFs и HJR для обеспечения более полной теоретической основы безопасного управления
  2. Расширение методов: Обобщение CBFs на недифференцируемые функции для расширения их применимости
  3. Характеризация свойств: Точная характеризация того, какие функции могут обеспечивать гарантии безопасности типа CBF

Основные вклады

  1. Введение концепции вязкостных CBFs: Обобщение традиционных CBFs на недифференцируемые функции, требующие только удовлетворения неравенства CBF в вязкостном смысле
  2. Установление теоретического моста: Доказательство полной эквивалентности между вязкостными CBFs и временно-инвариантными CB-VFs, связывающее фреймворки CBF и HJR
  3. Полная характеризация гарантий безопасности: Доказательство того, что вязкостные CBFs являются в точности непрерывными функциями, обеспечивающими "гарантии барьера" (Barrier Guarantee)
  4. Расширение теории CB-VF: Расширение CB-VF от экспоненциального дисконтирования к нелинейному дисконтированию, определяемому функциями класса K
  5. Анализ теоретических свойств: Доказательство хороших свойств вязкостных CBFs, таких как замкнутость при операциях максимума и предела

Подробное описание методов

Основные определения и постановка

Рассмотрим динамическую систему: x˙=f(x,u)\dot{x} = f(x,u)

где f:Rn×URnf : \mathbb{R}^n \times U \to \mathbb{R}^n — функция Липшица, URmU \subset \mathbb{R}^m — компактное множество допустимых управляющих входов.

Традиционное определение CBF

Функция h:RnRh : \mathbb{R}^n \to \mathbb{R} является функцией управления барьером относительно функции класса K α\alpha, если она непрерывно дифференцируема и удовлетворяет: maxuUh(x)f(x,u)α(h(x))\max_{u \in U} \nabla h(x) \cdot f(x,u) \geq -\alpha(h(x)) для всех xRnx \in \mathbb{R}^n, удовлетворяющих h(x)>0h(x) > 0.

Основное нововведение: вязкостные CBFs

Определение вязкостного CBF

Непрерывная функция h:RnRh : \mathbb{R}^n \to \mathbb{R} является вязкостным CBF относительно функции класса K α\alpha, если для каждого xRnx \in \mathbb{R}^n, удовлетворяющего h(x)>0h(x) > 0, неравенство maxuUh(x)f(x,u)α(h(x))\max_{u \in U} \nabla h(x) \cdot f(x,u) \geq -\alpha(h(x)) выполняется в вязкостном смысле.

Вязкостный смысл: Для любой непрерывно дифференцируемой функции ϕ:RnR\phi : \mathbb{R}^n \to \mathbb{R}, если hϕh - \phi имеет локальный максимум в точке xx, то maxuUϕ(x)f(x,u)α(h(x))\max_{u \in U} \nabla \phi(x) \cdot f(x,u) \geq -\alpha(h(x))

Гарантия барьера (Barrier Guarantee)

Непрерывная функция B:RnRB : \mathbb{R}^n \to \mathbb{R} обеспечивает гарантию барьера относительно локально липшицевой функции класса K α\alpha, если для каждого θ[0,1)\theta \in [0,1) и каждого xRnx \in \mathbb{R}^n, удовлетворяющего B(x)>0B(x) > 0, существует uUu \in U такое, что для всех t0t \geq 0: B(xxu(t))βα(θB(x),t)B(x_x^u(t)) \geq \beta_\alpha(\theta B(x), t)

где βα\beta_\alpha — функция класса KL, связанная с α\alpha.

Расширение функций стоимости управления барьером (CB-VF)

Для непрерывной функции g:RnR0g : \mathbb{R}^n \to \mathbb{R}_{\geq 0} и локально липшицевой функции класса K α\alpha, CB-VF v:Rn×R0R0v : \mathbb{R}^n \times \mathbb{R}_{\geq 0} \to \mathbb{R}_{\geq 0} определяется неявно: βα(v(x,T),T)=supuUmint[0,T]βα(g(xxu(t)),Tt)\beta_\alpha(v(x,T), T) = \sup_{u \in U} \min_{t \in [0,T]} \beta_\alpha(g(x_x^u(t)), T-t)

Основные теоретические результаты

Теорема 1: Характеризация CB-VF через HJ-PDE

CB-VF vv является единственным вязкостным решением HJ-PDE: max{TvHα(x,v,v),vg(x)}=0\max\left\{\frac{\partial}{\partial T}v - H_\alpha(x,v,\nabla v), v - g(x)\right\} = 0

где гамильтониан Hα(x,r,λ)=maxuUλf(x,u)+α(r)H_\alpha(x,r,\lambda) = \max_{u \in U} \lambda \cdot f(x,u) + \alpha(r).

Теорема 2: Основной результат эквивалентности

Для локально липшицевой функции класса K α\alpha и непрерывной функции h:RnR0h : \mathbb{R}^n \to \mathbb{R}_{\geq 0} следующие утверждения эквивалентны:

  1. hh является вязкостным CBF относительно α\alpha
  2. hh является вязкостным решением HJ-PDE min{Hα(x,h,h),0}=0-\min\{H_\alpha(x,h,\nabla h), 0\} = 0
  3. Соответствующая CB-VF является временно-инвариантной, т.е. v(,T)h()v(\cdot, T) \equiv h(\cdot) для всех T0T \geq 0
  4. hh обеспечивает гарантию барьера относительно α\alpha

Свойства композиции вязкостных CBFs

Теорема 3: Замкнутость при операции максимума

Если h1,h2h_1, h_2 — оба вязкостные CBFs относительно функции класса K α\alpha, то max{h1,h2}\max\{h_1, h_2\} также является вязкостным CBF относительно α\alpha.

Теорема 4: Замкнутость при предельном переходе

Если h1,h2,h_1, h_2, \ldots — последовательность вязкостных CBFs относительно функции класса K α\alpha, и hihh_i \to h локально равномерно, то hh также является вязкостным CBF относительно α\alpha.

Технические инновации

1. Применение теории вязкостных решений

  • Введение концепции вязкостного решения из теории дифференциальных уравнений в частных производных в теорию CBF
  • Избежание строгого требования непрерывной дифференцируемости традиционных CBFs
  • Сохранение существенных свойств гарантий безопасности

2. Связывание фреймворков

  • Установление двусторонней связи между CBF и HJR
  • Реализация теоретического объединения через CB-VF как посредника
  • Предоставление возможности понимания безопасного управления с двух различных точек зрения

3. Расширение нелинейного дисконтирования

  • Обобщение от экспоненциального дисконтирования к произвольному дисконтированию, определяемому функциями класса K
  • Повышение выразительной способности и применимости CB-VF

Примеры приложений

Пример 1: Недифференцируемый CBF

Рассмотрим скалярную систему x˙=x+x+x3/(1+x)u\dot{x} = x + x + x^3/(1+|x|) \cdot u с множеством управления U=[1,1]U = [-1,1].

Определим h(x)=1xh(x) = 1 - |x| (функция знакового расстояния до небезопасного множества (,1][1,+)(-\infty,-1] \cup [1,+\infty)).

Хотя hh недифференцируема в точке x=0x = 0, можно проверить, что она является вязкостным CBF относительно α(r)=r\alpha(r) = r.

Теоретическое значение и практическая ценность

Теоретическое значение

  1. Полнота: Полная характеризация класса функций, обеспечивающих гарантии безопасности типа CBF
  2. Единство: Объединение двух важных фреймворков безопасного управления на одной теоретической основе
  3. Расширяемость: Предоставление более широкого пространства для развития теории CBF

Практическая ценность

  1. Расширение применимости: Возможность использования недифференцируемых функций в качестве CBF, применимых к большему числу практических задач
  2. Методы композиции: Предоставление систематических методов построения новых CBFs из известных
  3. Вычислительные преимущества: Возможность использования вычислительных методов HJR для построения CBF

Ограничения и будущие направления

Ограничения

  1. Вычислительная сложность: Проверка и построение вязкостных CBFs может быть вычислительно более сложным
  2. Детали реализации: Статья сосредоточена на теоретических результатах, практические вычислительные методы требуют дальнейших исследований
  3. Проверка приложений: Отсутствие проверки на крупномасштабных практических системах

Будущие направления

  1. Вычислительные методы: Разработка эффективных алгоритмов вычисления и проверки вязкостных CBFs
  2. Расширение приложений: Конкретные приложения в робототехнике, автономном вождении и других областях
  3. Многоагентные системы: Расширение на безопасное управление многоагентными системами
  4. Стохастические системы: Рассмотрение случая стохастических динамических систем

Глубокая оценка

Преимущества

  1. Теоретическая глубина: Установление глубокой теоретической связи между двумя важными фреймворками
  2. Математическая строгость: Полные доказательства, теоретические результаты имеют важное значение
  3. Концептуальная инновация: Концепция вязкостного CBF обладает оригинальностью и практической ценностью
  4. Систематичность: Предоставление полной теоретической системы и анализа свойств

Недостатки

  1. Недостаток экспериментальной проверки: Статья в основном теоретическая работа, не хватает численных экспериментов и практических приложений
  2. Вычислительные методы: Отсутствие конкретных вычислительных алгоритмов или методов реализации
  3. Анализ сложности: Недостаток анализа вычислительной сложности методов

Оценка влияния

  1. Академическая ценность: Важный теоретический вклад в теорию безопасного управления
  2. Практический потенциал: Расширение применимости CBF, имеющее важную практическую ценность
  3. Последующие исследования: Закладывание теоретической основы для последующих исследований в смежных областях

Применимые сценарии

  1. Сложные геометрические ограничения: Задачи управления с недифференцируемыми ограничениями безопасности
  2. Многомодальные системы: Гибридные системы с переключающейся динамикой
  3. Робастное управление: Системы, критичные по безопасности, требующие обработки неопределённости
  4. Планирование пути: Навигация робота и задачи избежания препятствий

Библиография

Статья цитирует важные работы в области теории безопасного управления, включая:

  • Основополагающие работы по теории CBF (Ames et al.)
  • Теория достижимости Гамильтона-Якоби (Mitchell, Bayen, Tomlin)
  • Теория вязкостных решений (Bardi, Capuzzo-Dolcetta)
  • Оригинальные работы по функциям стоимости управления барьером (Choi et al.)

Заключение: Это высококачественная теоретическая статья, вносящая важный вклад в область теории безопасного управления. Путём введения концепции вязкостного CBF и установления связи с фреймворком HJR, она предоставляет более полную и единую теоретическую основу для безопасного управления. Хотя ей не хватает экспериментальной проверки, её теоретическая ценность и потенциальные перспективы приложений делают её важной работой в данной области.