Designing Control Barrier Functions Using a Dynamic Backup Policy
Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic
Проектирование функций управления барьерами с использованием динамической политики резервного копирования
В статье предложен систематический метод конструирования функций управления барьерами (ФУБ) для нелинейных управляемых аффинных систем при произвольных ограничениях на состояние и управление. Вдохновленный литературой по регуляторам с переменной уставкой, метод определяет семейство политик резервного копирования, параметризованных многообразием равновесия системы. Функция управления барьером определяется в расширенном пространстве состояние-уставка: для заданной пары состояние-уставка метод количественно определяет расстояние в будущий момент времени до нарушения ограничения при условии, что уставка политики резервного копирования остается постоянной. Затем анализ чувствительности используется для вычисления (возможно негладкой) матрицы Якоби относительно расширенного вектора состояния.
Функции управления барьерами (ФУБ) являются мощным инструментом для проектирования контроллеров критичных по безопасности систем, однако их систематический синтез для общих систем при произвольных ограничениях остается сложной задачей. Несмотря на то, что современное определение ФУБ было установлено в 2017 году, их систематическое проектирование остается открытой проблемой.
На практике специалисты часто вынуждены использовать кандидатные ФУБ, поскольку их проще проектировать, они обеспечивают хорошую производительность при настройке параметров и использовании переменных ослабления, но не имеют строгих гарантий безопасности эффективных ФУБ.
Предыдущая работа авторов доказала, что динамические границы безопасности (ДГБ) в расширенном пространстве состояние-уставка являются ФУБ. В данной работе расширяется подход на основе траекторий для конструирования ФУБ, обеспечивая более систематизированный и общий метод.
Систематизированный метод проектирования ФУБ: предложен метод конструирования ДГБ-ФУБ на основе предсказания траектории, применимый к нелинейным управляемым аффинным системам с произвольными ограничениями на состояние и управление
Динамическая политика резервного копирования: политика резервного копирования параметризуется многообразием равновесия системы с нестационарной параметризацией, обеспечивая большую гибкость по сравнению с фиксированными политиками
Теоретические гарантии: при мягких предположениях доказана асимптотическая устойчивость базовой матрицы чувствительности и строго рассмотрены проблемы, возникающие из-за потенциальной негладкости ФУБ
Практические соображения: решены проблемы конечного горизонта и гладкости, предложены более простые для реализации стратегии с доказательством их достаточности и осуществимости
Параметризованное семейство политик резервного копирования: в отличие от фиксированных политик, параметризация через многообразие равновесия обеспечивает целое семейство стратегий
ФУБ в расширенном пространстве: определение ФУБ в расширенном пространстве состояние-уставка естественным образом обрабатывает динамику уставки
Обработка негладкости: использование обобщенной матрицы Якоби Кларка для строгой обработки потенциальной негладкости ФУБ
Гарантии осуществимости: доказано, что фильтр безопасности всегда имеет осуществимое решение: u = π(x,v), w = 0
Безопасность: предложенный метод успешно поддерживает выполнение всех ограничений, положение тележки остается в диапазоне ±4,5 м, отклонение угла маятника — в диапазоне ±20°
Преимущества производительности:
По сравнению с ляпуновской ДГБ-ФУБ: более быстрая сходимость, более гладкие траектории
По сравнению с ERG: значительное улучшение скорости отклика
По сравнению с традиционной резервной ФУБ: лучшая производительность благодаря дополнительной степени свободы, обеспечиваемой параметризованным семейством политик резервного копирования
Управляющее воздействие: управление всегда удовлетворяет ограничению ±20 Н и более гладко по сравнению с другими методами
Метод данной работы вдохновлен литературой по регуляторам с переменной уставкой, в частности концепцией динамических границ безопасности, но расширяет ее на рамки ФУБ.
Систематизированное проектирование: обеспечивает систематизированный метод конструирования эффективных ФУБ, применимый к нелинейным системам с произвольными ограничениями
Теоретические гарантии: при мягких предположениях обеспечивает строгий теоретический анализ и гарантии осуществимости
Практичность: метод прост в реализации с относительно низкой вычислительной сложностью
Статья ссылается на основные работы в этой области, включая:
Ames et al. (2017): современное определение ФУБ
Chen et al. (2021): концепция резервной ФУБ
Nicotra and Garone (2018): явный регулятор с переменной уставкой
Предыдущие работы авторов: теоретическая база ДГБ-ФУБ
Общая оценка: Это высокого качества статья с теоретически строгим и новаторским методом, обеспечивающая систематизированный подход к проектированию ФУБ. Метод сочетает теоретическую строгость с хорошей практической применимостью. Универсальность и относительная простота реализации обеспечивают высокую практическую ценность.