2025-11-25T18:04:25.210324

Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles

Chang, Renganathan, Ahmed
This paper presents a risk-budgeted monitor with a control framework that certifies safety for autonomous driving. In this process, a sliding window is proposed to monitor for insufficient barrier residuals or nonzero tail risk, ensuring system safety. When the safety margin deteriorates, it triggers switching the safety constraint from a performance-based relaxed-control barrier function (R-CBF) to a conservative conditional value at risk (CVaR-CBF) to address the safety concern. This switching is governed by two real-time triggers: Feasibility-Triggered (FT) and Quality-Triggered (QT) conditions. In the FT condition, if the R-CBF constraint becomes infeasible or yields a suboptimal solution, the risk monitor triggers the use of the CVaR constraints for the controller. In the QT condition, the risk monitor observes the safety margin of the R-CBF solution at every step, regardless of feasibility. If it falls below the safety margin, the safety filter switches to the CVaR-CBF constraints. The proposed framework is evaluated using a model predictive controller (MPC) for autonomous driving in the presence of autonomous vehicle (AV) localization noise and obstacle position uncertainties. Multiple AV-pedestrian interaction scenarios are considered, with 1,500 Monte Carlo runs conducted for all scenarios. In the most challenging setting with pedestrian detection uncertainty of 5 m, the proposed framework achieves a 94-96% success rate of not colliding with the pedestrians over 300 trials while maintaining the lowest mean cross-track error (CTE = 3.2-3.6 m) to the reference path. The reduced CTE indicates faster trajectory recovery after obstacle avoidance, demonstrating a balance between safety and performance.
academic

Структура управления с бюджетированием риска для сбалансированной производительности и безопасности автономных транспортных средств

Основная информация

  • ID статьи: 2510.10442
  • Название: Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles
  • Авторы: Pei Yu Chang, Vishnu Renganathan, Qadeer Ahmed (Университет штата Огайо)
  • Классификация: eess.SY (Системы и управление), cs.SY (Системы и управление)
  • Дата публикации: 12 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.10442

Аннотация

В данной работе предлагается структура мониторинга с бюджетированием риска и управления для сертификации безопасности автономных транспортных средств. Структура использует мониторинг скользящего окна недостаточных остатков барьера или ненулевого хвостового риска для обеспечения безопасности системы. При ухудшении запаса безопасности инициируется переключение с функции барьера управления на основе производительности (R-CBF) на консервативное ограничение условной стоимости риска (CVaR-CBF). Переключение контролируется двумя триггерами реального времени: условием триггера осуществимости (FT) и условием триггера качества (QT). В наиболее сложной конфигурации с неопределённостью обнаружения пешеходов в 5 метров структура достигает 94-96% успешности избежания столкновений с пешеходами в 300 испытаниях, сохраняя при этом минимальную среднюю ошибку поперечного отслеживания (CTE = 3,2-3,6 метра).

Исследовательский контекст и мотивация

Определение проблемы

Безопасное управление автономными транспортными средствами в условиях неопределённости является критической задачей. Хотя традиционные функции барьера управления (CBF) гарантируют безопасность, они эффективны только при осуществимости и оптимальности квадратичного программирования (QP). Существующие методы имеют ограничения при столкновении со следующими проблемами:

  1. Вычислительная сложность: неопределённость значительно увеличивает вычислительные требования, в то время как контроллер должен работать на частоте 20-50 Гц
  2. Проблемы осуществимости: ограничения входных сигналов и ограничения безопасности могут привести к неосуществимости внутреннего QP
  3. Компромисс между производительностью и безопасностью: консервативные стратегии безопасности жертвуют производительностью, а агрессивные стратегии производительности могут нарушить требования безопасности

Исследовательская мотивация

Существующие методы решают проблемы осуществимости путём настройки параметров, иерархической оптимизации или обучения с расширением множества осуществимости, но часто требуют сбора большого количества данных или не могут напрямую количественно оценить безопасность при постоянной неосуществимости. Данная работа исходит из практической перспективы, признавая, что неосуществимость не обязательно означает потерю безопасности, и предлагает структуру мониторинга с бюджетированием риска.

Основные вклады

  1. Формализация монитора бюджетирования риска: обеспечение гарантий безопасности в окне конечного временного горизонта
  2. Механизм переключения, управляемый мониторингом: навигация в реальном времени между ориентированным на производительность CBF-QP и консервативным CVaR-CBF с ограничением хвостового риска
  3. Теоретическая и экспериментальная верификация: доказательство того, что бюджетирование риска позволяет контролируемую переходную неосуществимость при сохранении сертифицированной безопасности конечного временного горизонта

Детальное описание методологии

Определение задачи

Рассмотрим нелинейную непрерывную систему управления с аффинной структурой: x˙=f(x)+g(x)u\dot{x} = f(x) + g(x)u

где xDRnx \in D \subset \mathbb{R}^n и uURmu \in U \subset \mathbb{R}^m обозначают состояние системы и входной сигнал соответственно. Множество безопасности определяется как S={x:h(x)0}S = \{x : h(x) \geq 0\}.

Архитектура модели

1. Ослабленный CBF (R-CBF)

Ослабленная версия традиционного CBF, обрабатывающая неосуществимость, вызванную ограничениями исполнительных механизмов, путём введения неотрицательной переменной ослабления νk\nu_k:

minukU,νk012ukuknom2+ρννk2\min_{u_k \in U, \nu_k \geq 0} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2при условии Lfh(xk)+Lgh(xk)uk+κh(xk)νk\text{при условии } L_f h(x_k) + L_g h(x_k)u_k + \kappa h(x_k) \geq -\nu_k

2. Стохастическое множество безопасности и CVaR-CBF

Учитывая неопределённость в положении препятствия и локализации транспортного средства, оценка безопасности преобразуется в форму вероятностного риска. Определим функцию потерь: Zki(uk):=rki(uk)Z_k^i(u_k) := -r_k^i(u_k)

где rki(uk)r_k^i(u_k) — остаток безопасности.

Ограничение CVaR: CVaRϵ(Zk+1i)=infγR{γ+11ϵE[(Zk+1iγ)+]}\text{CVaR}_\epsilon(Z_{k+1}^i) = \inf_{\gamma \in \mathbb{R}} \left\{\gamma + \frac{1}{1-\epsilon}\mathbb{E}[(Z_{k+1}^i - \gamma)^+]\right\}

Ослабленная оптимизация CVaR-CBF: minukU,νkR12ukuknom2+ρννk2\min_{u_k \in U, \nu_k \in \mathbb{R}} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2при условии CVaRϵ(Zk+1i)νk,0νkνˉ\text{при условии } \text{CVaR}_\epsilon(Z_{k+1}^i) \leq \nu_k, \quad 0 \leq \nu_k \leq \bar{\nu}

3. Монитор бюджетирования риска

Обнаружение плохого шага: определим индикатор плохого шага bk=1{νk>νˉ}1{rmin,k<δ}b_k = \mathbf{1}\{\nu_k > \bar{\nu}\} \vee \mathbf{1}\{r_{\min,k} < \delta\}

где δ>0\delta > 0 — предопределённый запас безопасности.

Мониторинг скользящего окна: в скользящем окне длины WW допускается не более MM плохих шагов: mk=mk1+bkbkWm_k = m_{k-1} + b_k - b_{k-W}

Теорема сертификации безопасности на уровне окна: μM(1μWM)δ(1μM)ν\mu^M(1-\mu^{W-M})\delta \geq (1-\mu^M)\nu

где μ=eκTs\mu = e^{-\kappa T_s}.

4. Механизм триггеров переключения

Триггер осуществимости (FT-C-CBF):

1, & \text{если } (a_k = 0) \wedge (m_k \geq M) \\ 0, & \text{если } (a_k = 1) \wedge (m_k < M) \end{cases}$$ **Триггер качества (QT-C-CBF)**: $$\eta_k = \begin{cases} 1, & \text{если } m_k \geq M \\ 0, & \text{если } m_k < M \end{cases}$$ ### Технические инновации 1. **Концепция бюджетирования риска**: впервые внедрена идея бюджетирования риска в структуру CBF, позволяя краткосрочное снижение запаса безопасности 2. **Гарантии безопасности на уровне окна**: обеспечение сертификации безопасности в конечном временном горизонте, а не пошаговой гарантии безопасности 3. **Адаптивный механизм переключения**: интеллектуальная стратегия переключения на основе оценки риска в реальном времени ## Экспериментальная установка ### Набор данных - Опорные траектории на основе GPS-пути из экспериментального автономного транспортного средства - Три типа сценариев взаимодействия с пешеходами: сценарии с одним пешеходом, двумя пешеходами и тремя пешеходами, переходящими дорогу - Всего 1500 прогонов методом Монте-Карло ### Метрики оценки 1. **Коэффициент успеха (SR)**: доля испытаний, в которых минимальное расстояние между транспортным средством и пешеходом постоянно превышает 2,8 метра 2. **Минимальное расстояние до пешехода (MDP)**: среднее минимальное расстояние до ближайшего пешехода во время избежания препятствия 3. **Коэффициент неосуществимости (IR)**: доля шагов оптимизации, при которых невозможно получить осуществимое решение 4. **Время вычисления (CT)**: среднее время вычисления на шаг 5. **Ошибка поперечного отслеживания (CTE)**: отклонение от желаемой траектории ### Методы сравнения 1. **R-CBF**: чистый ослабленный CBF 2. **C-CBF**: CVaR-CBF с жёстким ограничением хвоста 3. **AC-CBF**: адаптивный CVaR-CBF 4. **RC-CBF**: ослабленный CVaR-CBF ### Детали реализации - Минимальное расстояние безопасности: $D_s = 3$ метра - Скользящее окно: $W = 5$, максимальное количество плохих шагов: $M = 1$ - Запас безопасности: $\delta = 1$ метр - Уровень доверия CVaR: $\epsilon = 95\%$ - Неопределённость положения транспортного средства: $\sigma_v = 0,1$ метра - Неопределённость положения препятствия: $\sigma_o \in \{1,2,3,4,5\}$ метров ## Результаты экспериментов ### Основные результаты В наиболее сложной конфигурации ($\sigma_v = 0,1$, $\sigma_o = 5$ метров, сценарий с тремя пешеходами): | Метод | SR (%) | MDP (м) | IR (%) | CT (мс) | CTE (м) | |-------|--------|---------|--------|---------|---------| | R-CBF | 67 | 6,3 | 11,9 | 22,4 | 3,9 | | C-CBF | 98 | 11,3 | 15,2 | 56,2 | 4,2 | | AC-CBF | 84 | 7,33 | 17,8 | 76,9 | 5,0 | | RC-CBF | 97 | 12 | 15,3 | 75,3 | 4,3 | | **FT-C-CBF** | **94** | **7,1** | **15,8** | **24,2** | **3,2** | | **QT-C-CBF** | **96** | **8,3** | **16,1** | **25,7** | **3,6** | ### Ключевые выводы 1. **Сбалансированная производительность**: предложенный метод достигает безопасности, близкой к C-CBF (94-96% против 98%), при этом сохраняя производительность, близкую к R-CBF (CTE 3,2-3,6 метра против 3,9 метра) 2. **Вычислительная эффективность**: время вычисления значительно ниже, чем у консервативных методов-базовых линий (24-26 мс против 56-75 мс) 3. **QT превосходит FT**: механизм триггера QT демонстрирует более высокий коэффициент успеха при всех значениях δ ### Абляционные эксперименты Эксперименты с различными параметрами запаса безопасности δ ∈ {0,1, 1, 2} показывают: - Коэффициент активации CVaR монотонно возрастает с δ - QT постоянно превосходит FT по коэффициенту успеха и коэффициенту активации CVaR - Больший δ приводит к более раннему и частому включению консервативного контроллера ## Связанные работы ### Основные направления исследований 1. **Методы улучшения CBF**: ослабленный CBF, CBF высокого порядка, настройка параметров с использованием обучения 2. **Обработка неопределённости**: стохастический CBF, CVaR-CBF 3. **Проблемы осуществимости**: иерархическая оптимизация, обучение с расширением множества осуществимости ### Преимущества данной работы По сравнению с существующими работами предложенная структура мониторинга с бюджетированием риска: 1. Не требует сбора большого количества данных 2. Обеспечивает явную сертификацию безопасности 3. Достигает эффективного баланса между производительностью и безопасностью 4. Имеет высокую вычислительную эффективность, подходит для приложений реального времени ## Заключение и обсуждение ### Основные выводы 1. Монитор бюджетирования риска эффективно балансирует требования производительности и безопасности в автономных транспортных средствах 2. Сертификация безопасности на уровне окна более практична, чем пошаговая гарантия безопасности 3. Механизм триггера QT превосходит механизм триггера FT 4. Структура имеет значительные преимущества как в вычислительной эффективности, так и в производительности безопасности ### Ограничения 1. **Настройка параметров**: параметры, такие как размер окна W, максимальное количество плохих шагов M и т. д., требуют настройки в соответствии с конкретным приложением 2. **Теоретические предположения**: основано на предположении о достаточно малом времени дискретизации 3. **Ограничения сценария**: в основном проверено в сценариях избежания пешеходов, другие сложные сценарии требуют дальнейшей проверки 4. **Верификация оборудования**: ещё не проверено на реальной платформе автономного транспортного средства ### Направления будущих исследований 1. Проведение аппаратных испытаний в цикле и дорожных испытаний на реальной платформе автономного транспортного средства 2. Расширение на более сложные сценарии взаимодействия нескольких агентов 3. Исследование методов адаптивной настройки параметров 4. Изучение интеграции с другими методами сертификации безопасности ## Глубокая оценка ### Преимущества 1. **Теоретический вклад**: предложена новая концепция бюджетирования риска, обеспечивающая новую теоретическую основу для структуры CBF 2. **Практическая ценность**: решает проблему осуществимости CBF в практических приложениях, имеет высокую инженерную ценность 3. **Достаточные эксперименты**: 1500 прогонов методом Монте-Карло, несколько методов сравнения, результаты убедительны 4. **Математическая строгость**: обеспечены полные теоретические доказательства и сертификация безопасности ### Недостатки 1. **Сложность**: введены несколько параметров (W, M, δ, ν), настройка параметров может быть сложной 2. **Консервативность**: в некоторых случаях может быть чрезмерно консервативным 3. **Область применения**: в основном ориентирован на специфические типы задач избежания препятствий, способность к обобщению требует проверки 4. **Реальное время**: хотя время вычисления улучшено, в экстремальных случаях может столкнуться с проблемами реального времени ### Влияние 1. **Академическое влияние**: предоставляет новое направление исследований для области CBF, может вдохновить больше связанных работ 2. **Промышленная ценность**: предоставляет практическое решение для управления безопасностью автономных транспортных средств 3. **Воспроизводимость**: описание методов ясно, параметры установлены явно, имеет хорошую воспроизводимость ### Применимые сценарии 1. **Автономные транспортные средства**: особенно подходит для избежания пешеходов в городской среде 2. **Навигация мобильных роботов**: может быть расширено на безопасную навигацию мобильных роботов 3. **Промышленное управление**: применимо к промышленным системам управления, требующим гарантий безопасности ## Библиография Статья цитирует 21 соответствующий источник, охватывающий теорию CBF, стохастическое управление, управление рисками и другие области, обеспечивая прочную теоретическую основу для исследования. --- **Общая оценка**: это высококачественная статья по теории управления, которая находит хороший баланс между теоретическими инновациями и практическим применением. Концепция мониторинга с бюджетированием риска является новой и практичной, экспериментальная верификация достаточна, работа имеет важное значение для области управления безопасностью автономных транспортных средств.