В данной работе предлагается структура мониторинга с бюджетированием риска и управления для сертификации безопасности автономных транспортных средств. Структура использует мониторинг скользящего окна недостаточных остатков барьера или ненулевого хвостового риска для обеспечения безопасности системы. При ухудшении запаса безопасности инициируется переключение с функции барьера управления на основе производительности (R-CBF) на консервативное ограничение условной стоимости риска (CVaR-CBF). Переключение контролируется двумя триггерами реального времени: условием триггера осуществимости (FT) и условием триггера качества (QT). В наиболее сложной конфигурации с неопределённостью обнаружения пешеходов в 5 метров структура достигает 94-96% успешности избежания столкновений с пешеходами в 300 испытаниях, сохраняя при этом минимальную среднюю ошибку поперечного отслеживания (CTE = 3,2-3,6 метра).
Безопасное управление автономными транспортными средствами в условиях неопределённости является критической задачей. Хотя традиционные функции барьера управления (CBF) гарантируют безопасность, они эффективны только при осуществимости и оптимальности квадратичного программирования (QP). Существующие методы имеют ограничения при столкновении со следующими проблемами:
Существующие методы решают проблемы осуществимости путём настройки параметров, иерархической оптимизации или обучения с расширением множества осуществимости, но часто требуют сбора большого количества данных или не могут напрямую количественно оценить безопасность при постоянной неосуществимости. Данная работа исходит из практической перспективы, признавая, что неосуществимость не обязательно означает потерю безопасности, и предлагает структуру мониторинга с бюджетированием риска.
Рассмотрим нелинейную непрерывную систему управления с аффинной структурой:
где и обозначают состояние системы и входной сигнал соответственно. Множество безопасности определяется как .
Ослабленная версия традиционного CBF, обрабатывающая неосуществимость, вызванную ограничениями исполнительных механизмов, путём введения неотрицательной переменной ослабления :
Учитывая неопределённость в положении препятствия и локализации транспортного средства, оценка безопасности преобразуется в форму вероятностного риска. Определим функцию потерь:
где — остаток безопасности.
Ограничение CVaR:
Ослабленная оптимизация CVaR-CBF:
Обнаружение плохого шага: определим индикатор плохого шага
где — предопределённый запас безопасности.
Мониторинг скользящего окна: в скользящем окне длины допускается не более плохих шагов:
Теорема сертификации безопасности на уровне окна:
где .
Триггер осуществимости (FT-C-CBF):
1, & \text{если } (a_k = 0) \wedge (m_k \geq M) \\ 0, & \text{если } (a_k = 1) \wedge (m_k < M) \end{cases}$$ **Триггер качества (QT-C-CBF)**: $$\eta_k = \begin{cases} 1, & \text{если } m_k \geq M \\ 0, & \text{если } m_k < M \end{cases}$$ ### Технические инновации 1. **Концепция бюджетирования риска**: впервые внедрена идея бюджетирования риска в структуру CBF, позволяя краткосрочное снижение запаса безопасности 2. **Гарантии безопасности на уровне окна**: обеспечение сертификации безопасности в конечном временном горизонте, а не пошаговой гарантии безопасности 3. **Адаптивный механизм переключения**: интеллектуальная стратегия переключения на основе оценки риска в реальном времени ## Экспериментальная установка ### Набор данных - Опорные траектории на основе GPS-пути из экспериментального автономного транспортного средства - Три типа сценариев взаимодействия с пешеходами: сценарии с одним пешеходом, двумя пешеходами и тремя пешеходами, переходящими дорогу - Всего 1500 прогонов методом Монте-Карло ### Метрики оценки 1. **Коэффициент успеха (SR)**: доля испытаний, в которых минимальное расстояние между транспортным средством и пешеходом постоянно превышает 2,8 метра 2. **Минимальное расстояние до пешехода (MDP)**: среднее минимальное расстояние до ближайшего пешехода во время избежания препятствия 3. **Коэффициент неосуществимости (IR)**: доля шагов оптимизации, при которых невозможно получить осуществимое решение 4. **Время вычисления (CT)**: среднее время вычисления на шаг 5. **Ошибка поперечного отслеживания (CTE)**: отклонение от желаемой траектории ### Методы сравнения 1. **R-CBF**: чистый ослабленный CBF 2. **C-CBF**: CVaR-CBF с жёстким ограничением хвоста 3. **AC-CBF**: адаптивный CVaR-CBF 4. **RC-CBF**: ослабленный CVaR-CBF ### Детали реализации - Минимальное расстояние безопасности: $D_s = 3$ метра - Скользящее окно: $W = 5$, максимальное количество плохих шагов: $M = 1$ - Запас безопасности: $\delta = 1$ метр - Уровень доверия CVaR: $\epsilon = 95\%$ - Неопределённость положения транспортного средства: $\sigma_v = 0,1$ метра - Неопределённость положения препятствия: $\sigma_o \in \{1,2,3,4,5\}$ метров ## Результаты экспериментов ### Основные результаты В наиболее сложной конфигурации ($\sigma_v = 0,1$, $\sigma_o = 5$ метров, сценарий с тремя пешеходами): | Метод | SR (%) | MDP (м) | IR (%) | CT (мс) | CTE (м) | |-------|--------|---------|--------|---------|---------| | R-CBF | 67 | 6,3 | 11,9 | 22,4 | 3,9 | | C-CBF | 98 | 11,3 | 15,2 | 56,2 | 4,2 | | AC-CBF | 84 | 7,33 | 17,8 | 76,9 | 5,0 | | RC-CBF | 97 | 12 | 15,3 | 75,3 | 4,3 | | **FT-C-CBF** | **94** | **7,1** | **15,8** | **24,2** | **3,2** | | **QT-C-CBF** | **96** | **8,3** | **16,1** | **25,7** | **3,6** | ### Ключевые выводы 1. **Сбалансированная производительность**: предложенный метод достигает безопасности, близкой к C-CBF (94-96% против 98%), при этом сохраняя производительность, близкую к R-CBF (CTE 3,2-3,6 метра против 3,9 метра) 2. **Вычислительная эффективность**: время вычисления значительно ниже, чем у консервативных методов-базовых линий (24-26 мс против 56-75 мс) 3. **QT превосходит FT**: механизм триггера QT демонстрирует более высокий коэффициент успеха при всех значениях δ ### Абляционные эксперименты Эксперименты с различными параметрами запаса безопасности δ ∈ {0,1, 1, 2} показывают: - Коэффициент активации CVaR монотонно возрастает с δ - QT постоянно превосходит FT по коэффициенту успеха и коэффициенту активации CVaR - Больший δ приводит к более раннему и частому включению консервативного контроллера ## Связанные работы ### Основные направления исследований 1. **Методы улучшения CBF**: ослабленный CBF, CBF высокого порядка, настройка параметров с использованием обучения 2. **Обработка неопределённости**: стохастический CBF, CVaR-CBF 3. **Проблемы осуществимости**: иерархическая оптимизация, обучение с расширением множества осуществимости ### Преимущества данной работы По сравнению с существующими работами предложенная структура мониторинга с бюджетированием риска: 1. Не требует сбора большого количества данных 2. Обеспечивает явную сертификацию безопасности 3. Достигает эффективного баланса между производительностью и безопасностью 4. Имеет высокую вычислительную эффективность, подходит для приложений реального времени ## Заключение и обсуждение ### Основные выводы 1. Монитор бюджетирования риска эффективно балансирует требования производительности и безопасности в автономных транспортных средствах 2. Сертификация безопасности на уровне окна более практична, чем пошаговая гарантия безопасности 3. Механизм триггера QT превосходит механизм триггера FT 4. Структура имеет значительные преимущества как в вычислительной эффективности, так и в производительности безопасности ### Ограничения 1. **Настройка параметров**: параметры, такие как размер окна W, максимальное количество плохих шагов M и т. д., требуют настройки в соответствии с конкретным приложением 2. **Теоретические предположения**: основано на предположении о достаточно малом времени дискретизации 3. **Ограничения сценария**: в основном проверено в сценариях избежания пешеходов, другие сложные сценарии требуют дальнейшей проверки 4. **Верификация оборудования**: ещё не проверено на реальной платформе автономного транспортного средства ### Направления будущих исследований 1. Проведение аппаратных испытаний в цикле и дорожных испытаний на реальной платформе автономного транспортного средства 2. Расширение на более сложные сценарии взаимодействия нескольких агентов 3. Исследование методов адаптивной настройки параметров 4. Изучение интеграции с другими методами сертификации безопасности ## Глубокая оценка ### Преимущества 1. **Теоретический вклад**: предложена новая концепция бюджетирования риска, обеспечивающая новую теоретическую основу для структуры CBF 2. **Практическая ценность**: решает проблему осуществимости CBF в практических приложениях, имеет высокую инженерную ценность 3. **Достаточные эксперименты**: 1500 прогонов методом Монте-Карло, несколько методов сравнения, результаты убедительны 4. **Математическая строгость**: обеспечены полные теоретические доказательства и сертификация безопасности ### Недостатки 1. **Сложность**: введены несколько параметров (W, M, δ, ν), настройка параметров может быть сложной 2. **Консервативность**: в некоторых случаях может быть чрезмерно консервативным 3. **Область применения**: в основном ориентирован на специфические типы задач избежания препятствий, способность к обобщению требует проверки 4. **Реальное время**: хотя время вычисления улучшено, в экстремальных случаях может столкнуться с проблемами реального времени ### Влияние 1. **Академическое влияние**: предоставляет новое направление исследований для области CBF, может вдохновить больше связанных работ 2. **Промышленная ценность**: предоставляет практическое решение для управления безопасностью автономных транспортных средств 3. **Воспроизводимость**: описание методов ясно, параметры установлены явно, имеет хорошую воспроизводимость ### Применимые сценарии 1. **Автономные транспортные средства**: особенно подходит для избежания пешеходов в городской среде 2. **Навигация мобильных роботов**: может быть расширено на безопасную навигацию мобильных роботов 3. **Промышленное управление**: применимо к промышленным системам управления, требующим гарантий безопасности ## Библиография Статья цитирует 21 соответствующий источник, охватывающий теорию CBF, стохастическое управление, управление рисками и другие области, обеспечивая прочную теоретическую основу для исследования. --- **Общая оценка**: это высококачественная статья по теории управления, которая находит хороший баланс между теоретическими инновациями и практическим применением. Концепция мониторинга с бюджетированием риска является новой и практичной, экспериментальная верификация достаточна, работа имеет важное значение для области управления безопасностью автономных транспортных средств.