2025-11-25T18:04:25.210324

Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles

Chang, Renganathan, Ahmed

This paper presents a risk-budgeted monitor with a control framework that certifies safety for autonomous driving. In this process, a sliding window is proposed to monitor for insufficient barrier residuals or nonzero tail risk, ensuring system safety. When the safety margin deteriorates, it triggers switching the safety constraint from a performance-based relaxed-control barrier function (R-CBF) to a conservative conditional value at risk (CVaR-CBF) to address the safety concern. This switching is governed by two real-time triggers: Feasibility-Triggered (FT) and Quality-Triggered (QT) conditions. In the FT condition, if the R-CBF constraint becomes infeasible or yields a suboptimal solution, the risk monitor triggers the use of the CVaR constraints for the controller. In the QT condition, the risk monitor observes the safety margin of the R-CBF solution at every step, regardless of feasibility. If it falls below the safety margin, the safety filter switches to the CVaR-CBF constraints. The proposed framework is evaluated using a model predictive controller (MPC) for autonomous driving in the presence of autonomous vehicle (AV) localization noise and obstacle position uncertainties. Multiple AV-pedestrian interaction scenarios are considered, with 1,500 Monte Carlo runs conducted for all scenarios. In the most challenging setting with pedestrian detection uncertainty of 5 m, the proposed framework achieves a 94-96% success rate of not colliding with the pedestrians over 300 trials while maintaining the lowest mean cross-track error (CTE = 3.2-3.6 m) to the reference path. The reduced CTE indicates faster trajectory recovery after obstacle avoidance, demonstrating a balance between safety and performance.

academic

自動運転車における均衡した性能と安全性のためのリスク予算制御フレームワーク

基本情報

論文ID: 2510.10442
タイトル: Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles
著者: Pei Yu Chang, Vishnu Renganathan, Qadeer Ahmed (オハイオ州立大学)
分類: eess.SY (システムと制御)、cs.SY (システムと制御)
発表日: 2025年10月12日 (arXiv プレプリント)
論文リンク: https://arxiv.org/abs/2510.10442

要約

本論文は、自動運転の安全認証のためのリスク予算モニタリング装置と制御フレームワークを提案している。本フレームワークは、スライディングウィンドウモニタリングを用いて不十分なバリア残差または非ゼロテール風険を監視し、システム安全性を確保する。安全マージンが悪化した場合、性能指向の緩和制御バリア関数(R-CBF)から保守的な条件付きリスク価値(CVaR-CBF)制約への切り替えがトリガーされる。切り替えは2つのリアルタイムトリガーによって制御される：実行可能性トリガー(FT)と品質トリガー(QT)条件。最も困難な歩行者検出不確実性5メートルの設定において、本フレームワークは300回の試行で94～96%の歩行者衝突回避成功率を達成しながら、最小の平均横方向追従誤差(CTE=3.2～3.6メートル)を維持している。

研究背景と動機

問題定義

不確実性環境における自動運転車両の安全制御は重要な課題である。従来の制御バリア関数(CBF)は安全性を保証できるが、二次計画法(QP)が実行可能かつ最適である場合にのみ有効である。以下の問題に直面した場合、既存の方法には限界がある：

計算複雑性：不確実性により計算要求が大幅に増加し、制御器は20～50Hz周波数で動作する必要がある
実行可能性の問題：入力制約と安全制約により、内部QPが実行不可能になる可能性がある
性能と安全のトレードオフ：保守的な安全戦略は性能を犠牲にし、積極的な性能戦略は安全要件に違反する可能性がある

研究動機

既存の方法はパラメータチューニング、階層的最適化、または学習強化可行集合を通じて実行可能性の問題に対処しているが、多くの場合、大量のデータ収集が必要であるか、継続的な不実行可能性時の安全性を直接定量化できない。本論文は実用的な観点から、不実行可能性が必ずしも安全性の喪失を意味しないと考え、リスク予算モニタリングフレームワークを提案している。

核心的貢献

形式化されたリスク予算モニタリング装置：有限時間領域内のウィンドウ化された安全保証を提供
モニタリング駆動の切り替えメカニズム：性能指向のCBF-QPと保守的なCVaR-CBFの間でリアルタイムナビゲーションを実現し、テール風険を制限
理論と実験検証：リスク予算が制御された過渡的不実行可能性を許容しながら、認証された有限時間領域安全性を維持することを証明

方法論の詳細

タスク定義

非線形連続時間制御アフィンシステムを考慮する： $\dot{x} = f(x) + g(x)u$

ここで、 $x \in D \subset \mathbb{R}^n$ と $u \in U \subset \mathbb{R}^m$ はそれぞれシステム状態と入力を表す。安全集合は $S = \{x : h(x) \geq 0\}$ として定義される。

モデルアーキテクチャ

1. 緩和CBF (R-CBF)

従来のCBFの緩和版。非負の緩和変数 $\nu_k$ を導入することで、アクチュエータ制限による不実行可能性に対処する：

$\min_{u_k \in U, \nu_k \geq 0} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2$ $\text{s.t. } L_f h(x_k) + L_g h(x_k)u_k + \kappa h(x_k) \geq -\nu_k$

2. 確率的安全集とCVaR-CBF

障害物位置と車両位置決めの不確実性を考慮し、安全性評価を確率的風険形式に変換する。損失関数を定義する： $Z_k^i(u_k) := -r_k^i(u_k)$

ここで $r_k^i(u_k)$ は安全残差である。

CVaR制約： $\text{CVaR}_\epsilon(Z_{k+1}^i) = \inf_{\gamma \in \mathbb{R}} \left\{\gamma + \frac{1}{1-\epsilon}\mathbb{E}[(Z_{k+1}^i - \gamma)^+]\right\}$

緩和CVaR-CBF最適化： $\min_{u_k \in U, \nu_k \in \mathbb{R}} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2$ $\text{s.t. } \text{CVaR}_\epsilon(Z_{k+1}^i) \leq \nu_k, \quad 0 \leq \nu_k \leq \bar{\nu}$

3. リスク予算モニタリング装置

不良ステップ検出：不良ステップインジケータを定義する $b_k = \mathbf{1}\{\nu_k > \bar{\nu}\} \vee \mathbf{1}\{r_{\min,k} < \delta\}$

ここで $\delta > 0$ は事前定義された安全マージンである。

スライディングウィンドウモニタリング：長さ $W$ のスライディングウィンドウ内で、最大 $M$ 個の不良ステップが許可される： $m_k = m_{k-1} + b_k - b_{k-W}$

ウィンドウレベル安全認証定理： $\mu^M(1-\mu^{W-M})\delta \geq (1-\mu^M)\nu$

ここで $\mu = e^{-\kappa T_s}$ である。

4. 切り替えトリガーメカニズム

実行可能性トリガー(FT-C-CBF)：

1, & \text{if } (a_k = 0) \wedge (m_k \geq M) \\ 0, & \text{if } (a_k = 1) \wedge (m_k < M) \end{cases}$$ **品質トリガー(QT-C-CBF)**： $$\eta_k = \begin{cases} 1, & \text{if } m_k \geq M \\ 0, & \text{if } m_k < M \end{cases}$$ ### 技術的革新点 1. **リスク予算概念**：リスク予算の概念をCBFフレームワークに初めて導入し、短期的な安全マージン低下を許容 2. **ウィンドウレベル安全保証**：段階的安全保証ではなく、有限時間領域内の安全認証を提供 3. **適応的切り替えメカニズム**：リアルタイム風険評価に基づく知的切り替え戦略 ## 実験設定 ### データセット - GPS経路に基づく参照軌跡。実験用自動運転車両から取得 - 3種類の歩行者相互作用シナリオ：単一歩行者、二人の歩行者、三人の歩行者横断シナリオ - 合計1500回のモンテカルロ実行 ### 評価指標 1. **成功率(SR)**：最小車両-歩行者距離が常に2.8メートルを超える試行の割合 2. **最小歩行者距離(MDP)**：障害物回避プロセス中の最も近い歩行者との平均最小距離 3. **不実行可能率(IR)**：最適化ステップで実行可能解を生成できない割合 4. **計算時間(CT)**：ステップあたりの平均計算時間 5. **横方向追従誤差(CTE)**：目的経路に対する偏差 ### 比較方法 1. **R-CBF**：純粋な緩和CBF 2. **C-CBF**：ハードテール制約のCVaR-CBF 3. **AC-CBF**：適応CVaR-CBF 4. **RC-CBF**：緩和CVaR-CBF ### 実装詳細 - 最小安全距離：$D_s = 3$ メートル - スライディングウィンドウ：$W = 5$、最大不良ステップ数：$M = 1$ - 安全マージン：$\delta = 1$ メートル - CVaR信頼水準：$\epsilon = 95\%$ - 車両位置不確実性：$\sigma_v = 0.1$ メートル - 障害物位置不確実性：$\sigma_o \in \{1,2,3,4,5\}$ メートル ## 実験結果 ### 主要結果 最も困難な設定($\sigma_v = 0.1$、$\sigma_o = 5$ メートル、三人の歩行者シナリオ)において： | 方法 | 成功率(%) | MDP(メートル) | 不実行可能率(%) | 計算時間(ms) | CTE(メートル) | |------|-----------|---------|-------------|--------------|---------| | R-CBF | 67% | 6.3 | 11.9% | 22.4 | 3.9 | | C-CBF | 98% | 11.3 | 15.2% | 56.2 | 4.2 | | AC-CBF | 84% | 7.33 | 17.8% | 76.9 | 5.0 | | RC-CBF | 97% | 12 | 15.3% | 75.3 | 4.3 | | **FT-C-CBF** | **94%** | **7.1** | **15.8%** | **24.2** | **3.2** | | **QT-C-CBF** | **96%** | **8.3** | **16.1%** | **25.7** | **3.6** | ### 主要な知見 1. **性能のバランス**：提案手法はC-CBFに近い安全性(94～96% vs 98%)を達成しながら、R-CBFに近い性能(CTE 3.2～3.6メートル vs 3.9メートル)を維持 2. **計算効率**：計算時間は保守的なベースライン方法より大幅に短い(24～26ms vs 56～75ms) 3. **QTはFTより優れている**：QTトリガーメカニズムはすべてのδ値で高い成功率を示す ### アブレーション実験 異なる安全マージンパラメータδ∈{0.1, 1, 2}に対する実験は以下を示す： - CVaR活性化率はδに単調増加 - QTは常にFTより高い成功率とCVaR活性化率を示す - より大きなδはより早く、より頻繁な保守的制御器の活性化をもたらす ## 関連研究 ### 主要な研究方向 1. **CBF改善方法**：緩和CBF、高次CBF、学習駆動パラメータチューニング 2. **不確実性処理**：確率的CBF、CVaR-CBF 3. **実行可能性の問題**：階層的最適化、学習強化可行集合 ### 本論文の利点 既存の研究と比較して、本論文が提案するリスク予算モニタリングフレームワークは： 1. 大量のデータ収集を必要としない 2. 明確な安全認証を提供 3. 性能と安全の効果的なバランスを実現 4. 計算効率が高く、リアルタイム応用に適している ## 結論と考察 ### 主要な結論 1. リスク予算モニタリング装置は自動運転における性能と安全要件の効果的なバランスを取ることができる 2. ウィンドウレベル安全認証は段階的安全保証より実用的である 3. QTトリガーメカニズムはFTトリガーメカニズムより優れている 4. 本フレームワークは計算効率と安全性能の両面で顕著な利点を有する ### 制限事項 1. **パラメータチューニング**：ウィンドウサイズW、最大不良ステップ数Mなどのパラメータは具体的な応用に応じてチューニングが必要 2. **理論的仮定**：サンプリング時間が十分に小さいという仮定に基づく 3. **シナリオ制限**：主に歩行者回避シナリオで検証され、他の複雑なシナリオは検証待ち 4. **ハードウェア検証**：実際の車両プラットフォームでの検証はまだ実施されていない ### 今後の方向性 1. 実際の自動運転車両プラットフォームでのハードウェアインザループおよび道路試験の実施 2. より複雑な多エージェント相互作用シナリオへの拡張 3. パラメータの適応的チューニング方法の研究 4. 他の安全認証方法との組み合わせの探索 ## 深い評価 ### 利点 1. **理論的貢献**：新規なリスク予算概念を提案し、CBFフレームワークに新しい理論的基礎を提供 2. **実用的価値**：CBFの実際の応用における実行可能性の問題を解決し、強い工学的価値を有する 3. **十分な実験**：1500回のモンテカルロ実験、複数の比較方法、説得力のある結果 4. **数学的厳密性**：完全な理論証明と安全認証を提供 ### 不足点 1. **複雑性**：複数のパラメータ(W, M, δ, ν)が導入され、パラメータチューニングが複雑になる可能性がある 2. **保守性**：場合によっては依然として過度に保守的である可能性がある 3. **適用範囲**：主に特定の種類の障害物回避問題に対応し、汎化能力は検証待ち 4. **リアルタイム性**：計算時間は改善されているが、極端な状況ではリアルタイム性の課題に直面する可能性がある ### 影響力 1. **学術的影響**：CBF分野に新しい研究方向を提供し、より多くの関連研究を刺激する可能性がある 2. **産業的価値**：自動運転安全制御に実用的なソリューションを提供 3. **再現性**：方法の説明が明確で、パラメータ設定が明確であり、優れた再現性を有する ### 適用シナリオ 1. **自動運転**：特に都市環境における歩行者回避に適している 2. **ロボット航法**：移動ロボットの安全航法に拡張可能 3. **産業制御**：安全保証が必要な産業制御システムに適用可能 ## 参考文献 論文は21の関連文献を引用しており、CBF理論、確率的制御、リスク管理など複数の分野の重要な研究をカバーしており、研究に堅実な理論的基礎を提供している。 --- **総合評価**：これは制御理論の高品質な論文であり、理論的革新と実際の応用の間で優れたバランスを見出している。リスク予算モニタリングの概念は新規かつ実用的であり、実験検証は十分であり、自動運転安全制御分野に重要な貢献をしている。