2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

LiDAR意味論的分割における階層的GMM由来の認識論的不確実性を用いた分布外検出

基本情報

  • 論文ID: 2510.08631
  • タイトル: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • 著者: Hanieh Shojaei Miandashti, Claus Brenner (ライプニッツ大学ハノーファー)
  • 分類: cs.CV, cs.LG
  • 発表日: 2025年10月8日 (arXivプレプリント)
  • 論文リンク: https://arxiv.org/abs/2510.08631

要旨

本論文は、階層的ベイズ高斯混合モデル(GMM)パラメータモデリングに基づく認識論的不確実性推定手法を提案し、LiDAR意味論的分割における分布外(OOD)検出に適用している。本手法は補助データや追加の訓練段階を必要とせず、SemanticKITTIデータセット上で既存の予測エントロピーベースの手法と比較して顕著な改善を達成している:AUROC 18%向上、AUPRC 22%向上、FPR95が76%から40%に低下。

研究背景と動機

問題定義

自動運転などの安全性が重要なアプリケーションにおいて、LiDAR意味論的分割は既知シーンの正確な理解だけでなく、訓練時に見たことのない分布外(OOD)物体を識別し、未知物体を既知クラスに誤分類することを回避する必要がある。

問題の重要性

  1. 安全性要件:自動運転システムは道路上の異常物体(ゴミ箱、標識、動物など)を識別する必要がある
  2. 信頼性要求:深層モデルはしばしばOOD入力に対して過度に自信を持った誤った予測を生成する
  3. 実用性の考慮:現実環境には訓練データセットでカバーされていない多くの物体クラスが存在する

既存手法の限界

  1. 教師あり手法:補助OODデータセットに依存し、LiDAR領域では取得が困難
  2. 教師なし手法:主に予測エントロピーに依存するが、認識論的不確実性(epistemic)と偶然的不確実性(aleatoric)を混同している
  3. 不確実性の混淆:予測エントロピーはモデル不確実性とデータノイズを混合し、曖昧な分布内領域をOODとして誤分類する

核心的貢献

  1. 認識論的不確実性に基づくOOD検出手法の提案:階層的ベイズモデリングによるGMMパラメータを通じて、認識論的不確実性と偶然的不確実性を分離
  2. 教師なしフレームワーク:補助OODデータや追加訓練段階を必要とせず、実用性を向上
  3. 顕著な性能向上:SemanticKITTIデータセット上で既存手法を大幅に上回る
  4. 理論的貢献:OOD検出における認識論的不確実性の予測エントロピーに対する優位性を証明

手法の詳細

タスク定義

LiDAR点群の距離ビュー表現が与えられたとき、目標は以下の通り:

  1. ピクセルレベルの意味論的分割を実行
  2. OODに属するピクセル領域を識別
  3. 予測の不確実性を定量化

モデルアーキテクチャ

1. 生成-判別混合フレームワーク

GMMSegアーキテクチャに基づき、深層ニューラルネットワークでピクセルレベルの特徴表現z ∈ R^Dを抽出し、特徴空間で各意味クラスcに対するクラス条件付きガウス混合分布をモデル化:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

ここでπ_k^(c)、μ_k^(c)、Σ_k^(c)はそれぞれ第k番目のガウス成分の混合重み、平均、共分散を表す。

2. 階層的ベイズモデリング

主要な革新はGMMパラメータに対する階層的ベイズモデリング:

  • 事前分布:各ガウス成分の平均と分散に対してガウス-逆ガンマ共役事前分布を設定
  • 事後更新:訓練データに基づいてパラメータの事後分布を更新
  • パラメータサンプリング:推論時に事後分布から複数のGMMパラメータセットをサンプリング

具体的には:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. 認識論的不確実性推定

n個のGMMパラメータをサンプリングすることで、各ピクセルのクラス予測の頻度分布を計算し、その後エントロピーを計算:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

ここでp̄_c = (1/n)Σ(i=1 to n)Iy^(i) = cはクラスcの経験的確率を表す。

技術的革新点

  1. 不確実性の分離:パラメータサンプリングを通じて認識論的不確実性を直接推定し、予測エントロピーにおける2つの不確実性の混淆を回避
  2. 再訓練不要:既存の分割ネットワークの特徴空間を利用し、GMMモデリングを通じて不確実性推定を実現
  3. 理論的基礎:相互情報理論に基づき、認識論的不確実性をIy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))と定義

実験設定

データセット

  • SemanticKITTI:19個の意味クラスを含むLiDAR点群データセット
  • OODクラス:データセット内のoutlierクラスをOODサンプルとして使用(ゴミ箱、標識、動物など)
  • 入力形式:64×1024×5の距離ビュー画像(x,y,z座標、強度、距離)
  • 特徴次元:SalsaNextバックボーンネットワークで32次元特徴を抽出

評価指標

  • AUROC:ROC曲線下面積、全体的な分類性能を測定
  • AUPRC:精度-再現率曲線下面積、クラス不均衡シーンに適切
  • FPR95:真陽性率95%時の偽陽性率、安全性を測定
  • mIoU:意味論的分割の平均交差比

比較手法

  • MSP:最大ソフトマックス確率
  • ODIN:温度スケーリングと入力摂動手法
  • MC Dropout:モンテカルロドロップアウト
  • Deep Ensembles (DE):深層アンサンブル
  • GMMSeg:元のGMM分割手法(不確実性モデリングなし)

実装詳細

  • バックボーンネットワーク:SalsaNext
  • GMM成分数:クラスあたり2つのガウス成分
  • サンプリング数:20個のGMMパラメータサンプル
  • 閾値戦略:教師なしの百分位数閾値(上位5%)

実験結果

主要結果

手法AUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
本手法91.0637.6740.1457.71

主要な知見

  1. 顕著な性能向上:最良のベースライン(GMMSeg)と比較して、AUROC 3.44%向上、AUPRC 11.53%向上
  2. 安全性の改善:FPR95がDeep Ensemblesの76.48%から40.14%に低下
  3. 分割性能:投票メカニズムを通じて、意味論的分割精度も軽微な向上

定性的分析

可視化による比較を通じて以下を発見:

  • 本手法:真のOOD物体(標識、ゴミ箱など)を正確に識別し、曖昧なID領域に対して適度な不確実性を保持
  • Deep Ensembles:意味的境界で多くの偽陽性を生成し、真のOOD物体を見落とす

不確実性分布分析

予測エントロピーと認識論的不確実性の分布を比較:

  • 予測エントロピーはIDおよびOODサンプル間で大きな重複が存在
  • 認識論的不確実性はより明確な分離を実現し、IDサンプルは低不確実性領域に集中

関連研究

OOD検出手法の分類

  1. 教師あり手法:補助データセットを用いたoutlier exposureトレーニングに依存
  2. 教師なし手法:不確実性推定に基づき、確定的手法(MSP、ODIN)とベイズ手法(MC Dropout、Deep Ensembles)を含む

不確実性推定

  • 予測エントロピー手法:認識論的および偶然的不確実性を混合
  • 相互情報手法:理論的には2つの不確実性を分離可能だが、深層ネットワークでは正確な計算が困難
  • 本論文の貢献:GMMパラメータのベイズモデリングを通じて認識論的不確実性の直接推定を実現

結論と考察

主要な結論

  1. 認識論的不確実性はOOD検出において予測エントロピーより有効
  2. 階層的ベイズGMMモデリングは認識論的不確実性推定の実用的手法を提供
  3. 教師なしフレームワークは補助データへの依存を回避

限界

  1. 偽陽性の問題:意味的に曖昧または誤分割されたID領域に対しても高い不確実性を生成する可能性
  2. 閾値選択:百分位数閾値戦略に依存し、すべてのシーンに適用できない可能性
  3. 計算複雑性:複数回のパラメータサンプリングが必要で、推論時間が増加

今後の方向性

  1. 境界領域の曖昧性を低減する戦略の研究
  2. 不確実性閾値選択方法の改善
  3. より効率的な不確実性推定手法の探索

深層的評価

利点

  1. 理論的貢献:OOD検出における認識論的不確実性の優位性を明確に説明し、理論的基礎を提供
  2. 手法の革新性:GMMパラメータのベイズモデリングを通じて認識論的不確実性推定を巧妙に実現
  3. 実験の充実:標準データセット上で複数のベースラインとの包括的な比較を実施
  4. 実用性:補助データや再訓練を必要とせず、展開が容易

不足点

  1. 汎化性の検証待ち:SemanticKITTIデータセットのみで検証され、より多くのデータセットでの検証が必要
  2. パラメータ感度:GMM成分数などのハイパーパラメータ選択の詳細な分析が不足
  3. 計算コスト:複数回サンプリングの計算コスト分析が不十分
  4. 理論分析:GMMモデリングがなぜ不確実性をより良く分離できるかについての深い理論的説明が不足

影響力

  1. 学術的価値:LiDAR意味論的分割のOOD検出に新しい研究方向を提供
  2. 実用的価値:自動運転などの安全性が重要なアプリケーションに重要な意義を持つ
  3. 再現性:手法説明が明確で、実装が比較的簡単

適用シーン

  1. 自動運転:道路上の異常物体の検出
  2. ロボット航法:未知環境における障害物の識別
  3. 安全監視:異常行動または物体の検出
  4. 産業検査:生産ラインの不良品の識別

参考文献

論文は関連分野の重要な研究を引用している:

  • GMMSeg 18:生成的意味論的分割の基礎研究
  • Deep Ensembles 16:不確実性推定の古典的手法
  • MC Dropout 7:ベイズ深層学習の代表的研究
  • SemanticKITTI 1:LiDAR意味論的分割の標準データセット

本論文はLiDAR意味論的分割のOOD検出領域において重要な貢献を行い、巧妙な技術設計を通じて認識論的不確実性の有効な推定を実現し、自動運転システムの安全性と信頼性向上のための価値ある解決策を提供している。