2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner

In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.

academic

LiDAR意味論的分割における階層的GMM由来の認識論的不確実性を用いた分布外検出

基本情報

論文ID: 2510.08631
タイトル: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
著者: Hanieh Shojaei Miandashti, Claus Brenner (ライプニッツ大学ハノーファー)
分類: cs.CV, cs.LG
発表日: 2025年10月8日 (arXivプレプリント)
論文リンク: https://arxiv.org/abs/2510.08631

要旨

本論文は、階層的ベイズ高斯混合モデル(GMM)パラメータモデリングに基づく認識論的不確実性推定手法を提案し、LiDAR意味論的分割における分布外(OOD)検出に適用している。本手法は補助データや追加の訓練段階を必要とせず、SemanticKITTIデータセット上で既存の予測エントロピーベースの手法と比較して顕著な改善を達成している：AUROC 18%向上、AUPRC 22%向上、FPR95が76%から40%に低下。

研究背景と動機

問題定義

自動運転などの安全性が重要なアプリケーションにおいて、LiDAR意味論的分割は既知シーンの正確な理解だけでなく、訓練時に見たことのない分布外(OOD)物体を識別し、未知物体を既知クラスに誤分類することを回避する必要がある。

問題の重要性

安全性要件：自動運転システムは道路上の異常物体（ゴミ箱、標識、動物など）を識別する必要がある
信頼性要求：深層モデルはしばしばOOD入力に対して過度に自信を持った誤った予測を生成する
実用性の考慮：現実環境には訓練データセットでカバーされていない多くの物体クラスが存在する

既存手法の限界

教師あり手法：補助OODデータセットに依存し、LiDAR領域では取得が困難
教師なし手法：主に予測エントロピーに依存するが、認識論的不確実性(epistemic)と偶然的不確実性(aleatoric)を混同している
不確実性の混淆：予測エントロピーはモデル不確実性とデータノイズを混合し、曖昧な分布内領域をOODとして誤分類する

核心的貢献

認識論的不確実性に基づくOOD検出手法の提案：階層的ベイズモデリングによるGMMパラメータを通じて、認識論的不確実性と偶然的不確実性を分離
教師なしフレームワーク：補助OODデータや追加訓練段階を必要とせず、実用性を向上
顕著な性能向上：SemanticKITTIデータセット上で既存手法を大幅に上回る
理論的貢献：OOD検出における認識論的不確実性の予測エントロピーに対する優位性を証明

手法の詳細

タスク定義

LiDAR点群の距離ビュー表現が与えられたとき、目標は以下の通り：

ピクセルレベルの意味論的分割を実行
OODに属するピクセル領域を識別
予測の不確実性を定量化

モデルアーキテクチャ

1. 生成-判別混合フレームワーク

GMMSegアーキテクチャに基づき、深層ニューラルネットワークでピクセルレベルの特徴表現z ∈ R^Dを抽出し、特徴空間で各意味クラスcに対するクラス条件付きガウス混合分布をモデル化：

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

ここでπ_k^(c)、μ_k^(c)、Σ_k^(c)はそれぞれ第k番目のガウス成分の混合重み、平均、共分散を表す。

2. 階層的ベイズモデリング

主要な革新はGMMパラメータに対する階層的ベイズモデリング：

事前分布：各ガウス成分の平均と分散に対してガウス-逆ガンマ共役事前分布を設定
事後更新：訓練データに基づいてパラメータの事後分布を更新
パラメータサンプリング：推論時に事後分布から複数のGMMパラメータセットをサンプリング

具体的には：

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. 認識論的不確実性推定

n個のGMMパラメータをサンプリングすることで、各ピクセルのクラス予測の頻度分布を計算し、その後エントロピーを計算：

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

ここでp̄_c = (1/n)Σ(i=1 to n)Iy^(i) = cはクラスcの経験的確率を表す。

技術的革新点

不確実性の分離：パラメータサンプリングを通じて認識論的不確実性を直接推定し、予測エントロピーにおける2つの不確実性の混淆を回避
再訓練不要：既存の分割ネットワークの特徴空間を利用し、GMMモデリングを通じて不確実性推定を実現
理論的基礎：相互情報理論に基づき、認識論的不確実性をIy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))と定義

実験設定

データセット

SemanticKITTI：19個の意味クラスを含むLiDAR点群データセット
OODクラス：データセット内のoutlierクラスをOODサンプルとして使用（ゴミ箱、標識、動物など）
入力形式：64×1024×5の距離ビュー画像（x,y,z座標、強度、距離）
特徴次元：SalsaNextバックボーンネットワークで32次元特徴を抽出

評価指標

AUROC：ROC曲線下面積、全体的な分類性能を測定
AUPRC：精度-再現率曲線下面積、クラス不均衡シーンに適切
FPR95：真陽性率95%時の偽陽性率、安全性を測定
mIoU：意味論的分割の平均交差比

比較手法

MSP：最大ソフトマックス確率
ODIN：温度スケーリングと入力摂動手法
MC Dropout：モンテカルロドロップアウト
Deep Ensembles (DE)：深層アンサンブル
GMMSeg：元のGMM分割手法（不確実性モデリングなし）

実装詳細

バックボーンネットワーク：SalsaNext
GMM成分数：クラスあたり2つのガウス成分
サンプリング数：20個のGMMパラメータサンプル
閾値戦略：教師なしの百分位数閾値（上位5%）

実験結果

主要結果

手法	AUROC (%)	AUPRC (%)	FPR95 (%)	mIoU (%)
MSP	70.41	10.90	76.00	56.37
ODIN	73.74	12.45	75.54	56.37
MC Dropout	73.64	13.65	75.92	57.15
Deep Ensembles	73.03	16.14	76.48	57.17
GMMSeg	87.62	26.14	48.84	57.60
本手法	91.06	37.67	40.14	57.71