2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

基本信息

  • 论文ID: 2510.08631
  • 标题: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • 作者: Hanieh Shojaei Miandashti, Claus Brenner (Leibniz University Hannover)
  • 分类: cs.CV, cs.LG
  • 发表时间: 2025年10月8日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.08631

摘要

本文提出了一种基于分层贝叶斯高斯混合模型(GMM)参数建模的认知不确定性估计方法,用于LiDAR语义分割中的分布外(OOD)检测。该方法无需辅助数据或额外训练阶段,在SemanticKITTI数据集上相比现有基于预测熵的方法取得显著提升:AUROC提升18%,AUPRC提升22%,FPR95从76%降至40%。

研究背景与动机

问题定义

在自动驾驶等安全关键应用中,LiDAR语义分割不仅需要准确理解已知场景,还必须能够识别训练时未见过的分布外(OOD)对象,避免将未知物体错误分类为已知类别。

问题重要性

  1. 安全性要求:自动驾驶系统需要识别道路上的异常物体(如垃圾桶、标牌、动物等)
  2. 可靠性需求:深度模型往往对OOD输入产生过度自信但错误的预测
  3. 实用性考量:现实环境中存在大量训练数据集未覆盖的物体类别

现有方法局限性

  1. 监督方法:依赖辅助OOD数据集,在LiDAR领域难以获得
  2. 无监督方法:主要依赖预测熵,但混淆了认知不确定性(epistemic)和偶然不确定性(aleatoric)
  3. 不确定性混淆:预测熵将模型不确定性和数据噪声混合,导致将模糊的分布内区域误分类为OOD

核心贡献

  1. 提出了基于认知不确定性的OOD检测方法:通过分层贝叶斯建模GMM参数,分离认知不确定性和偶然不确定性
  2. 无监督框架:无需辅助OOD数据或额外训练阶段,提高了实用性
  3. 显著性能提升:在SemanticKITTI数据集上大幅超越现有方法
  4. 理论贡献:证明了认知不确定性相比预测熵在OOD检测中的优势

方法详解

任务定义

给定LiDAR点云的距离视图表示,目标是:

  1. 进行像素级语义分割
  2. 识别属于OOD的像素区域
  3. 量化预测的不确定性

模型架构

1. 生成-判别混合框架

基于GMMSeg架构,采用深度神经网络提取像素级特征表示z ∈ R^D,然后在特征空间中为每个语义类别c建模类条件高斯混合分布:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

其中π_k^(c)、μ_k^(c)、Σ_k^(c)分别表示第k个高斯分量的混合权重、均值和协方差。

2. 分层贝叶斯建模

关键创新在于对GMM参数采用分层贝叶斯建模:

  • 先验分布:对每个高斯分量的均值和方差设置高斯-逆伽马共轭先验
  • 后验更新:基于训练数据更新参数的后验分布
  • 参数采样:推理时从后验分布采样多组GMM参数

具体地:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. 认知不确定性估计

通过采样n组GMM参数,对每个像素计算类别预测的频率分布,然后计算熵:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

其中p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c表示类别c的经验概率。

技术创新点

  1. 不确定性分离:通过参数采样直接估计认知不确定性,避免了预测熵中两种不确定性的混淆
  2. 无需重训练:利用现有分割网络的特征空间,通过GMM建模实现不确定性估计
  3. 理论基础:基于互信息理论,认知不确定性定义为Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

实验设置

数据集

  • SemanticKITTI:包含19个语义类别的LiDAR点云数据集
  • OOD类别:使用数据集中的outlier类作为OOD样本(垃圾桶、标牌、动物等)
  • 输入格式:64×1024×5的距离视图图像(x,y,z坐标、强度、距离)
  • 特征维度:使用SalsaNext骨干网络提取32维特征

评价指标

  • AUROC:ROC曲线下面积,衡量整体分类性能
  • AUPRC:精确率-召回率曲线下面积,适合类别不平衡场景
  • FPR95:真正例率为95%时的假正例率,衡量安全性
  • mIoU:语义分割的平均交并比

对比方法

  • MSP:最大Softmax概率
  • ODIN:温度缩放和输入扰动方法
  • MC Dropout:蒙特卡洛Dropout
  • Deep Ensembles (DE):深度集成
  • GMMSeg:原始GMM分割方法(无不确定性建模)

实现细节

  • 骨干网络:SalsaNext
  • GMM组件数:每类2个高斯分量
  • 采样数:20个GMM参数样本
  • 阈值策略:无监督的百分位数阈值(top 5%)

实验结果

主要结果

方法AUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
本文方法91.0637.6740.1457.71

关键发现

  1. 显著性能提升:相比最佳baseline(GMMSeg),AUROC提升3.44%,AUPRC提升11.53%
  2. 安全性改善:FPR95相比Deep Ensembles从76.48%降至40.14%
  3. 分割性能:通过投票机制,语义分割精度也有轻微提升

定性分析

通过可视化对比发现:

  • 本文方法:准确识别真实OOD对象(标牌、垃圾桶等),对模糊ID区域保持适度不确定性
  • Deep Ensembles:在语义边界产生过多假阳性,错过真实OOD对象

不确定性分布分析

对比预测熵和认知不确定性的分布:

  • 预测熵在ID和OOD样本间存在大量重叠
  • 认知不确定性实现更清晰的分离,ID样本集中在低不确定性区域

相关工作

OOD检测方法分类

  1. 监督方法:依赖辅助数据集进行outlier exposure训练
  2. 无监督方法:基于不确定性估计,包括确定性方法(MSP、ODIN)和贝叶斯方法(MC Dropout、Deep Ensembles)

不确定性估计

  • 预测熵方法:混合认知和偶然不确定性
  • 互信息方法:理论上可分离两种不确定性,但在深度网络中难以准确计算
  • 本文贡献:通过GMM参数的贝叶斯建模实现认知不确定性的直接估计

结论与讨论

主要结论

  1. 认知不确定性相比预测熵在OOD检测中更有效
  2. 分层贝叶斯GMM建模提供了估计认知不确定性的实用方法
  3. 无监督框架避免了对辅助数据的依赖

局限性

  1. 假阳性问题:对语义模糊或错误分割的ID区域仍可能产生高不确定性
  2. 阈值选择:依赖百分位数阈值策略,可能不适用于所有场景
  3. 计算复杂度:需要多次参数采样,增加推理时间

未来方向

  1. 研究减少边界区域模糊性的策略
  2. 改进不确定性阈值选择方法
  3. 探索更高效的不确定性估计方法

深度评价

优点

  1. 理论贡献:清晰阐述了认知不确定性在OOD检测中的优势,提供了理论基础
  2. 方法创新:巧妙地通过GMM参数的贝叶斯建模实现认知不确定性估计
  3. 实验充分:在标准数据集上与多种baseline进行全面对比
  4. 实用性强:无需辅助数据或重训练,易于部署

不足

  1. 泛化性待验证:仅在SemanticKITTI数据集上验证,需要更多数据集验证
  2. 参数敏感性:GMM组件数等超参数的选择缺乏详细分析
  3. 计算开销:多次采样的计算成本分析不足
  4. 理论分析:缺乏对为什么GMM建模能更好分离不确定性的深入理论解释

影响力

  1. 学术价值:为LiDAR语义分割中的OOD检测提供了新的研究方向
  2. 实用价值:对自动驾驶等安全关键应用具有重要意义
  3. 可复现性:方法描述清晰,实现相对简单

适用场景

  1. 自动驾驶:检测道路上的异常物体
  2. 机器人导航:识别未知环境中的障碍物
  3. 安全监控:检测异常行为或物体
  4. 工业检测:识别生产线上的缺陷产品

参考文献

论文引用了相关领域的重要工作,包括:

  • GMMSeg 18:生成式语义分割的基础工作
  • Deep Ensembles 16:不确定性估计的经典方法
  • MC Dropout 7:贝叶斯深度学习的代表性工作
  • SemanticKITTI 1:LiDAR语义分割的标准数据集

该论文在LiDAR语义分割的OOD检测领域做出了重要贡献,通过巧妙的技术设计实现了认知不确定性的有效估计,为提高自动驾驶系统的安全性和可靠性提供了有价值的解决方案。