2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner

In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.

academic

LiDAR 의미론적 분할에서 계층적 GMM의 인식론적 불확실성을 이용한 분포 외 탐지

기본 정보

논문 ID: 2510.08631
제목: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
저자: Hanieh Shojaei Miandashti, Claus Brenner (라이프니츠 하노버 대학교)
분류: cs.CV, cs.LG
발표 시간: 2025년 10월 8일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.08631

초록

본 논문은 계층적 베이지안 가우시안 혼합 모델(GMM) 매개변수 모델링을 기반으로 한 인식론적 불확실성 추정 방법을 제안하며, 이를 LiDAR 의미론적 분할에서의 분포 외(OOD) 탐지에 적용합니다. 이 방법은 보조 데이터나 추가 훈련 단계 없이 SemanticKITTI 데이터셋에서 기존의 예측 엔트로피 기반 방법 대비 현저한 성능 향상을 달성합니다: AUROC 18% 향상, AUPRC 22% 향상, FPR95를 76%에서 40%로 감소.

연구 배경 및 동기

문제 정의

자동운전 등 안전이 중요한 응용 분야에서 LiDAR 의미론적 분할은 알려진 장면을 정확히 이해할 뿐만 아니라 훈련 중에 보지 못한 분포 외(OOD) 객체를 식별하여 미지의 물체를 알려진 클래스로 잘못 분류하는 것을 피해야 합니다.

문제의 중요성

안전성 요구사항: 자동운전 시스템은 도로 위의 이상 물체(예: 쓰레기통, 표지판, 동물 등)를 식별해야 함
신뢰성 요구사항: 심층 모델은 종종 OOD 입력에 대해 과도하게 자신감 있지만 잘못된 예측을 생성함
실용성 고려사항: 실제 환경에는 훈련 데이터셋에서 다루지 않은 많은 물체 클래스가 존재

기존 방법의 한계

지도 학습 방법: 보조 OOD 데이터셋에 의존하며, LiDAR 분야에서 획득이 어려움
비지도 학습 방법: 주로 예측 엔트로피에 의존하지만 인식론적 불확실성(epistemic)과 우연적 불확실성(aleatoric)을 혼동
불확실성 혼동: 예측 엔트로피는 모델 불확실성과 데이터 노이즈를 혼합하여 모호한 분포 내 영역을 OOD로 잘못 분류

핵심 기여

인식론적 불확실성 기반 OOD 탐지 방법 제안: 계층적 베이지안 모델링을 통해 GMM 매개변수를 모델링하여 인식론적 불확실성과 우연적 불확실성을 분리
비지도 프레임워크: 보조 OOD 데이터나 추가 훈련 단계 없이 실용성 향상
현저한 성능 향상: SemanticKITTI 데이터셋에서 기존 방법을 대폭 초과
이론적 기여: OOD 탐지에서 인식론적 불확실성이 예측 엔트로피보다 우수함을 증명

방법 상세 설명

작업 정의

LiDAR 점군의 거리 뷰 표현이 주어졌을 때, 목표는:

픽셀 수준의 의미론적 분할 수행
OOD에 속하는 픽셀 영역 식별
예측의 불확실성 정량화

모델 아키텍처

1. 생성-판별 혼합 프레임워크

GMMSeg 아키텍처를 기반으로 하며, 심층 신경망을 사용하여 픽셀 수준의 특징 표현 z ∈ R^D을 추출한 후, 특징 공간에서 각 의미론적 클래스 c에 대한 클래스 조건부 가우시안 혼합 분포를 모델링합니다:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

여기서 π_k^(c), μ_k^(c), Σ_k^(c)는 각각 k번째 가우시안 성분의 혼합 가중치, 평균 및 공분산을 나타냅니다.

2. 계층적 베이지안 모델링

주요 혁신은 GMM 매개변수에 대한 계층적 베이지안 모델링입니다:

사전 분포: 각 가우시안 성분의 평균과 분산에 대해 가우시안-역감마 켤레 사전 설정
사후 업데이트: 훈련 데이터를 기반으로 매개변수의 사후 분포 업데이트
매개변수 샘플링: 추론 시 사후 분포에서 여러 세트의 GMM 매개변수 샘플링

구체적으로:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. 인식론적 불확실성 추정

n개의 GMM 매개변수를 샘플링하여 각 픽셀에 대한 클래스 예측의 빈도 분포를 계산한 후 엔트로피를 계산합니다:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

여기서 p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c는 클래스 c의 경험적 확률을 나타냅니다.

기술적 혁신점

불확실성 분리: 매개변수 샘플링을 통해 인식론적 불확실성을 직접 추정하여 예측 엔트로피의 두 가지 불확실성 혼동 회피
재훈련 불필요: 기존 분할 네트워크의 특징 공간을 활용하여 GMM 모델링을 통한 불확실성 추정 구현
이론적 기초: 상호 정보 이론을 기반으로 하며, 인식론적 불확실성은 Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))로 정의됨

실험 설정

데이터셋

SemanticKITTI: 19개의 의미론적 클래스를 포함하는 LiDAR 점군 데이터셋
OOD 클래스: 데이터셋의 outlier 클래스를 OOD 샘플로 사용(쓰레기통, 표지판, 동물 등)
입력 형식: 64×1024×5 거리 뷰 이미지(x, y, z 좌표, 강도, 거리)
특징 차원: SalsaNext 백본 네트워크를 사용하여 32차원 특징 추출

평가 지표

AUROC: ROC 곡선 아래 면적, 전체 분류 성능 측정
AUPRC: 정밀도-재현율 곡선 아래 면적, 클래스 불균형 시나리오에 적합
FPR95: 참양성율이 95%일 때의 거짓양성율, 안전성 측정
mIoU: 의미론적 분할의 평균 교집합 대합

비교 방법

MSP: 최대 Softmax 확률
ODIN: 온도 스케일링 및 입력 섭동 방법
MC Dropout: 몬테카를로 드롭아웃
Deep Ensembles (DE): 심층 앙상블
GMMSeg: 원본 GMM 분할 방법(불확실성 모델링 없음)

구현 세부사항

백본 네트워크: SalsaNext
GMM 성분 수: 클래스당 2개의 가우시안 성분
샘플링 수: 20개의 GMM 매개변수 샘플
임계값 전략: 비지도 백분위수 임계값(상위 5%)

실험 결과

주요 결과

방법	AUROC (%)	AUPRC (%)	FPR95 (%)	mIoU (%)
MSP	70.41	10.90	76.00	56.37
ODIN	73.74	12.45	75.54	56.37
MC Dropout	73.64	13.65	75.92	57.15
Deep Ensembles	73.03	16.14	76.48	57.17
GMMSeg	87.62	26.14	48.84	57.60
본 논문 방법	91.06	37.67	40.14	57.71