2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

LiDAR 의미론적 분할에서 계층적 GMM의 인식론적 불확실성을 이용한 분포 외 탐지

기본 정보

  • 논문 ID: 2510.08631
  • 제목: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • 저자: Hanieh Shojaei Miandashti, Claus Brenner (라이프니츠 하노버 대학교)
  • 분류: cs.CV, cs.LG
  • 발표 시간: 2025년 10월 8일 (arXiv 사전인쇄본)
  • 논문 링크: https://arxiv.org/abs/2510.08631

초록

본 논문은 계층적 베이지안 가우시안 혼합 모델(GMM) 매개변수 모델링을 기반으로 한 인식론적 불확실성 추정 방법을 제안하며, 이를 LiDAR 의미론적 분할에서의 분포 외(OOD) 탐지에 적용합니다. 이 방법은 보조 데이터나 추가 훈련 단계 없이 SemanticKITTI 데이터셋에서 기존의 예측 엔트로피 기반 방법 대비 현저한 성능 향상을 달성합니다: AUROC 18% 향상, AUPRC 22% 향상, FPR95를 76%에서 40%로 감소.

연구 배경 및 동기

문제 정의

자동운전 등 안전이 중요한 응용 분야에서 LiDAR 의미론적 분할은 알려진 장면을 정확히 이해할 뿐만 아니라 훈련 중에 보지 못한 분포 외(OOD) 객체를 식별하여 미지의 물체를 알려진 클래스로 잘못 분류하는 것을 피해야 합니다.

문제의 중요성

  1. 안전성 요구사항: 자동운전 시스템은 도로 위의 이상 물체(예: 쓰레기통, 표지판, 동물 등)를 식별해야 함
  2. 신뢰성 요구사항: 심층 모델은 종종 OOD 입력에 대해 과도하게 자신감 있지만 잘못된 예측을 생성함
  3. 실용성 고려사항: 실제 환경에는 훈련 데이터셋에서 다루지 않은 많은 물체 클래스가 존재

기존 방법의 한계

  1. 지도 학습 방법: 보조 OOD 데이터셋에 의존하며, LiDAR 분야에서 획득이 어려움
  2. 비지도 학습 방법: 주로 예측 엔트로피에 의존하지만 인식론적 불확실성(epistemic)과 우연적 불확실성(aleatoric)을 혼동
  3. 불확실성 혼동: 예측 엔트로피는 모델 불확실성과 데이터 노이즈를 혼합하여 모호한 분포 내 영역을 OOD로 잘못 분류

핵심 기여

  1. 인식론적 불확실성 기반 OOD 탐지 방법 제안: 계층적 베이지안 모델링을 통해 GMM 매개변수를 모델링하여 인식론적 불확실성과 우연적 불확실성을 분리
  2. 비지도 프레임워크: 보조 OOD 데이터나 추가 훈련 단계 없이 실용성 향상
  3. 현저한 성능 향상: SemanticKITTI 데이터셋에서 기존 방법을 대폭 초과
  4. 이론적 기여: OOD 탐지에서 인식론적 불확실성이 예측 엔트로피보다 우수함을 증명

방법 상세 설명

작업 정의

LiDAR 점군의 거리 뷰 표현이 주어졌을 때, 목표는:

  1. 픽셀 수준의 의미론적 분할 수행
  2. OOD에 속하는 픽셀 영역 식별
  3. 예측의 불확실성 정량화

모델 아키텍처

1. 생성-판별 혼합 프레임워크

GMMSeg 아키텍처를 기반으로 하며, 심층 신경망을 사용하여 픽셀 수준의 특징 표현 z ∈ R^D을 추출한 후, 특징 공간에서 각 의미론적 클래스 c에 대한 클래스 조건부 가우시안 혼합 분포를 모델링합니다:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

여기서 π_k^(c), μ_k^(c), Σ_k^(c)는 각각 k번째 가우시안 성분의 혼합 가중치, 평균 및 공분산을 나타냅니다.

2. 계층적 베이지안 모델링

주요 혁신은 GMM 매개변수에 대한 계층적 베이지안 모델링입니다:

  • 사전 분포: 각 가우시안 성분의 평균과 분산에 대해 가우시안-역감마 켤레 사전 설정
  • 사후 업데이트: 훈련 데이터를 기반으로 매개변수의 사후 분포 업데이트
  • 매개변수 샘플링: 추론 시 사후 분포에서 여러 세트의 GMM 매개변수 샘플링

구체적으로:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. 인식론적 불확실성 추정

n개의 GMM 매개변수를 샘플링하여 각 픽셀에 대한 클래스 예측의 빈도 분포를 계산한 후 엔트로피를 계산합니다:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

여기서 p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c는 클래스 c의 경험적 확률을 나타냅니다.

기술적 혁신점

  1. 불확실성 분리: 매개변수 샘플링을 통해 인식론적 불확실성을 직접 추정하여 예측 엔트로피의 두 가지 불확실성 혼동 회피
  2. 재훈련 불필요: 기존 분할 네트워크의 특징 공간을 활용하여 GMM 모델링을 통한 불확실성 추정 구현
  3. 이론적 기초: 상호 정보 이론을 기반으로 하며, 인식론적 불확실성은 Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))로 정의됨

실험 설정

데이터셋

  • SemanticKITTI: 19개의 의미론적 클래스를 포함하는 LiDAR 점군 데이터셋
  • OOD 클래스: 데이터셋의 outlier 클래스를 OOD 샘플로 사용(쓰레기통, 표지판, 동물 등)
  • 입력 형식: 64×1024×5 거리 뷰 이미지(x, y, z 좌표, 강도, 거리)
  • 특징 차원: SalsaNext 백본 네트워크를 사용하여 32차원 특징 추출

평가 지표

  • AUROC: ROC 곡선 아래 면적, 전체 분류 성능 측정
  • AUPRC: 정밀도-재현율 곡선 아래 면적, 클래스 불균형 시나리오에 적합
  • FPR95: 참양성율이 95%일 때의 거짓양성율, 안전성 측정
  • mIoU: 의미론적 분할의 평균 교집합 대합

비교 방법

  • MSP: 최대 Softmax 확률
  • ODIN: 온도 스케일링 및 입력 섭동 방법
  • MC Dropout: 몬테카를로 드롭아웃
  • Deep Ensembles (DE): 심층 앙상블
  • GMMSeg: 원본 GMM 분할 방법(불확실성 모델링 없음)

구현 세부사항

  • 백본 네트워크: SalsaNext
  • GMM 성분 수: 클래스당 2개의 가우시안 성분
  • 샘플링 수: 20개의 GMM 매개변수 샘플
  • 임계값 전략: 비지도 백분위수 임계값(상위 5%)

실험 결과

주요 결과

방법AUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
본 논문 방법91.0637.6740.1457.71

주요 발견

  1. 현저한 성능 향상: 최고 성능의 기준선(GMMSeg) 대비 AUROC 3.44% 향상, AUPRC 11.53% 향상
  2. 안전성 개선: FPR95가 Deep Ensembles의 76.48%에서 40.14%로 감소
  3. 분할 성능: 투표 메커니즘을 통해 의미론적 분할 정확도도 약간 향상

정성적 분석

시각화 비교를 통해 발견:

  • 본 논문 방법: 실제 OOD 객체(표지판, 쓰레기통 등)를 정확히 식별하고, 모호한 ID 영역에 대해 적절한 불확실성 유지
  • Deep Ensembles: 의미론적 경계에서 많은 거짓양성 생성, 실제 OOD 객체 놓침

불확실성 분포 분석

예측 엔트로피와 인식론적 불확실성의 분포 비교:

  • 예측 엔트로피는 ID와 OOD 샘플 간에 상당한 중복 존재
  • 인식론적 불확실성은 더 명확한 분리 달성, ID 샘플은 낮은 불확실성 영역에 집중

관련 연구

OOD 탐지 방법 분류

  1. 지도 학습 방법: 보조 데이터셋에 의존하여 outlier exposure 훈련 수행
  2. 비지도 학습 방법: 불확실성 추정 기반, 결정론적 방법(MSP, ODIN)과 베이지안 방법(MC Dropout, Deep Ensembles) 포함

불확실성 추정

  • 예측 엔트로피 방법: 인식론적 및 우연적 불확실성 혼합
  • 상호 정보 방법: 이론적으로 두 가지 불확실성을 분리할 수 있지만 심층 네트워크에서 정확한 계산이 어려움
  • 본 논문의 기여: GMM 매개변수의 베이지안 모델링을 통해 인식론적 불확실성의 직접 추정 구현

결론 및 토론

주요 결론

  1. 인식론적 불확실성이 OOD 탐지에서 예측 엔트로피보다 더 효과적
  2. 계층적 베이지안 GMM 모델링은 인식론적 불확실성 추정을 위한 실용적인 방법 제공
  3. 비지도 프레임워크는 보조 데이터에 대한 의존성 회피

한계

  1. 거짓양성 문제: 의미론적으로 모호하거나 잘못 분할된 ID 영역에서 여전히 높은 불확실성 생성 가능
  2. 임계값 선택: 백분위수 임계값 전략에 의존하며, 모든 시나리오에 적용되지 않을 수 있음
  3. 계산 복잡도: 여러 번의 매개변수 샘플링 필요로 추론 시간 증가

향후 방향

  1. 경계 영역의 모호성을 줄이기 위한 전략 연구
  2. 불확실성 임계값 선택 방법 개선
  3. 더 효율적인 불확실성 추정 방법 탐색

심층 평가

장점

  1. 이론적 기여: 인식론적 불확실성이 OOD 탐지에서 갖는 우수성을 명확히 설명하고 이론적 기초 제공
  2. 방법 혁신: GMM 매개변수의 베이지안 모델링을 통해 인식론적 불확실성 추정을 영리하게 구현
  3. 충분한 실험: 표준 데이터셋에서 여러 기준선과의 포괄적 비교
  4. 실용성 강함: 보조 데이터나 재훈련 불필요로 배포 용이

부족한 점

  1. 일반화 검증 필요: SemanticKITTI 데이터셋에서만 검증되었으며, 더 많은 데이터셋에서의 검증 필요
  2. 매개변수 민감도: GMM 성분 수 등 하이퍼파라미터 선택에 대한 상세 분석 부족
  3. 계산 오버헤드: 여러 번의 샘플링의 계산 비용 분석 부족
  4. 이론적 분석: GMM 모델링이 불확실성을 더 잘 분리할 수 있는 이유에 대한 심층 이론적 설명 부족

영향력

  1. 학술적 가치: LiDAR 의미론적 분할의 OOD 탐지 연구에 새로운 방향 제시
  2. 실용적 가치: 자동운전 등 안전이 중요한 응용 분야에 중요한 의미
  3. 재현성: 방법 설명이 명확하고 구현이 상대적으로 간단

적용 시나리오

  1. 자동운전: 도로 위의 이상 물체 탐지
  2. 로봇 네비게이션: 미지의 환경에서 장애물 식별
  3. 보안 감시: 이상 행동 또는 물체 탐지
  4. 산업 검사: 생산 라인의 결함 제품 식별

참고문헌

논문은 관련 분야의 중요한 연구를 인용하고 있습니다:

  • GMMSeg 18: 생성적 의미론적 분할의 기초 연구
  • Deep Ensembles 16: 불확실성 추정의 고전적 방법
  • MC Dropout 7: 베이지안 심층 학습의 대표적 연구
  • SemanticKITTI 1: LiDAR 의미론적 분할의 표준 데이터셋

본 논문은 LiDAR 의미론적 분할의 OOD 탐지 분야에서 중요한 기여를 하고 있으며, 영리한 기술 설계를 통해 인식론적 불확실성의 효과적인 추정을 구현하여 자동운전 시스템의 안전성과 신뢰성 향상을 위한 가치 있는 해결책을 제공합니다.