2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner

In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.

academic

Détection Hors-Distribution en Segmentation Sémantique LiDAR Utilisant l'Incertitude Épistémique à partir de GMM Hiérarchiques

Informations Fondamentales

ID de l'article: 2510.08631
Titre: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Auteurs: Hanieh Shojaei Miandashti, Claus Brenner (Université Leibniz de Hanovre)
Classification: cs.CV, cs.LG
Date de publication: 8 octobre 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2510.08631

Résumé

Cet article propose une méthode d'estimation de l'incertitude épistémique basée sur la modélisation paramétrique de modèles de mélange gaussien (GMM) hiérarchiques bayésiens pour la détection hors-distribution (OOD) en segmentation sémantique LiDAR. La méthode ne nécessite ni données auxiliaires ni étapes d'entraînement supplémentaires, et réalise des améliorations significatives par rapport aux méthodes existantes basées sur l'entropie prédictive sur l'ensemble de données SemanticKITTI : amélioration de 18% en AUROC, amélioration de 22% en AUPRC, et réduction du FPR95 de 76% à 40%.

Contexte et Motivation de la Recherche

Définition du Problème

Dans les applications critiques pour la sécurité telles que la conduite autonome, la segmentation sémantique LiDAR doit non seulement comprendre avec précision les scènes connues, mais aussi être capable d'identifier les objets hors-distribution (OOD) non observés pendant l'entraînement, afin d'éviter de mal classer les objets inconnus comme des classes connues.

Importance du Problème

Exigences de sécurité: Les systèmes de conduite autonome doivent identifier les objets anormaux sur la route (poubelles, panneaux, animaux, etc.)
Besoins de fiabilité: Les modèles profonds produisent souvent des prédictions excessivement confiantes mais erronées pour les entrées OOD
Considérations pratiques: L'environnement réel contient de nombreuses catégories d'objets non couverts par les ensembles de données d'entraînement

Limitations des Méthodes Existantes

Méthodes supervisées: Dépendent d'ensembles de données OOD auxiliaires, difficiles à obtenir dans le domaine LiDAR
Méthodes non supervisées: Reposent principalement sur l'entropie prédictive, mais confondent l'incertitude épistémique et l'incertitude aléatoire
Confusion d'incertitude: L'entropie prédictive mélange l'incertitude du modèle et le bruit des données, conduisant à mal classer les régions ambiguës intra-distribution comme OOD

Contributions Principales

Proposition d'une méthode de détection OOD basée sur l'incertitude épistémique: Séparation de l'incertitude épistémique et de l'incertitude aléatoire par modélisation hiérarchique bayésienne des paramètres GMM
Cadre non supervisé: Aucune donnée OOD auxiliaire ou étape d'entraînement supplémentaire requise, améliorant la praticité
Améliorations de performance significatives: Dépassement considérable des méthodes existantes sur l'ensemble de données SemanticKITTI
Contribution théorique: Démonstration des avantages de l'incertitude épistémique par rapport à l'entropie prédictive en détection OOD

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné une représentation en vue de distance d'un nuage de points LiDAR, l'objectif est:

Effectuer une segmentation sémantique au niveau des pixels
Identifier les régions de pixels appartenant à OOD
Quantifier l'incertitude des prédictions

Architecture du Modèle

1. Cadre Hybride Génératif-Discriminatif

Basé sur l'architecture GMMSeg, utilisant un réseau de neurones profond pour extraire des représentations de caractéristiques au niveau des pixels z ∈ ℝ^D, puis modélisant une distribution de mélange gaussien conditionnée par classe dans l'espace des caractéristiques pour chaque classe sémantique c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

où π_k^(c), μ_k^(c), Σ_k^(c) représentent respectivement le poids de mélange, la moyenne et la covariance de la k-ème composante gaussienne.

2. Modélisation Bayésienne Hiérarchique

L'innovation clé réside dans la modélisation bayésienne hiérarchique des paramètres GMM:

Distributions a priori: Priors conjugués gaussiens-gamma inverses définis pour la moyenne et la variance de chaque composante gaussienne
Mise à jour a posteriori: Mise à jour des distributions a posteriori des paramètres basée sur les données d'entraînement
Échantillonnage des paramètres: Échantillonnage de plusieurs ensembles de paramètres GMM à partir de la distribution a posteriori lors de l'inférence

Spécifiquement:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Estimation de l'Incertitude Épistémique

Par échantillonnage de n ensembles de paramètres GMM, calcul de la distribution de fréquence des prédictions de classe pour chaque pixel, puis calcul de l'entropie:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

où p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c représente la probabilité empirique de la classe c.

Points d'Innovation Technique

Séparation d'incertitude: Estimation directe de l'incertitude épistémique par échantillonnage paramétrique, évitant la confusion entre les deux types d'incertitude dans l'entropie prédictive
Pas de réentraînement requis: Utilisation de l'espace de caractéristiques du réseau de segmentation existant, réalisation de l'estimation d'incertitude par modélisation GMM
Fondement théorique: Basé sur la théorie de l'information mutuelle, l'incertitude épistémique est définie comme Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Configuration Expérimentale

Ensemble de Données

SemanticKITTI: Ensemble de données de nuages de points LiDAR avec 19 classes sémantiques
Classes OOD: Utilisation de la classe outlier de l'ensemble de données comme échantillons OOD (poubelles, panneaux, animaux, etc.)
Format d'entrée: Images en vue de distance 64×1024×5 (coordonnées x,y,z, intensité, distance)
Dimension des caractéristiques: Extraction de caractéristiques 32-dimensionnelles utilisant le réseau backbone SalsaNext

Métriques d'Évaluation

AUROC: Aire sous la courbe ROC, mesurant la performance de classification globale
AUPRC: Aire sous la courbe précision-rappel, appropriée pour les scénarios de classes déséquilibrées
FPR95: Taux de faux positifs lorsque le taux de vrais positifs est de 95%, mesurant la sécurité
mIoU: Intersection moyenne sur union pour la segmentation sémantique

Méthodes de Comparaison

MSP: Probabilité Softmax maximale
ODIN: Méthode de mise à l'échelle de température et perturbation d'entrée
MC Dropout: Dropout Monte-Carlo
Deep Ensembles (DE): Ensembles profonds
GMMSeg: Méthode GMM de segmentation originale (sans modélisation d'incertitude)

Détails d'Implémentation

Réseau backbone: SalsaNext
Nombre de composantes GMM: 2 composantes gaussiennes par classe
Nombre d'échantillons: 20 échantillons de paramètres GMM
Stratégie de seuil: Seuil de percentile non supervisé (top 5%)

Résultats Expérimentaux

Résultats Principaux

Méthode	AUROC (%)	AUPRC (%)	FPR95 (%)	mIoU (%)
MSP	70.41	10.90	76.00	56.37
ODIN	73.74	12.45	75.54	56.37
MC Dropout	73.64	13.65	75.92	57.15
Deep Ensembles	73.03	16.14	76.48	57.17
GMMSeg	87.62	26.14	48.84	57.60
Méthode proposée	91.06	37.67	40.14	57.71

Découvertes Clés

Améliorations de performance significatives: Par rapport au meilleur baseline (GMMSeg), amélioration de 3.44% en AUROC et de 11.53% en AUPRC
Amélioration de la sécurité: FPR95 réduit de 76.48% (Deep Ensembles) à 40.14%
Performance de segmentation: Légère amélioration de la précision de segmentation sémantique grâce au mécanisme de vote

Analyse Qualitative

Par comparaison visuelle:

Méthode proposée: Identification précise des vrais objets OOD (panneaux, poubelles, etc.), maintien d'une incertitude modérée pour les régions ID ambiguës
Deep Ensembles: Production de nombreux faux positifs aux frontières sémantiques, manquement des vrais objets OOD

Analyse de la Distribution d'Incertitude

Comparaison des distributions d'entropie prédictive et d'incertitude épistémique:

L'entropie prédictive présente un chevauchement important entre les échantillons ID et OOD
L'incertitude épistémique réalise une séparation plus claire, avec les échantillons ID concentrés dans les régions de faible incertitude

Travaux Connexes

Classification des Méthodes de Détection OOD

Méthodes supervisées: Dépendant d'ensembles de données auxiliaires pour l'entraînement avec exposition aux valeurs aberrantes
Méthodes non supervisées: Basées sur l'estimation d'incertitude, incluant les méthodes déterministes (MSP, ODIN) et les méthodes bayésiennes (MC Dropout, Deep Ensembles)

Estimation d'Incertitude

Méthodes d'entropie prédictive: Mélange d'incertitude épistémique et aléatoire
Méthodes d'information mutuelle: Théoriquement capables de séparer les deux types d'incertitude, mais difficiles à calculer précisément dans les réseaux profonds
Contribution de cet article: Estimation directe de l'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM

Conclusion et Discussion

Conclusions Principales

L'incertitude épistémique est plus efficace que l'entropie prédictive pour la détection OOD
La modélisation GMM bayésienne hiérarchique fournit une méthode pratique pour estimer l'incertitude épistémique
Le cadre non supervisé évite la dépendance aux données auxiliaires

Limitations

Problème de faux positifs: Peut toujours produire une incertitude élevée pour les régions ID ambiguës ou mal segmentées
Sélection de seuil: Dépend de la stratégie de seuil de percentile, peut ne pas s'appliquer à tous les scénarios
Complexité computationnelle: Nécessite plusieurs échantillonnages de paramètres, augmentant le temps d'inférence

Directions Futures

Recherche de stratégies pour réduire l'ambiguïté dans les régions de frontière
Amélioration des méthodes de sélection de seuil d'incertitude
Exploration de méthodes d'estimation d'incertitude plus efficaces

Évaluation Approfondie

Avantages

Contribution théorique: Clarification explicite des avantages de l'incertitude épistémique en détection OOD, fournissant une base théorique
Innovation méthodologique: Réalisation ingénieuse de l'estimation d'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM
Expérimentation complète: Comparaison exhaustive avec plusieurs baselines sur un ensemble de données standard
Praticité forte: Aucune donnée auxiliaire ou réentraînement requis, facile à déployer

Insuffisances

Généralisation à vérifier: Validation uniquement sur l'ensemble de données SemanticKITTI, nécessitant une validation sur plus d'ensembles de données
Sensibilité paramétrique: Manque d'analyse détaillée sur le choix des hyperparamètres tels que le nombre de composantes GMM
Surcharge computationnelle: Analyse insuffisante du coût computationnel des échantillonnages multiples
Analyse théorique: Manque d'explication théorique approfondie sur pourquoi la modélisation GMM peut mieux séparer les incertitudes

Valeur d'Impact

Valeur académique: Fournit une nouvelle direction de recherche pour la détection OOD en segmentation sémantique LiDAR
Valeur pratique: Importance significative pour les applications critiques pour la sécurité comme la conduite autonome
Reproductibilité: Description de méthode claire, implémentation relativement simple

Scénarios d'Application

Conduite autonome: Détection d'objets anormaux sur la route
Navigation robotique: Identification d'obstacles dans les environnements inconnus
Surveillance de sécurité: Détection de comportements ou d'objets anormaux
Inspection industrielle: Identification de produits défectueux sur les chaînes de production

Références Bibliographiques

L'article cite les travaux importants du domaine connexe, incluant:

GMMSeg 18: Travail fondamental en segmentation sémantique générative
Deep Ensembles 16: Méthode classique pour l'estimation d'incertitude
MC Dropout 7: Travail représentatif de l'apprentissage profond bayésien
SemanticKITTI 1: Ensemble de données standard pour la segmentation sémantique LiDAR

Cet article apporte une contribution importante au domaine de la détection OOD en segmentation sémantique LiDAR, réalisant une estimation efficace de l'incertitude épistémique par une conception technique ingénieuse, fournissant une solution précieuse pour améliorer la sécurité et la fiabilité des systèmes de conduite autonome.