2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

Détection Hors-Distribution en Segmentation Sémantique LiDAR Utilisant l'Incertitude Épistémique à partir de GMM Hiérarchiques

Informations Fondamentales

  • ID de l'article: 2510.08631
  • Titre: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • Auteurs: Hanieh Shojaei Miandashti, Claus Brenner (Université Leibniz de Hanovre)
  • Classification: cs.CV, cs.LG
  • Date de publication: 8 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.08631

Résumé

Cet article propose une méthode d'estimation de l'incertitude épistémique basée sur la modélisation paramétrique de modèles de mélange gaussien (GMM) hiérarchiques bayésiens pour la détection hors-distribution (OOD) en segmentation sémantique LiDAR. La méthode ne nécessite ni données auxiliaires ni étapes d'entraînement supplémentaires, et réalise des améliorations significatives par rapport aux méthodes existantes basées sur l'entropie prédictive sur l'ensemble de données SemanticKITTI : amélioration de 18% en AUROC, amélioration de 22% en AUPRC, et réduction du FPR95 de 76% à 40%.

Contexte et Motivation de la Recherche

Définition du Problème

Dans les applications critiques pour la sécurité telles que la conduite autonome, la segmentation sémantique LiDAR doit non seulement comprendre avec précision les scènes connues, mais aussi être capable d'identifier les objets hors-distribution (OOD) non observés pendant l'entraînement, afin d'éviter de mal classer les objets inconnus comme des classes connues.

Importance du Problème

  1. Exigences de sécurité: Les systèmes de conduite autonome doivent identifier les objets anormaux sur la route (poubelles, panneaux, animaux, etc.)
  2. Besoins de fiabilité: Les modèles profonds produisent souvent des prédictions excessivement confiantes mais erronées pour les entrées OOD
  3. Considérations pratiques: L'environnement réel contient de nombreuses catégories d'objets non couverts par les ensembles de données d'entraînement

Limitations des Méthodes Existantes

  1. Méthodes supervisées: Dépendent d'ensembles de données OOD auxiliaires, difficiles à obtenir dans le domaine LiDAR
  2. Méthodes non supervisées: Reposent principalement sur l'entropie prédictive, mais confondent l'incertitude épistémique et l'incertitude aléatoire
  3. Confusion d'incertitude: L'entropie prédictive mélange l'incertitude du modèle et le bruit des données, conduisant à mal classer les régions ambiguës intra-distribution comme OOD

Contributions Principales

  1. Proposition d'une méthode de détection OOD basée sur l'incertitude épistémique: Séparation de l'incertitude épistémique et de l'incertitude aléatoire par modélisation hiérarchique bayésienne des paramètres GMM
  2. Cadre non supervisé: Aucune donnée OOD auxiliaire ou étape d'entraînement supplémentaire requise, améliorant la praticité
  3. Améliorations de performance significatives: Dépassement considérable des méthodes existantes sur l'ensemble de données SemanticKITTI
  4. Contribution théorique: Démonstration des avantages de l'incertitude épistémique par rapport à l'entropie prédictive en détection OOD

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné une représentation en vue de distance d'un nuage de points LiDAR, l'objectif est:

  1. Effectuer une segmentation sémantique au niveau des pixels
  2. Identifier les régions de pixels appartenant à OOD
  3. Quantifier l'incertitude des prédictions

Architecture du Modèle

1. Cadre Hybride Génératif-Discriminatif

Basé sur l'architecture GMMSeg, utilisant un réseau de neurones profond pour extraire des représentations de caractéristiques au niveau des pixels z ∈ ℝ^D, puis modélisant une distribution de mélange gaussien conditionnée par classe dans l'espace des caractéristiques pour chaque classe sémantique c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

où π_k^(c), μ_k^(c), Σ_k^(c) représentent respectivement le poids de mélange, la moyenne et la covariance de la k-ème composante gaussienne.

2. Modélisation Bayésienne Hiérarchique

L'innovation clé réside dans la modélisation bayésienne hiérarchique des paramètres GMM:

  • Distributions a priori: Priors conjugués gaussiens-gamma inverses définis pour la moyenne et la variance de chaque composante gaussienne
  • Mise à jour a posteriori: Mise à jour des distributions a posteriori des paramètres basée sur les données d'entraînement
  • Échantillonnage des paramètres: Échantillonnage de plusieurs ensembles de paramètres GMM à partir de la distribution a posteriori lors de l'inférence

Spécifiquement:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Estimation de l'Incertitude Épistémique

Par échantillonnage de n ensembles de paramètres GMM, calcul de la distribution de fréquence des prédictions de classe pour chaque pixel, puis calcul de l'entropie:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

où p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c représente la probabilité empirique de la classe c.

Points d'Innovation Technique

  1. Séparation d'incertitude: Estimation directe de l'incertitude épistémique par échantillonnage paramétrique, évitant la confusion entre les deux types d'incertitude dans l'entropie prédictive
  2. Pas de réentraînement requis: Utilisation de l'espace de caractéristiques du réseau de segmentation existant, réalisation de l'estimation d'incertitude par modélisation GMM
  3. Fondement théorique: Basé sur la théorie de l'information mutuelle, l'incertitude épistémique est définie comme Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Configuration Expérimentale

Ensemble de Données

  • SemanticKITTI: Ensemble de données de nuages de points LiDAR avec 19 classes sémantiques
  • Classes OOD: Utilisation de la classe outlier de l'ensemble de données comme échantillons OOD (poubelles, panneaux, animaux, etc.)
  • Format d'entrée: Images en vue de distance 64×1024×5 (coordonnées x,y,z, intensité, distance)
  • Dimension des caractéristiques: Extraction de caractéristiques 32-dimensionnelles utilisant le réseau backbone SalsaNext

Métriques d'Évaluation

  • AUROC: Aire sous la courbe ROC, mesurant la performance de classification globale
  • AUPRC: Aire sous la courbe précision-rappel, appropriée pour les scénarios de classes déséquilibrées
  • FPR95: Taux de faux positifs lorsque le taux de vrais positifs est de 95%, mesurant la sécurité
  • mIoU: Intersection moyenne sur union pour la segmentation sémantique

Méthodes de Comparaison

  • MSP: Probabilité Softmax maximale
  • ODIN: Méthode de mise à l'échelle de température et perturbation d'entrée
  • MC Dropout: Dropout Monte-Carlo
  • Deep Ensembles (DE): Ensembles profonds
  • GMMSeg: Méthode GMM de segmentation originale (sans modélisation d'incertitude)

Détails d'Implémentation

  • Réseau backbone: SalsaNext
  • Nombre de composantes GMM: 2 composantes gaussiennes par classe
  • Nombre d'échantillons: 20 échantillons de paramètres GMM
  • Stratégie de seuil: Seuil de percentile non supervisé (top 5%)

Résultats Expérimentaux

Résultats Principaux

MéthodeAUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
Méthode proposée91.0637.6740.1457.71

Découvertes Clés

  1. Améliorations de performance significatives: Par rapport au meilleur baseline (GMMSeg), amélioration de 3.44% en AUROC et de 11.53% en AUPRC
  2. Amélioration de la sécurité: FPR95 réduit de 76.48% (Deep Ensembles) à 40.14%
  3. Performance de segmentation: Légère amélioration de la précision de segmentation sémantique grâce au mécanisme de vote

Analyse Qualitative

Par comparaison visuelle:

  • Méthode proposée: Identification précise des vrais objets OOD (panneaux, poubelles, etc.), maintien d'une incertitude modérée pour les régions ID ambiguës
  • Deep Ensembles: Production de nombreux faux positifs aux frontières sémantiques, manquement des vrais objets OOD

Analyse de la Distribution d'Incertitude

Comparaison des distributions d'entropie prédictive et d'incertitude épistémique:

  • L'entropie prédictive présente un chevauchement important entre les échantillons ID et OOD
  • L'incertitude épistémique réalise une séparation plus claire, avec les échantillons ID concentrés dans les régions de faible incertitude

Travaux Connexes

Classification des Méthodes de Détection OOD

  1. Méthodes supervisées: Dépendant d'ensembles de données auxiliaires pour l'entraînement avec exposition aux valeurs aberrantes
  2. Méthodes non supervisées: Basées sur l'estimation d'incertitude, incluant les méthodes déterministes (MSP, ODIN) et les méthodes bayésiennes (MC Dropout, Deep Ensembles)

Estimation d'Incertitude

  • Méthodes d'entropie prédictive: Mélange d'incertitude épistémique et aléatoire
  • Méthodes d'information mutuelle: Théoriquement capables de séparer les deux types d'incertitude, mais difficiles à calculer précisément dans les réseaux profonds
  • Contribution de cet article: Estimation directe de l'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM

Conclusion et Discussion

Conclusions Principales

  1. L'incertitude épistémique est plus efficace que l'entropie prédictive pour la détection OOD
  2. La modélisation GMM bayésienne hiérarchique fournit une méthode pratique pour estimer l'incertitude épistémique
  3. Le cadre non supervisé évite la dépendance aux données auxiliaires

Limitations

  1. Problème de faux positifs: Peut toujours produire une incertitude élevée pour les régions ID ambiguës ou mal segmentées
  2. Sélection de seuil: Dépend de la stratégie de seuil de percentile, peut ne pas s'appliquer à tous les scénarios
  3. Complexité computationnelle: Nécessite plusieurs échantillonnages de paramètres, augmentant le temps d'inférence

Directions Futures

  1. Recherche de stratégies pour réduire l'ambiguïté dans les régions de frontière
  2. Amélioration des méthodes de sélection de seuil d'incertitude
  3. Exploration de méthodes d'estimation d'incertitude plus efficaces

Évaluation Approfondie

Avantages

  1. Contribution théorique: Clarification explicite des avantages de l'incertitude épistémique en détection OOD, fournissant une base théorique
  2. Innovation méthodologique: Réalisation ingénieuse de l'estimation d'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM
  3. Expérimentation complète: Comparaison exhaustive avec plusieurs baselines sur un ensemble de données standard
  4. Praticité forte: Aucune donnée auxiliaire ou réentraînement requis, facile à déployer

Insuffisances

  1. Généralisation à vérifier: Validation uniquement sur l'ensemble de données SemanticKITTI, nécessitant une validation sur plus d'ensembles de données
  2. Sensibilité paramétrique: Manque d'analyse détaillée sur le choix des hyperparamètres tels que le nombre de composantes GMM
  3. Surcharge computationnelle: Analyse insuffisante du coût computationnel des échantillonnages multiples
  4. Analyse théorique: Manque d'explication théorique approfondie sur pourquoi la modélisation GMM peut mieux séparer les incertitudes

Valeur d'Impact

  1. Valeur académique: Fournit une nouvelle direction de recherche pour la détection OOD en segmentation sémantique LiDAR
  2. Valeur pratique: Importance significative pour les applications critiques pour la sécurité comme la conduite autonome
  3. Reproductibilité: Description de méthode claire, implémentation relativement simple

Scénarios d'Application

  1. Conduite autonome: Détection d'objets anormaux sur la route
  2. Navigation robotique: Identification d'obstacles dans les environnements inconnus
  3. Surveillance de sécurité: Détection de comportements ou d'objets anormaux
  4. Inspection industrielle: Identification de produits défectueux sur les chaînes de production

Références Bibliographiques

L'article cite les travaux importants du domaine connexe, incluant:

  • GMMSeg 18: Travail fondamental en segmentation sémantique générative
  • Deep Ensembles 16: Méthode classique pour l'estimation d'incertitude
  • MC Dropout 7: Travail représentatif de l'apprentissage profond bayésien
  • SemanticKITTI 1: Ensemble de données standard pour la segmentation sémantique LiDAR

Cet article apporte une contribution importante au domaine de la détection OOD en segmentation sémantique LiDAR, réalisant une estimation efficace de l'incertitude épistémique par une conception technique ingénieuse, fournissant une solution précieuse pour améliorer la sécurité et la fiabilité des systèmes de conduite autonome.