Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic
Détection Hors-Distribution en Segmentation Sémantique LiDAR Utilisant l'Incertitude Épistémique à partir de GMM Hiérarchiques
Cet article propose une méthode d'estimation de l'incertitude épistémique basée sur la modélisation paramétrique de modèles de mélange gaussien (GMM) hiérarchiques bayésiens pour la détection hors-distribution (OOD) en segmentation sémantique LiDAR. La méthode ne nécessite ni données auxiliaires ni étapes d'entraînement supplémentaires, et réalise des améliorations significatives par rapport aux méthodes existantes basées sur l'entropie prédictive sur l'ensemble de données SemanticKITTI : amélioration de 18% en AUROC, amélioration de 22% en AUPRC, et réduction du FPR95 de 76% à 40%.
Dans les applications critiques pour la sécurité telles que la conduite autonome, la segmentation sémantique LiDAR doit non seulement comprendre avec précision les scènes connues, mais aussi être capable d'identifier les objets hors-distribution (OOD) non observés pendant l'entraînement, afin d'éviter de mal classer les objets inconnus comme des classes connues.
Méthodes supervisées: Dépendent d'ensembles de données OOD auxiliaires, difficiles à obtenir dans le domaine LiDAR
Méthodes non supervisées: Reposent principalement sur l'entropie prédictive, mais confondent l'incertitude épistémique et l'incertitude aléatoire
Confusion d'incertitude: L'entropie prédictive mélange l'incertitude du modèle et le bruit des données, conduisant à mal classer les régions ambiguës intra-distribution comme OOD
Proposition d'une méthode de détection OOD basée sur l'incertitude épistémique: Séparation de l'incertitude épistémique et de l'incertitude aléatoire par modélisation hiérarchique bayésienne des paramètres GMM
Cadre non supervisé: Aucune donnée OOD auxiliaire ou étape d'entraînement supplémentaire requise, améliorant la praticité
Améliorations de performance significatives: Dépassement considérable des méthodes existantes sur l'ensemble de données SemanticKITTI
Contribution théorique: Démonstration des avantages de l'incertitude épistémique par rapport à l'entropie prédictive en détection OOD
Basé sur l'architecture GMMSeg, utilisant un réseau de neurones profond pour extraire des représentations de caractéristiques au niveau des pixels z ∈ ℝ^D, puis modélisant une distribution de mélange gaussien conditionnée par classe dans l'espace des caractéristiques pour chaque classe sémantique c:
p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))
où π_k^(c), μ_k^(c), Σ_k^(c) représentent respectivement le poids de mélange, la moyenne et la covariance de la k-ème composante gaussienne.
Par échantillonnage de n ensembles de paramètres GMM, calcul de la distribution de fréquence des prédictions de classe pour chaque pixel, puis calcul de l'entropie:
H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c
où p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c représente la probabilité empirique de la classe c.
Séparation d'incertitude: Estimation directe de l'incertitude épistémique par échantillonnage paramétrique, évitant la confusion entre les deux types d'incertitude dans l'entropie prédictive
Pas de réentraînement requis: Utilisation de l'espace de caractéristiques du réseau de segmentation existant, réalisation de l'estimation d'incertitude par modélisation GMM
Fondement théorique: Basé sur la théorie de l'information mutuelle, l'incertitude épistémique est définie comme Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))
Méthode proposée: Identification précise des vrais objets OOD (panneaux, poubelles, etc.), maintien d'une incertitude modérée pour les régions ID ambiguës
Deep Ensembles: Production de nombreux faux positifs aux frontières sémantiques, manquement des vrais objets OOD
Méthodes supervisées: Dépendant d'ensembles de données auxiliaires pour l'entraînement avec exposition aux valeurs aberrantes
Méthodes non supervisées: Basées sur l'estimation d'incertitude, incluant les méthodes déterministes (MSP, ODIN) et les méthodes bayésiennes (MC Dropout, Deep Ensembles)
Méthodes d'entropie prédictive: Mélange d'incertitude épistémique et aléatoire
Méthodes d'information mutuelle: Théoriquement capables de séparer les deux types d'incertitude, mais difficiles à calculer précisément dans les réseaux profonds
Contribution de cet article: Estimation directe de l'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM
Contribution théorique: Clarification explicite des avantages de l'incertitude épistémique en détection OOD, fournissant une base théorique
Innovation méthodologique: Réalisation ingénieuse de l'estimation d'incertitude épistémique par modélisation bayésienne hiérarchique des paramètres GMM
Expérimentation complète: Comparaison exhaustive avec plusieurs baselines sur un ensemble de données standard
Praticité forte: Aucune donnée auxiliaire ou réentraînement requis, facile à déployer
L'article cite les travaux importants du domaine connexe, incluant:
GMMSeg 18: Travail fondamental en segmentation sémantique générative
Deep Ensembles 16: Méthode classique pour l'estimation d'incertitude
MC Dropout 7: Travail représentatif de l'apprentissage profond bayésien
SemanticKITTI 1: Ensemble de données standard pour la segmentation sémantique LiDAR
Cet article apporte une contribution importante au domaine de la détection OOD en segmentation sémantique LiDAR, réalisant une estimation efficace de l'incertitude épistémique par une conception technique ingénieuse, fournissant une solution précieuse pour améliorer la sécurité et la fiabilité des systèmes de conduite autonome.