Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic
Rilevamento Out-of-Distribution nella Segmentazione Semantica LiDAR Utilizzando l'Incertezza Epistemica da GMM Gerarchici
Questo articolo propone un metodo di stima dell'incertezza epistemica basato sulla modellazione parametrica di Modelli di Miscela Gaussiana (GMM) gerarchici bayesiani per il rilevamento out-of-distribution (OOD) nella segmentazione semantica LiDAR. Il metodo non richiede dati ausiliari o fasi di addestramento aggiuntive, ottenendo miglioramenti significativi rispetto ai metodi basati sull'entropia predittiva nel dataset SemanticKITTI: aumento dell'AUROC del 18%, aumento dell'AUPRC del 22%, riduzione dell'FPR95 dal 76% al 40%.
Nelle applicazioni critiche per la sicurezza come la guida autonoma, la segmentazione semantica LiDAR non solo deve comprendere accuratamente scene note, ma deve anche essere in grado di identificare oggetti out-of-distribution (OOD) non visti durante l'addestramento, evitando di classificare erroneamente oggetti sconosciuti come classi note.
Requisiti di Sicurezza: I sistemi di guida autonoma devono identificare oggetti anomali sulla strada (come bidoni della spazzatura, cartelli, animali, ecc.)
Esigenze di Affidabilità: I modelli profondi tendono a produrre previsioni eccessivamente fiduciose ma errate per input OOD
Considerazioni Pratiche: Negli ambienti reali esistono numerose categorie di oggetti non coperte dai dataset di addestramento
Metodi Supervisionati: Dipendono da dataset ausiliari OOD, difficili da ottenere nel dominio LiDAR
Metodi Non Supervisionati: Si basano principalmente sull'entropia predittiva, ma confondono l'incertezza epistemica e quella aleatoria
Confusione dell'Incertezza: L'entropia predittiva mescola l'incertezza del modello e il rumore dei dati, portando a classificare erroneamente regioni ambigue in-distribution come OOD
Propone un metodo di rilevamento OOD basato su incertezza epistemica: Attraverso la modellazione bayesiana gerarchica dei parametri GMM, separa l'incertezza epistemica da quella aleatoria
Framework Non Supervisionato: Non richiede dati OOD ausiliari o fasi di addestramento aggiuntive, migliorando la praticità
Miglioramenti Significativi delle Prestazioni: Supera notevolmente i metodi esistenti nel dataset SemanticKITTI
Contributi Teorici: Dimostra i vantaggi dell'incertezza epistemica rispetto all'entropia predittiva nel rilevamento OOD
Basato sull'architettura GMMSeg, utilizza una rete neurale profonda per estrarre rappresentazioni di caratteristiche a livello di pixel z ∈ R^D, quindi modella la distribuzione di miscela gaussiana condizionata alla classe per ogni categoria semantica c:
p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))
dove π_k^(c), μ_k^(c), Σ_k^(c) rappresentano rispettivamente il peso della miscela, la media e la covarianza della k-esima componente gaussiana.
Attraverso il campionamento di n insiemi di parametri GMM, calcolare la distribuzione di frequenza della previsione di classe per ogni pixel, quindi calcolare l'entropia:
H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c
dove p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c rappresenta la probabilità empirica della classe c.
Separazione dell'Incertezza: Stima direttamente l'incertezza epistemica attraverso il campionamento dei parametri, evitando la confusione tra i due tipi di incertezza nell'entropia predittiva
Nessun Riaddestramento Necessario: Utilizza lo spazio di caratteristiche della rete di segmentazione esistente, realizzando la stima dell'incertezza attraverso la modellazione GMM
Fondamento Teorico: Basato sulla teoria dell'informazione reciproca, l'incertezza epistemica è definita come Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))
Attraverso il confronto di visualizzazioni si scopre che:
Metodo Proposto: Identifica accuratamente i veri oggetti OOD (cartelli, bidoni della spazzatura, ecc.), mantenendo un'incertezza moderata per le regioni ID ambigue
Deep Ensembles: Produce numerosi falsi positivi ai confini semantici, perdendo i veri oggetti OOD
Metodi Supervisionati: Dipendono da dataset ausiliari per l'addestramento con esposizione a outlier
Metodi Non Supervisionati: Basati sulla stima dell'incertezza, includono metodi deterministici (MSP, ODIN) e metodi bayesiani (MC Dropout, Deep Ensembles)
Metodi basati sull'Entropia Predittiva: Mescolano incertezza epistemica e aleatoria
Metodi basati sull'Informazione Reciproca: Teoricamente possono separare i due tipi di incertezza, ma difficili da calcolare accuratamente nelle reti profonde
Contributo di questo Articolo: Realizza la stima diretta dell'incertezza epistemica attraverso la modellazione bayesiana gerarchica dei parametri GMM
L'articolo cita importanti lavori nel campo correlato, inclusi:
GMMSeg 18: Lavoro fondamentale nella segmentazione semantica generativa
Deep Ensembles 16: Metodo classico nella stima dell'incertezza
MC Dropout 7: Lavoro rappresentativo nell'apprendimento profondo bayesiano
SemanticKITTI 1: Dataset standard per la segmentazione semantica LiDAR
Questo articolo fornisce importanti contributi nel campo del rilevamento OOD nella segmentazione semantica LiDAR, realizzando attraverso un design tecnico ingegnoso una stima efficace dell'incertezza epistemica, fornendo una soluzione preziosa per migliorare la sicurezza e l'affidabilità dei sistemi di guida autonoma.