2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner

In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.

academic

Rilevamento Out-of-Distribution nella Segmentazione Semantica LiDAR Utilizzando l'Incertezza Epistemica da GMM Gerarchici

Informazioni Fondamentali

ID Articolo: 2510.08631
Titolo: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Autori: Hanieh Shojaei Miandashti, Claus Brenner (Leibniz University Hannover)
Classificazione: cs.CV, cs.LG
Data di Pubblicazione: 8 ottobre 2025 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2510.08631

Riassunto

Questo articolo propone un metodo di stima dell'incertezza epistemica basato sulla modellazione parametrica di Modelli di Miscela Gaussiana (GMM) gerarchici bayesiani per il rilevamento out-of-distribution (OOD) nella segmentazione semantica LiDAR. Il metodo non richiede dati ausiliari o fasi di addestramento aggiuntive, ottenendo miglioramenti significativi rispetto ai metodi basati sull'entropia predittiva nel dataset SemanticKITTI: aumento dell'AUROC del 18%, aumento dell'AUPRC del 22%, riduzione dell'FPR95 dal 76% al 40%.

Contesto di Ricerca e Motivazione

Definizione del Problema

Nelle applicazioni critiche per la sicurezza come la guida autonoma, la segmentazione semantica LiDAR non solo deve comprendere accuratamente scene note, ma deve anche essere in grado di identificare oggetti out-of-distribution (OOD) non visti durante l'addestramento, evitando di classificare erroneamente oggetti sconosciuti come classi note.

Importanza del Problema

Requisiti di Sicurezza: I sistemi di guida autonoma devono identificare oggetti anomali sulla strada (come bidoni della spazzatura, cartelli, animali, ecc.)
Esigenze di Affidabilità: I modelli profondi tendono a produrre previsioni eccessivamente fiduciose ma errate per input OOD
Considerazioni Pratiche: Negli ambienti reali esistono numerose categorie di oggetti non coperte dai dataset di addestramento

Limitazioni dei Metodi Esistenti

Metodi Supervisionati: Dipendono da dataset ausiliari OOD, difficili da ottenere nel dominio LiDAR
Metodi Non Supervisionati: Si basano principalmente sull'entropia predittiva, ma confondono l'incertezza epistemica e quella aleatoria
Confusione dell'Incertezza: L'entropia predittiva mescola l'incertezza del modello e il rumore dei dati, portando a classificare erroneamente regioni ambigue in-distribution come OOD

Contributi Principali

Propone un metodo di rilevamento OOD basato su incertezza epistemica: Attraverso la modellazione bayesiana gerarchica dei parametri GMM, separa l'incertezza epistemica da quella aleatoria
Framework Non Supervisionato: Non richiede dati OOD ausiliari o fasi di addestramento aggiuntive, migliorando la praticità
Miglioramenti Significativi delle Prestazioni: Supera notevolmente i metodi esistenti nel dataset SemanticKITTI
Contributi Teorici: Dimostra i vantaggi dell'incertezza epistemica rispetto all'entropia predittiva nel rilevamento OOD

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un rappresentazione in vista di distanza di una nuvola di punti LiDAR, l'obiettivo è:

Eseguire la segmentazione semantica a livello di pixel
Identificare regioni di pixel appartenenti a OOD
Quantificare l'incertezza delle previsioni

Architettura del Modello

1. Framework Ibrido Generativo-Discriminativo

Basato sull'architettura GMMSeg, utilizza una rete neurale profonda per estrarre rappresentazioni di caratteristiche a livello di pixel z ∈ R^D, quindi modella la distribuzione di miscela gaussiana condizionata alla classe per ogni categoria semantica c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

dove π_k^(c), μ_k^(c), Σ_k^(c) rappresentano rispettivamente il peso della miscela, la media e la covarianza della k-esima componente gaussiana.

2. Modellazione Bayesiana Gerarchica

L'innovazione chiave consiste nella modellazione bayesiana gerarchica dei parametri GMM:

Distribuzioni a Priori: Impostare priori coniugati gaussiani-gamma inversi per la media e la varianza di ogni componente gaussiana
Aggiornamento Posteriore: Aggiornare la distribuzione posteriore dei parametri in base ai dati di addestramento
Campionamento dei Parametri: Durante l'inferenza, campionare più insiemi di parametri GMM dalla distribuzione posteriore

Specificamente:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Stima dell'Incertezza Epistemica

Attraverso il campionamento di n insiemi di parametri GMM, calcolare la distribuzione di frequenza della previsione di classe per ogni pixel, quindi calcolare l'entropia:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

dove p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c rappresenta la probabilità empirica della classe c.

Punti di Innovazione Tecnica

Separazione dell'Incertezza: Stima direttamente l'incertezza epistemica attraverso il campionamento dei parametri, evitando la confusione tra i due tipi di incertezza nell'entropia predittiva
Nessun Riaddestramento Necessario: Utilizza lo spazio di caratteristiche della rete di segmentazione esistente, realizzando la stima dell'incertezza attraverso la modellazione GMM
Fondamento Teorico: Basato sulla teoria dell'informazione reciproca, l'incertezza epistemica è definita come Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Configurazione Sperimentale

Dataset

SemanticKITTI: Dataset di nuvole di punti LiDAR con 19 categorie semantiche
Categorie OOD: Utilizzo della classe outlier nel dataset come campioni OOD (bidoni della spazzatura, cartelli, animali, ecc.)
Formato di Input: Immagini in vista di distanza 64×1024×5 (coordinate x,y,z, intensità, distanza)
Dimensione delle Caratteristiche: Estrazione di caratteristiche a 32 dimensioni utilizzando la rete backbone SalsaNext

Metriche di Valutazione

AUROC: Area sotto la curva ROC, misura le prestazioni di classificazione complessiva
AUPRC: Area sotto la curva precisione-recall, appropriata per scenari di squilibrio di classe
FPR95: Tasso di falsi positivi quando il tasso di veri positivi è del 95%, misura la sicurezza
mIoU: Media dell'Intersezione su Unione per la segmentazione semantica

Metodi di Confronto

MSP: Massima Probabilità Softmax
ODIN: Metodo di ridimensionamento della temperatura e perturbazione dell'input
MC Dropout: Dropout Monte Carlo
Deep Ensembles (DE): Ensemble Profondo
GMMSeg: Metodo GMM di segmentazione originale (senza modellazione dell'incertezza)

Dettagli di Implementazione

Rete Backbone: SalsaNext
Numero di Componenti GMM: 2 componenti gaussiane per classe
Numero di Campioni: 20 campioni di parametri GMM
Strategia di Soglia: Soglia percentile non supervisionata (top 5%)

Risultati Sperimentali

Risultati Principali

Metodo	AUROC (%)	AUPRC (%)	FPR95 (%)	mIoU (%)
MSP	70.41	10.90	76.00	56.37
ODIN	73.74	12.45	75.54	56.37
MC Dropout	73.64	13.65	75.92	57.15
Deep Ensembles	73.03	16.14	76.48	57.17
GMMSeg	87.62	26.14	48.84	57.60
Metodo Proposto	91.06	37.67	40.14	57.71

Scoperte Principali

Miglioramenti Significativi delle Prestazioni: Rispetto al miglior baseline (GMMSeg), aumento dell'AUROC del 3.44%, aumento dell'AUPRC dell'11.53%
Miglioramento della Sicurezza: FPR95 ridotto dal 76.48% al 40.14% rispetto a Deep Ensembles
Prestazioni di Segmentazione: Attraverso il meccanismo di votazione, la precisione della segmentazione semantica mostra anche un leggero miglioramento

Analisi Qualitativa

Attraverso il confronto di visualizzazioni si scopre che:

Metodo Proposto: Identifica accuratamente i veri oggetti OOD (cartelli, bidoni della spazzatura, ecc.), mantenendo un'incertezza moderata per le regioni ID ambigue
Deep Ensembles: Produce numerosi falsi positivi ai confini semantici, perdendo i veri oggetti OOD

Analisi della Distribuzione dell'Incertezza

Confronto tra la distribuzione dell'entropia predittiva e dell'incertezza epistemica:

L'entropia predittiva mostra un ampio sovrapposizione tra campioni ID e OOD
L'incertezza epistemica realizza una separazione più chiara, con campioni ID concentrati nella regione di bassa incertezza

Lavori Correlati

Classificazione dei Metodi di Rilevamento OOD

Metodi Supervisionati: Dipendono da dataset ausiliari per l'addestramento con esposizione a outlier
Metodi Non Supervisionati: Basati sulla stima dell'incertezza, includono metodi deterministici (MSP, ODIN) e metodi bayesiani (MC Dropout, Deep Ensembles)

Stima dell'Incertezza

Metodi basati sull'Entropia Predittiva: Mescolano incertezza epistemica e aleatoria
Metodi basati sull'Informazione Reciproca: Teoricamente possono separare i due tipi di incertezza, ma difficili da calcolare accuratamente nelle reti profonde
Contributo di questo Articolo: Realizza la stima diretta dell'incertezza epistemica attraverso la modellazione bayesiana gerarchica dei parametri GMM

Conclusioni e Discussione

Conclusioni Principali

L'incertezza epistemica è più efficace dell'entropia predittiva nel rilevamento OOD
La modellazione GMM bayesiana gerarchica fornisce un metodo pratico per stimare l'incertezza epistemica
Il framework non supervisionato evita la dipendenza da dati ausiliari

Limitazioni

Problema dei Falsi Positivi: Può ancora produrre alta incertezza per regioni ID semanticamente ambigue o erroneamente segmentate
Selezione della Soglia: Dipende dalla strategia di soglia percentile, che potrebbe non essere applicabile a tutti gli scenari
Complessità Computazionale: Richiede molteplici campionamenti di parametri, aumentando il tempo di inferenza

Direzioni Future

Ricercare strategie per ridurre l'ambiguità nelle regioni di confine
Migliorare i metodi di selezione della soglia dell'incertezza
Esplorare metodi più efficienti per la stima dell'incertezza

Valutazione Approfondita

Punti di Forza

Contributi Teorici: Chiarisce i vantaggi dell'incertezza epistemica nel rilevamento OOD, fornendo fondamenti teorici
Innovazione del Metodo: Realizza ingegnosamente la stima dell'incertezza epistemica attraverso la modellazione bayesiana gerarchica dei parametri GMM
Esperimenti Completi: Confronto completo con molteplici baseline nel dataset standard
Forte Praticità: Non richiede dati ausiliari o riaddestramento, facile da implementare

Carenze

Generalizzabilità da Verificare: Validato solo nel dataset SemanticKITTI, necessita verifica su più dataset
Sensibilità dei Parametri: La scelta di iperparametri come il numero di componenti GMM manca di analisi dettagliata
Analisi del Costo Computazionale: Insufficiente l'analisi del costo computazionale dei molteplici campionamenti
Analisi Teorica: Manca una spiegazione teorica approfondita del perché la modellazione GMM possa separare meglio l'incertezza

Impatto

Valore Accademico: Fornisce una nuova direzione di ricerca per il rilevamento OOD nella segmentazione semantica LiDAR
Valore Pratico: Ha significato importante per applicazioni critiche per la sicurezza come la guida autonoma
Riproducibilità: La descrizione del metodo è chiara e l'implementazione è relativamente semplice

Scenari Applicabili

Guida Autonoma: Rilevamento di oggetti anomali sulla strada
Navigazione Robotica: Identificazione di ostacoli in ambienti sconosciuti
Sorveglianza di Sicurezza: Rilevamento di comportamenti o oggetti anomali
Ispezione Industriale: Identificazione di prodotti difettosi sulla linea di produzione

Bibliografia

L'articolo cita importanti lavori nel campo correlato, inclusi:

GMMSeg 18: Lavoro fondamentale nella segmentazione semantica generativa
Deep Ensembles 16: Metodo classico nella stima dell'incertezza
MC Dropout 7: Lavoro rappresentativo nell'apprendimento profondo bayesiano
SemanticKITTI 1: Dataset standard per la segmentazione semantica LiDAR

Questo articolo fornisce importanti contributi nel campo del rilevamento OOD nella segmentazione semantica LiDAR, realizzando attraverso un design tecnico ingegnoso una stima efficace dell'incertezza epistemica, fornendo una soluzione preziosa per migliorare la sicurezza e l'affidabilità dei sistemi di guida autonoma.