2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

Rilevamento Out-of-Distribution nella Segmentazione Semantica LiDAR Utilizzando l'Incertezza Epistemica da GMM Gerarchici

Informazioni Fondamentali

  • ID Articolo: 2510.08631
  • Titolo: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • Autori: Hanieh Shojaei Miandashti, Claus Brenner (Leibniz University Hannover)
  • Classificazione: cs.CV, cs.LG
  • Data di Pubblicazione: 8 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.08631

Riassunto

Questo articolo propone un metodo di stima dell'incertezza epistemica basato sulla modellazione parametrica di Modelli di Miscela Gaussiana (GMM) gerarchici bayesiani per il rilevamento out-of-distribution (OOD) nella segmentazione semantica LiDAR. Il metodo non richiede dati ausiliari o fasi di addestramento aggiuntive, ottenendo miglioramenti significativi rispetto ai metodi basati sull'entropia predittiva nel dataset SemanticKITTI: aumento dell'AUROC del 18%, aumento dell'AUPRC del 22%, riduzione dell'FPR95 dal 76% al 40%.

Contesto di Ricerca e Motivazione

Definizione del Problema

Nelle applicazioni critiche per la sicurezza come la guida autonoma, la segmentazione semantica LiDAR non solo deve comprendere accuratamente scene note, ma deve anche essere in grado di identificare oggetti out-of-distribution (OOD) non visti durante l'addestramento, evitando di classificare erroneamente oggetti sconosciuti come classi note.

Importanza del Problema

  1. Requisiti di Sicurezza: I sistemi di guida autonoma devono identificare oggetti anomali sulla strada (come bidoni della spazzatura, cartelli, animali, ecc.)
  2. Esigenze di Affidabilità: I modelli profondi tendono a produrre previsioni eccessivamente fiduciose ma errate per input OOD
  3. Considerazioni Pratiche: Negli ambienti reali esistono numerose categorie di oggetti non coperte dai dataset di addestramento

Limitazioni dei Metodi Esistenti

  1. Metodi Supervisionati: Dipendono da dataset ausiliari OOD, difficili da ottenere nel dominio LiDAR
  2. Metodi Non Supervisionati: Si basano principalmente sull'entropia predittiva, ma confondono l'incertezza epistemica e quella aleatoria
  3. Confusione dell'Incertezza: L'entropia predittiva mescola l'incertezza del modello e il rumore dei dati, portando a classificare erroneamente regioni ambigue in-distribution come OOD

Contributi Principali

  1. Propone un metodo di rilevamento OOD basato su incertezza epistemica: Attraverso la modellazione bayesiana gerarchica dei parametri GMM, separa l'incertezza epistemica da quella aleatoria
  2. Framework Non Supervisionato: Non richiede dati OOD ausiliari o fasi di addestramento aggiuntive, migliorando la praticità
  3. Miglioramenti Significativi delle Prestazioni: Supera notevolmente i metodi esistenti nel dataset SemanticKITTI
  4. Contributi Teorici: Dimostra i vantaggi dell'incertezza epistemica rispetto all'entropia predittiva nel rilevamento OOD

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un rappresentazione in vista di distanza di una nuvola di punti LiDAR, l'obiettivo è:

  1. Eseguire la segmentazione semantica a livello di pixel
  2. Identificare regioni di pixel appartenenti a OOD
  3. Quantificare l'incertezza delle previsioni

Architettura del Modello

1. Framework Ibrido Generativo-Discriminativo

Basato sull'architettura GMMSeg, utilizza una rete neurale profonda per estrarre rappresentazioni di caratteristiche a livello di pixel z ∈ R^D, quindi modella la distribuzione di miscela gaussiana condizionata alla classe per ogni categoria semantica c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

dove π_k^(c), μ_k^(c), Σ_k^(c) rappresentano rispettivamente il peso della miscela, la media e la covarianza della k-esima componente gaussiana.

2. Modellazione Bayesiana Gerarchica

L'innovazione chiave consiste nella modellazione bayesiana gerarchica dei parametri GMM:

  • Distribuzioni a Priori: Impostare priori coniugati gaussiani-gamma inversi per la media e la varianza di ogni componente gaussiana
  • Aggiornamento Posteriore: Aggiornare la distribuzione posteriore dei parametri in base ai dati di addestramento
  • Campionamento dei Parametri: Durante l'inferenza, campionare più insiemi di parametri GMM dalla distribuzione posteriore

Specificamente:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Stima dell'Incertezza Epistemica

Attraverso il campionamento di n insiemi di parametri GMM, calcolare la distribuzione di frequenza della previsione di classe per ogni pixel, quindi calcolare l'entropia:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

dove p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c rappresenta la probabilità empirica della classe c.

Punti di Innovazione Tecnica

  1. Separazione dell'Incertezza: Stima direttamente l'incertezza epistemica attraverso il campionamento dei parametri, evitando la confusione tra i due tipi di incertezza nell'entropia predittiva
  2. Nessun Riaddestramento Necessario: Utilizza lo spazio di caratteristiche della rete di segmentazione esistente, realizzando la stima dell'incertezza attraverso la modellazione GMM
  3. Fondamento Teorico: Basato sulla teoria dell'informazione reciproca, l'incertezza epistemica è definita come Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Configurazione Sperimentale

Dataset

  • SemanticKITTI: Dataset di nuvole di punti LiDAR con 19 categorie semantiche
  • Categorie OOD: Utilizzo della classe outlier nel dataset come campioni OOD (bidoni della spazzatura, cartelli, animali, ecc.)
  • Formato di Input: Immagini in vista di distanza 64×1024×5 (coordinate x,y,z, intensità, distanza)
  • Dimensione delle Caratteristiche: Estrazione di caratteristiche a 32 dimensioni utilizzando la rete backbone SalsaNext

Metriche di Valutazione

  • AUROC: Area sotto la curva ROC, misura le prestazioni di classificazione complessiva
  • AUPRC: Area sotto la curva precisione-recall, appropriata per scenari di squilibrio di classe
  • FPR95: Tasso di falsi positivi quando il tasso di veri positivi è del 95%, misura la sicurezza
  • mIoU: Media dell'Intersezione su Unione per la segmentazione semantica

Metodi di Confronto

  • MSP: Massima Probabilità Softmax
  • ODIN: Metodo di ridimensionamento della temperatura e perturbazione dell'input
  • MC Dropout: Dropout Monte Carlo
  • Deep Ensembles (DE): Ensemble Profondo
  • GMMSeg: Metodo GMM di segmentazione originale (senza modellazione dell'incertezza)

Dettagli di Implementazione

  • Rete Backbone: SalsaNext
  • Numero di Componenti GMM: 2 componenti gaussiane per classe
  • Numero di Campioni: 20 campioni di parametri GMM
  • Strategia di Soglia: Soglia percentile non supervisionata (top 5%)

Risultati Sperimentali

Risultati Principali

MetodoAUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
Metodo Proposto91.0637.6740.1457.71

Scoperte Principali

  1. Miglioramenti Significativi delle Prestazioni: Rispetto al miglior baseline (GMMSeg), aumento dell'AUROC del 3.44%, aumento dell'AUPRC dell'11.53%
  2. Miglioramento della Sicurezza: FPR95 ridotto dal 76.48% al 40.14% rispetto a Deep Ensembles
  3. Prestazioni di Segmentazione: Attraverso il meccanismo di votazione, la precisione della segmentazione semantica mostra anche un leggero miglioramento

Analisi Qualitativa

Attraverso il confronto di visualizzazioni si scopre che:

  • Metodo Proposto: Identifica accuratamente i veri oggetti OOD (cartelli, bidoni della spazzatura, ecc.), mantenendo un'incertezza moderata per le regioni ID ambigue
  • Deep Ensembles: Produce numerosi falsi positivi ai confini semantici, perdendo i veri oggetti OOD

Analisi della Distribuzione dell'Incertezza

Confronto tra la distribuzione dell'entropia predittiva e dell'incertezza epistemica:

  • L'entropia predittiva mostra un ampio sovrapposizione tra campioni ID e OOD
  • L'incertezza epistemica realizza una separazione più chiara, con campioni ID concentrati nella regione di bassa incertezza

Lavori Correlati

Classificazione dei Metodi di Rilevamento OOD

  1. Metodi Supervisionati: Dipendono da dataset ausiliari per l'addestramento con esposizione a outlier
  2. Metodi Non Supervisionati: Basati sulla stima dell'incertezza, includono metodi deterministici (MSP, ODIN) e metodi bayesiani (MC Dropout, Deep Ensembles)

Stima dell'Incertezza

  • Metodi basati sull'Entropia Predittiva: Mescolano incertezza epistemica e aleatoria
  • Metodi basati sull'Informazione Reciproca: Teoricamente possono separare i due tipi di incertezza, ma difficili da calcolare accuratamente nelle reti profonde
  • Contributo di questo Articolo: Realizza la stima diretta dell'incertezza epistemica attraverso la modellazione bayesiana gerarchica dei parametri GMM

Conclusioni e Discussione

Conclusioni Principali

  1. L'incertezza epistemica è più efficace dell'entropia predittiva nel rilevamento OOD
  2. La modellazione GMM bayesiana gerarchica fornisce un metodo pratico per stimare l'incertezza epistemica
  3. Il framework non supervisionato evita la dipendenza da dati ausiliari

Limitazioni

  1. Problema dei Falsi Positivi: Può ancora produrre alta incertezza per regioni ID semanticamente ambigue o erroneamente segmentate
  2. Selezione della Soglia: Dipende dalla strategia di soglia percentile, che potrebbe non essere applicabile a tutti gli scenari
  3. Complessità Computazionale: Richiede molteplici campionamenti di parametri, aumentando il tempo di inferenza

Direzioni Future

  1. Ricercare strategie per ridurre l'ambiguità nelle regioni di confine
  2. Migliorare i metodi di selezione della soglia dell'incertezza
  3. Esplorare metodi più efficienti per la stima dell'incertezza

Valutazione Approfondita

Punti di Forza

  1. Contributi Teorici: Chiarisce i vantaggi dell'incertezza epistemica nel rilevamento OOD, fornendo fondamenti teorici
  2. Innovazione del Metodo: Realizza ingegnosamente la stima dell'incertezza epistemica attraverso la modellazione bayesiana gerarchica dei parametri GMM
  3. Esperimenti Completi: Confronto completo con molteplici baseline nel dataset standard
  4. Forte Praticità: Non richiede dati ausiliari o riaddestramento, facile da implementare

Carenze

  1. Generalizzabilità da Verificare: Validato solo nel dataset SemanticKITTI, necessita verifica su più dataset
  2. Sensibilità dei Parametri: La scelta di iperparametri come il numero di componenti GMM manca di analisi dettagliata
  3. Analisi del Costo Computazionale: Insufficiente l'analisi del costo computazionale dei molteplici campionamenti
  4. Analisi Teorica: Manca una spiegazione teorica approfondita del perché la modellazione GMM possa separare meglio l'incertezza

Impatto

  1. Valore Accademico: Fornisce una nuova direzione di ricerca per il rilevamento OOD nella segmentazione semantica LiDAR
  2. Valore Pratico: Ha significato importante per applicazioni critiche per la sicurezza come la guida autonoma
  3. Riproducibilità: La descrizione del metodo è chiara e l'implementazione è relativamente semplice

Scenari Applicabili

  1. Guida Autonoma: Rilevamento di oggetti anomali sulla strada
  2. Navigazione Robotica: Identificazione di ostacoli in ambienti sconosciuti
  3. Sorveglianza di Sicurezza: Rilevamento di comportamenti o oggetti anomali
  4. Ispezione Industriale: Identificazione di prodotti difettosi sulla linea di produzione

Bibliografia

L'articolo cita importanti lavori nel campo correlato, inclusi:

  • GMMSeg 18: Lavoro fondamentale nella segmentazione semantica generativa
  • Deep Ensembles 16: Metodo classico nella stima dell'incertezza
  • MC Dropout 7: Lavoro rappresentativo nell'apprendimento profondo bayesiano
  • SemanticKITTI 1: Dataset standard per la segmentazione semantica LiDAR

Questo articolo fornisce importanti contributi nel campo del rilevamento OOD nella segmentazione semantica LiDAR, realizzando attraverso un design tecnico ingegnoso una stima efficace dell'incertezza epistemica, fornendo una soluzione preziosa per migliorare la sicurezza e l'affidabilità dei sistemi di guida autonoma.