2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner

In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.

academic

Обнаружение распределений вне области в семантической сегментации LiDAR с использованием эпистемической неопределённости из иерархических GMM

Основная информация

ID статьи: 2510.08631
Название: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Авторы: Hanieh Shojaei Miandashti, Claus Brenner (Университет Лейбница Ганновера)
Классификация: cs.CV, cs.LG
Дата публикации: 8 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.08631

Аннотация

В данной работе предложен метод оценки эпистемической неопределённости на основе параметрического моделирования иерархических байесовских гауссовских смешанных моделей (GMM) для обнаружения распределений вне области (OOD) в семантической сегментации LiDAR. Метод не требует вспомогательных данных или дополнительных этапов обучения и достигает значительного улучшения по сравнению с существующими методами, основанными на энтропии предсказания, на наборе данных SemanticKITTI: повышение AUROC на 18%, повышение AUPRC на 22%, снижение FPR95 с 76% до 40%.

Исследовательский контекст и мотивация

Определение проблемы

В критически важных для безопасности приложениях, таких как автономное вождение, семантическая сегментация LiDAR должна не только точно понимать известные сцены, но и идентифицировать объекты вне распределения (OOD), которые не встречались во время обучения, избегая неправильной классификации неизвестных объектов как известных классов.

Важность проблемы

Требования безопасности: Системы автономного вождения должны идентифицировать аномальные объекты на дороге (такие как мусорные баки, знаки, животные и т.д.)
Требования надёжности: Глубокие модели часто дают чрезмерно уверенные, но ошибочные предсказания для входных данных OOD
Практические соображения: В реальных окружениях существует множество классов объектов, не охватываемых обучающими наборами данных

Ограничения существующих методов

Контролируемые методы: Зависят от вспомогательных наборов данных OOD, которые сложно получить в области LiDAR
Неконтролируемые методы: В основном полагаются на энтропию предсказания, но смешивают эпистемическую и алеаторическую неопределённость
Путаница в неопределённости: Энтропия предсказания объединяет неопределённость модели и шум данных, что приводит к неправильной классификации неоднозначных внутридистрибутивных областей как OOD

Основные вклады

Предложен метод обнаружения OOD на основе эпистемической неопределённости: Разделение эпистемической и алеаторической неопределённости через иерархическое байесовское моделирование параметров GMM
Неконтролируемая структура: Не требует вспомогательных данных OOD или дополнительных этапов обучения, повышая практичность
Значительное улучшение производительности: Значительное превосходство над существующими методами на наборе данных SemanticKITTI
Теоретический вклад: Демонстрация преимуществ эпистемической неопределённости перед энтропией предсказания в обнаружении OOD

Подробное описание метода

Определение задачи

Для представления дальномерного вида облаков точек LiDAR целью является:

Выполнение пиксельной семантической сегментации
Идентификация пиксельных областей, принадлежащих OOD
Количественная оценка неопределённости предсказания

Архитектура модели

1. Гибридная генеративно-дискриминативная структура

На основе архитектуры GMMSeg используется глубокая нейронная сеть для извлечения представлений признаков на уровне пикселей z ∈ R^D, затем моделируется условное гауссовское смешанное распределение для каждого семантического класса c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

где π_k^(c), μ_k^(c), Σ_k^(c) обозначают вес смешивания, среднее значение и ковариацию k-го гауссова компонента соответственно.

2. Иерархическое байесовское моделирование

Ключевое инновационное решение заключается в иерархическом байесовском моделировании параметров GMM:

Априорные распределения: Установка сопряжённых гауссово-обратно-гамма априорных распределений для среднего значения и дисперсии каждого гауссова компонента
Апостериорное обновление: Обновление апостериорного распределения параметров на основе обучающих данных
Выборка параметров: Выборка нескольких наборов параметров GMM из апостериорного распределения во время вывода

Конкретно:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Оценка эпистемической неопределённости

Путём выборки n наборов параметров GMM вычисляется распределение частот предсказания класса для каждого пикселя, затем вычисляется энтропия:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

где p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c обозначает эмпирическую вероятность класса c.

Технические инновационные решения

Разделение неопределённости: Прямая оценка эпистемической неопределённости путём выборки параметров, избегая смешивания двух типов неопределённости в энтропии предсказания
Отсутствие необходимости переобучения: Использование пространства признаков существующей сети сегментации, реализация оценки неопределённости через моделирование GMM
Теоретическая основа: На основе теории взаимной информации эпистемическая неопределённость определяется как Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Экспериментальная установка

Наборы данных

SemanticKITTI: Набор данных облаков точек LiDAR с 19 семантическими классами
Классы OOD: Использование класса outlier из набора данных в качестве образцов OOD (мусорные баки, знаки, животные и т.д.)
Формат входных данных: Изображение дальномерного вида размером 64×1024×5 (координаты x,y,z, интенсивность, расстояние)
Размерность признаков: Извлечение 32-мерных признаков с использованием магистральной сети SalsaNext

Метрики оценки

AUROC: Площадь под кривой ROC, измеряющая общую производительность классификации
AUPRC: Площадь под кривой точность-полнота, подходящая для сценариев дисбаланса классов
FPR95: Коэффициент ложноположительных результатов при истинном положительном коэффициенте 95%, измеряющий безопасность
mIoU: Средний коэффициент пересечения над объединением для семантической сегментации

Методы сравнения

MSP: Максимальная вероятность Softmax
ODIN: Масштабирование температуры и метод возмущения входных данных
MC Dropout: Монте-Карло Dropout
Deep Ensembles (DE): Глубокие ансамбли
GMMSeg: Исходный метод GMM сегментации (без моделирования неопределённости)

Детали реализации

Магистральная сеть: SalsaNext
Количество компонентов GMM: 2 гауссовых компонента на класс
Количество выборок: 20 образцов параметров GMM
Стратегия порога: Неконтролируемый процентильный порог (верхние 5%)

Результаты экспериментов

Основные результаты

Метод	AUROC (%)	AUPRC (%)	FPR95 (%)	mIoU (%)
MSP	70.41	10.90	76.00	56.37
ODIN	73.74	12.45	75.54	56.37
MC Dropout	73.64	13.65	75.92	57.15
Deep Ensembles	73.03	16.14	76.48	57.17
GMMSeg	87.62	26.14	48.84	57.60
Предложенный метод	91.06	37.67	40.14	57.71

Ключевые находки

Значительное улучшение производительности: По сравнению с лучшим базовым методом (GMMSeg) AUROC повышается на 3.44%, AUPRC повышается на 11.53%
Улучшение безопасности: FPR95 снижается с 76.48% (Deep Ensembles) до 40.14%
Производительность сегментации: Благодаря механизму голосования точность семантической сегментации также немного улучшается

Качественный анализ

Путём визуализации сравнения обнаруживается:

Предложенный метод: Точно идентифицирует истинные объекты OOD (знаки, мусорные баки и т.д.), сохраняя умеренную неопределённость для неоднозначных внутридистрибутивных областей
Deep Ensembles: Производит чрезмерное количество ложноположительных результатов на семантических границах, пропускает истинные объекты OOD

Анализ распределения неопределённости

Сравнение распределений энтропии предсказания и эпистемической неопределённости:

Энтропия предсказания показывает значительное перекрытие между образцами внутри и вне распределения
Эпистемическая неопределённость достигает более чёткого разделения, с образцами внутри распределения, сосредоточенными в области низкой неопределённости

Связанные работы

Классификация методов обнаружения OOD

Контролируемые методы: Зависят от вспомогательных наборов данных для обучения с использованием выбросов
Неконтролируемые методы: На основе оценки неопределённости, включая детерминированные методы (MSP, ODIN) и байесовские методы (MC Dropout, Deep Ensembles)

Оценка неопределённости

Методы энтропии предсказания: Смешивание эпистемической и алеаторической неопределённости
Методы взаимной информации: Теоретически могут разделить два типа неопределённости, но сложны в точном вычислении в глубоких сетях
Вклад данной работы: Прямая оценка эпистемической неопределённости через байесовское моделирование параметров GMM

Заключение и обсуждение

Основные выводы

Эпистемическая неопределённость более эффективна, чем энтропия предсказания, для обнаружения OOD
Иерархическое байесовское моделирование GMM обеспечивает практический метод оценки эпистемической неопределённости
Неконтролируемая структура избегает зависимости от вспомогательных данных

Ограничения

Проблема ложноположительных результатов: Может по-прежнему производить высокую неопределённость для семантически неоднозначных или неправильно сегментированных внутридистрибутивных областей
Выбор порога: Зависит от стратегии процентильного порога, которая может быть неприменима ко всем сценариям
Вычислительная сложность: Требует множественной выборки параметров, увеличивая время вывода

Будущие направления

Исследование стратегий снижения неоднозначности в пограничных областях
Улучшение методов выбора порога неопределённости
Изучение более эффективных методов оценки неопределённости

Глубокая оценка

Преимущества

Теоретический вклад: Ясное объяснение преимуществ эпистемической неопределённости в обнаружении OOD с теоретической основой
Методологическое инновационное решение: Умелое использование байесовского моделирования параметров GMM для оценки эпистемической неопределённости
Полные эксперименты: Всестороннее сравнение с несколькими базовыми методами на стандартном наборе данных
Сильная практичность: Не требует вспомогательных данных или переобучения, легко развёртывается

Недостатки

Проверка обобщаемости: Проверка только на наборе данных SemanticKITTI, требуется проверка на большем количестве наборов данных
Чувствительность параметров: Выбор гиперпараметров, таких как количество компонентов GMM, требует более детального анализа
Вычислительные затраты: Недостаточный анализ вычислительных затрат множественной выборки
Теоретический анализ: Отсутствует углубленное теоретическое объяснение того, почему моделирование GMM лучше разделяет неопределённость

Влияние

Академическая ценность: Предоставляет новое направление исследований для обнаружения OOD в семантической сегментации LiDAR
Практическая ценность: Имеет важное значение для критически важных для безопасности приложений, таких как автономное вождение
Воспроизводимость: Метод описан ясно, реализация относительно проста

Применимые сценарии

Автономное вождение: Обнаружение аномальных объектов на дороге
Навигация робота: Идентификация неизвестных препятствий в неизвестной среде
Мониторинг безопасности: Обнаружение аномального поведения или объектов
Промышленное обнаружение: Идентификация дефектных продуктов на производственной линии

Библиография

В статье цитируются важные работы в соответствующих областях, включая:

GMMSeg 18: Основополагающая работа по генеративной семантической сегментации
Deep Ensembles 16: Классический метод оценки неопределённости
MC Dropout 7: Представительная работа в байесовском глубоком обучении
SemanticKITTI 1: Стандартный набор данных для семантической сегментации LiDAR

Данная статья вносит важный вклад в область обнаружения OOD в семантической сегментации LiDAR, реализуя эффективную оценку эпистемической неопределённости благодаря тщательному техническому проектированию, предоставляя ценное решение для повышения безопасности и надёжности систем автономного вождения.