2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

Обнаружение распределений вне области в семантической сегментации LiDAR с использованием эпистемической неопределённости из иерархических GMM

Основная информация

  • ID статьи: 2510.08631
  • Название: Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
  • Авторы: Hanieh Shojaei Miandashti, Claus Brenner (Университет Лейбница Ганновера)
  • Классификация: cs.CV, cs.LG
  • Дата публикации: 8 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.08631

Аннотация

В данной работе предложен метод оценки эпистемической неопределённости на основе параметрического моделирования иерархических байесовских гауссовских смешанных моделей (GMM) для обнаружения распределений вне области (OOD) в семантической сегментации LiDAR. Метод не требует вспомогательных данных или дополнительных этапов обучения и достигает значительного улучшения по сравнению с существующими методами, основанными на энтропии предсказания, на наборе данных SemanticKITTI: повышение AUROC на 18%, повышение AUPRC на 22%, снижение FPR95 с 76% до 40%.

Исследовательский контекст и мотивация

Определение проблемы

В критически важных для безопасности приложениях, таких как автономное вождение, семантическая сегментация LiDAR должна не только точно понимать известные сцены, но и идентифицировать объекты вне распределения (OOD), которые не встречались во время обучения, избегая неправильной классификации неизвестных объектов как известных классов.

Важность проблемы

  1. Требования безопасности: Системы автономного вождения должны идентифицировать аномальные объекты на дороге (такие как мусорные баки, знаки, животные и т.д.)
  2. Требования надёжности: Глубокие модели часто дают чрезмерно уверенные, но ошибочные предсказания для входных данных OOD
  3. Практические соображения: В реальных окружениях существует множество классов объектов, не охватываемых обучающими наборами данных

Ограничения существующих методов

  1. Контролируемые методы: Зависят от вспомогательных наборов данных OOD, которые сложно получить в области LiDAR
  2. Неконтролируемые методы: В основном полагаются на энтропию предсказания, но смешивают эпистемическую и алеаторическую неопределённость
  3. Путаница в неопределённости: Энтропия предсказания объединяет неопределённость модели и шум данных, что приводит к неправильной классификации неоднозначных внутридистрибутивных областей как OOD

Основные вклады

  1. Предложен метод обнаружения OOD на основе эпистемической неопределённости: Разделение эпистемической и алеаторической неопределённости через иерархическое байесовское моделирование параметров GMM
  2. Неконтролируемая структура: Не требует вспомогательных данных OOD или дополнительных этапов обучения, повышая практичность
  3. Значительное улучшение производительности: Значительное превосходство над существующими методами на наборе данных SemanticKITTI
  4. Теоретический вклад: Демонстрация преимуществ эпистемической неопределённости перед энтропией предсказания в обнаружении OOD

Подробное описание метода

Определение задачи

Для представления дальномерного вида облаков точек LiDAR целью является:

  1. Выполнение пиксельной семантической сегментации
  2. Идентификация пиксельных областей, принадлежащих OOD
  3. Количественная оценка неопределённости предсказания

Архитектура модели

1. Гибридная генеративно-дискриминативная структура

На основе архитектуры GMMSeg используется глубокая нейронная сеть для извлечения представлений признаков на уровне пикселей z ∈ R^D, затем моделируется условное гауссовское смешанное распределение для каждого семантического класса c:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

где π_k^(c), μ_k^(c), Σ_k^(c) обозначают вес смешивания, среднее значение и ковариацию k-го гауссова компонента соответственно.

2. Иерархическое байесовское моделирование

Ключевое инновационное решение заключается в иерархическом байесовском моделировании параметров GMM:

  • Априорные распределения: Установка сопряжённых гауссово-обратно-гамма априорных распределений для среднего значения и дисперсии каждого гауссова компонента
  • Апостериорное обновление: Обновление апостериорного распределения параметров на основе обучающих данных
  • Выборка параметров: Выборка нескольких наборов параметров GMM из апостериорного распределения во время вывода

Конкретно:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. Оценка эпистемической неопределённости

Путём выборки n наборов параметров GMM вычисляется распределение частот предсказания класса для каждого пикселя, затем вычисляется энтропия:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

где p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c обозначает эмпирическую вероятность класса c.

Технические инновационные решения

  1. Разделение неопределённости: Прямая оценка эпистемической неопределённости путём выборки параметров, избегая смешивания двух типов неопределённости в энтропии предсказания
  2. Отсутствие необходимости переобучения: Использование пространства признаков существующей сети сегментации, реализация оценки неопределённости через моделирование GMM
  3. Теоретическая основа: На основе теории взаимной информации эпистемическая неопределённость определяется как Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))

Экспериментальная установка

Наборы данных

  • SemanticKITTI: Набор данных облаков точек LiDAR с 19 семантическими классами
  • Классы OOD: Использование класса outlier из набора данных в качестве образцов OOD (мусорные баки, знаки, животные и т.д.)
  • Формат входных данных: Изображение дальномерного вида размером 64×1024×5 (координаты x,y,z, интенсивность, расстояние)
  • Размерность признаков: Извлечение 32-мерных признаков с использованием магистральной сети SalsaNext

Метрики оценки

  • AUROC: Площадь под кривой ROC, измеряющая общую производительность классификации
  • AUPRC: Площадь под кривой точность-полнота, подходящая для сценариев дисбаланса классов
  • FPR95: Коэффициент ложноположительных результатов при истинном положительном коэффициенте 95%, измеряющий безопасность
  • mIoU: Средний коэффициент пересечения над объединением для семантической сегментации

Методы сравнения

  • MSP: Максимальная вероятность Softmax
  • ODIN: Масштабирование температуры и метод возмущения входных данных
  • MC Dropout: Монте-Карло Dropout
  • Deep Ensembles (DE): Глубокие ансамбли
  • GMMSeg: Исходный метод GMM сегментации (без моделирования неопределённости)

Детали реализации

  • Магистральная сеть: SalsaNext
  • Количество компонентов GMM: 2 гауссовых компонента на класс
  • Количество выборок: 20 образцов параметров GMM
  • Стратегия порога: Неконтролируемый процентильный порог (верхние 5%)

Результаты экспериментов

Основные результаты

МетодAUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
Предложенный метод91.0637.6740.1457.71

Ключевые находки

  1. Значительное улучшение производительности: По сравнению с лучшим базовым методом (GMMSeg) AUROC повышается на 3.44%, AUPRC повышается на 11.53%
  2. Улучшение безопасности: FPR95 снижается с 76.48% (Deep Ensembles) до 40.14%
  3. Производительность сегментации: Благодаря механизму голосования точность семантической сегментации также немного улучшается

Качественный анализ

Путём визуализации сравнения обнаруживается:

  • Предложенный метод: Точно идентифицирует истинные объекты OOD (знаки, мусорные баки и т.д.), сохраняя умеренную неопределённость для неоднозначных внутридистрибутивных областей
  • Deep Ensembles: Производит чрезмерное количество ложноположительных результатов на семантических границах, пропускает истинные объекты OOD

Анализ распределения неопределённости

Сравнение распределений энтропии предсказания и эпистемической неопределённости:

  • Энтропия предсказания показывает значительное перекрытие между образцами внутри и вне распределения
  • Эпистемическая неопределённость достигает более чёткого разделения, с образцами внутри распределения, сосредоточенными в области низкой неопределённости

Связанные работы

Классификация методов обнаружения OOD

  1. Контролируемые методы: Зависят от вспомогательных наборов данных для обучения с использованием выбросов
  2. Неконтролируемые методы: На основе оценки неопределённости, включая детерминированные методы (MSP, ODIN) и байесовские методы (MC Dropout, Deep Ensembles)

Оценка неопределённости

  • Методы энтропии предсказания: Смешивание эпистемической и алеаторической неопределённости
  • Методы взаимной информации: Теоретически могут разделить два типа неопределённости, но сложны в точном вычислении в глубоких сетях
  • Вклад данной работы: Прямая оценка эпистемической неопределённости через байесовское моделирование параметров GMM

Заключение и обсуждение

Основные выводы

  1. Эпистемическая неопределённость более эффективна, чем энтропия предсказания, для обнаружения OOD
  2. Иерархическое байесовское моделирование GMM обеспечивает практический метод оценки эпистемической неопределённости
  3. Неконтролируемая структура избегает зависимости от вспомогательных данных

Ограничения

  1. Проблема ложноположительных результатов: Может по-прежнему производить высокую неопределённость для семантически неоднозначных или неправильно сегментированных внутридистрибутивных областей
  2. Выбор порога: Зависит от стратегии процентильного порога, которая может быть неприменима ко всем сценариям
  3. Вычислительная сложность: Требует множественной выборки параметров, увеличивая время вывода

Будущие направления

  1. Исследование стратегий снижения неоднозначности в пограничных областях
  2. Улучшение методов выбора порога неопределённости
  3. Изучение более эффективных методов оценки неопределённости

Глубокая оценка

Преимущества

  1. Теоретический вклад: Ясное объяснение преимуществ эпистемической неопределённости в обнаружении OOD с теоретической основой
  2. Методологическое инновационное решение: Умелое использование байесовского моделирования параметров GMM для оценки эпистемической неопределённости
  3. Полные эксперименты: Всестороннее сравнение с несколькими базовыми методами на стандартном наборе данных
  4. Сильная практичность: Не требует вспомогательных данных или переобучения, легко развёртывается

Недостатки

  1. Проверка обобщаемости: Проверка только на наборе данных SemanticKITTI, требуется проверка на большем количестве наборов данных
  2. Чувствительность параметров: Выбор гиперпараметров, таких как количество компонентов GMM, требует более детального анализа
  3. Вычислительные затраты: Недостаточный анализ вычислительных затрат множественной выборки
  4. Теоретический анализ: Отсутствует углубленное теоретическое объяснение того, почему моделирование GMM лучше разделяет неопределённость

Влияние

  1. Академическая ценность: Предоставляет новое направление исследований для обнаружения OOD в семантической сегментации LiDAR
  2. Практическая ценность: Имеет важное значение для критически важных для безопасности приложений, таких как автономное вождение
  3. Воспроизводимость: Метод описан ясно, реализация относительно проста

Применимые сценарии

  1. Автономное вождение: Обнаружение аномальных объектов на дороге
  2. Навигация робота: Идентификация неизвестных препятствий в неизвестной среде
  3. Мониторинг безопасности: Обнаружение аномального поведения или объектов
  4. Промышленное обнаружение: Идентификация дефектных продуктов на производственной линии

Библиография

В статье цитируются важные работы в соответствующих областях, включая:

  • GMMSeg 18: Основополагающая работа по генеративной семантической сегментации
  • Deep Ensembles 16: Классический метод оценки неопределённости
  • MC Dropout 7: Представительная работа в байесовском глубоком обучении
  • SemanticKITTI 1: Стандартный набор данных для семантической сегментации LiDAR

Данная статья вносит важный вклад в область обнаружения OOD в семантической сегментации LiDAR, реализуя эффективную оценку эпистемической неопределённости благодаря тщательному техническому проектированию, предоставляя ценное решение для повышения безопасности и надёжности систем автономного вождения.