Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs
Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic
Обнаружение распределений вне области в семантической сегментации LiDAR с использованием эпистемической неопределённости из иерархических GMM
В данной работе предложен метод оценки эпистемической неопределённости на основе параметрического моделирования иерархических байесовских гауссовских смешанных моделей (GMM) для обнаружения распределений вне области (OOD) в семантической сегментации LiDAR. Метод не требует вспомогательных данных или дополнительных этапов обучения и достигает значительного улучшения по сравнению с существующими методами, основанными на энтропии предсказания, на наборе данных SemanticKITTI: повышение AUROC на 18%, повышение AUPRC на 22%, снижение FPR95 с 76% до 40%.
В критически важных для безопасности приложениях, таких как автономное вождение, семантическая сегментация LiDAR должна не только точно понимать известные сцены, но и идентифицировать объекты вне распределения (OOD), которые не встречались во время обучения, избегая неправильной классификации неизвестных объектов как известных классов.
Требования безопасности: Системы автономного вождения должны идентифицировать аномальные объекты на дороге (такие как мусорные баки, знаки, животные и т.д.)
Требования надёжности: Глубокие модели часто дают чрезмерно уверенные, но ошибочные предсказания для входных данных OOD
Практические соображения: В реальных окружениях существует множество классов объектов, не охватываемых обучающими наборами данных
Контролируемые методы: Зависят от вспомогательных наборов данных OOD, которые сложно получить в области LiDAR
Неконтролируемые методы: В основном полагаются на энтропию предсказания, но смешивают эпистемическую и алеаторическую неопределённость
Путаница в неопределённости: Энтропия предсказания объединяет неопределённость модели и шум данных, что приводит к неправильной классификации неоднозначных внутридистрибутивных областей как OOD
Предложен метод обнаружения OOD на основе эпистемической неопределённости: Разделение эпистемической и алеаторической неопределённости через иерархическое байесовское моделирование параметров GMM
Неконтролируемая структура: Не требует вспомогательных данных OOD или дополнительных этапов обучения, повышая практичность
Значительное улучшение производительности: Значительное превосходство над существующими методами на наборе данных SemanticKITTI
Теоретический вклад: Демонстрация преимуществ эпистемической неопределённости перед энтропией предсказания в обнаружении OOD
На основе архитектуры GMMSeg используется глубокая нейронная сеть для извлечения представлений признаков на уровне пикселей z ∈ R^D, затем моделируется условное гауссовское смешанное распределение для каждого семантического класса c:
p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))
где π_k^(c), μ_k^(c), Σ_k^(c) обозначают вес смешивания, среднее значение и ковариацию k-го гауссова компонента соответственно.
Ключевое инновационное решение заключается в иерархическом байесовском моделировании параметров GMM:
Априорные распределения: Установка сопряжённых гауссово-обратно-гамма априорных распределений для среднего значения и дисперсии каждого гауссова компонента
Апостериорное обновление: Обновление апостериорного распределения параметров на основе обучающих данных
Выборка параметров: Выборка нескольких наборов параметров GMM из апостериорного распределения во время вывода
Разделение неопределённости: Прямая оценка эпистемической неопределённости путём выборки параметров, избегая смешивания двух типов неопределённости в энтропии предсказания
Отсутствие необходимости переобучения: Использование пространства признаков существующей сети сегментации, реализация оценки неопределённости через моделирование GMM
Теоретическая основа: На основе теории взаимной информации эпистемическая неопределённость определяется как Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ))
Предложенный метод: Точно идентифицирует истинные объекты OOD (знаки, мусорные баки и т.д.), сохраняя умеренную неопределённость для неоднозначных внутридистрибутивных областей
Deep Ensembles: Производит чрезмерное количество ложноположительных результатов на семантических границах, пропускает истинные объекты OOD
Сравнение распределений энтропии предсказания и эпистемической неопределённости:
Энтропия предсказания показывает значительное перекрытие между образцами внутри и вне распределения
Эпистемическая неопределённость достигает более чёткого разделения, с образцами внутри распределения, сосредоточенными в области низкой неопределённости
Контролируемые методы: Зависят от вспомогательных наборов данных для обучения с использованием выбросов
Неконтролируемые методы: На основе оценки неопределённости, включая детерминированные методы (MSP, ODIN) и байесовские методы (MC Dropout, Deep Ensembles)
Проблема ложноположительных результатов: Может по-прежнему производить высокую неопределённость для семантически неоднозначных или неправильно сегментированных внутридистрибутивных областей
Выбор порога: Зависит от стратегии процентильного порога, которая может быть неприменима ко всем сценариям
Вычислительная сложность: Требует множественной выборки параметров, увеличивая время вывода
В статье цитируются важные работы в соответствующих областях, включая:
GMMSeg 18: Основополагающая работа по генеративной семантической сегментации
Deep Ensembles 16: Классический метод оценки неопределённости
MC Dropout 7: Представительная работа в байесовском глубоком обучении
SemanticKITTI 1: Стандартный набор данных для семантической сегментации LiDAR
Данная статья вносит важный вклад в область обнаружения OOD в семантической сегментации LiDAR, реализуя эффективную оценку эпистемической неопределённости благодаря тщательному техническому проектированию, предоставляя ценное решение для повышения безопасности и надёжности систем автономного вождения.