When applying deep learning models in open-world scenarios, active learning (AL) strategies are crucial for identifying label candidates from a nearly infinite amount of unlabeled data. In this context, robust out-of-distribution (OOD) detection mechanisms are essential for handling data outside the target distribution of the application. However, current works investigate both problems separately. In this work, we introduce SISOM as the first unified solution for both AL and OOD detection. By leveraging feature space distance metrics SISOM combines the strengths of the currently independent tasks to solve both effectively. We conduct extensive experiments showing the problems arising when migrating between both tasks. In these evaluations SISOM underlined its effectiveness by achieving first place in two of the widely used OpenOOD benchmarks and second place in the remaining one. In AL, SISOM outperforms others and delivers top-1 performance in three benchmarks
- ID статьи: 2405.11337
- Название: A Unified Approach Towards Active Learning and Out-of-Distribution Detection
- Авторы: Sebastian Schmidt, Leonard Schenk, Leo Schwinn, Stephan Günnemann
- Категория: cs.CV
- Дата публикации: май 2024 г. (arXiv v3: 12 октября 2025 г.)
- Ссылка на статью: https://arxiv.org/abs/2405.11337
При применении моделей глубокого обучения в открытых сценариях стратегии активного обучения (AL) имеют решающее значение для выявления кандидатов на разметку из больших объемов немаркированных данных. В этом контексте надежные механизмы обнаружения выбросов распределения (OOD) необходимы для обработки данных, выходящих за пределы целевого распределения приложения. Однако существующие работы рассматривают эти две проблемы отдельно. В данной статье представлен SISOM как первое унифицированное решение для AL и обнаружения OOD. Используя метрики расстояния в пространстве признаков, SISOM объединяет преимущества текущих независимых задач для эффективного решения обеих проблем. На эталонном наборе OpenOOD SISOM достиг одного первого места и двух мест в тройке лучших на данных близких OOD, а также показал лучшую производительность в задаче AL.
- Вызовы активного обучения: крупномасштабные модели глубокого обучения требуют большого объема размеченных данных, но стоимость разметки высока, требуется интеллектуальный выбор наиболее ценных образцов для разметки
- Потребность в обнаружении OOD: при практическом развертывании модели встречают данные, выходящие за пределы распределения обучения, требуется надежный механизм обнаружения OOD
- Ограничения независимой обработки: существующие методы рассматривают AL и обнаружение OOD как независимые задачи, что приводит к конфликтующим целям проектирования и сложности системы
- Потребности практического применения: мобильные роботы, автономное вождение и другие практические приложения требуют одновременного решения проблем эффективности разметки и данных вне распределения
- Обнаружение связи задач: авторы наблюдали перекрытие и неоднозначность между данными близких OOD и немаркированными данными в скрытом пространстве
- Преимущества унифицированного подхода: унифицированная обработка может устранить накладные расходы независимых этапов проектирования и избежать конфликтующих целей проектирования
Через визуализацию UMAP авторы обнаружили, что данные близких OOD и немаркированные кандидаты AL расположены близко в пространстве признаков, оба имеют тенденцию находиться между существующими кластерами или вблизи границ решения, что обеспечивает теоретическую основу для унифицированного подхода.
- Первый унифицированный метод: предложен SISOM как первый специально разработанный унифицированный метод для одновременного решения AL и обнаружения OOD
- Техника анализа пространства признаков: введен анализ скрытого пространства для оптимизации цикла уточнения пространства признаков после обучения
- Механизм саморегулирующегося слияния: предложен метод саморегулирующегося слияния мер неопределенности и разнообразия
- Превосходная экспериментальная производительность: достигнута превосходная производительность против высокоспециализированных методов на общих эталонах AL и OOD для изображений
Активное обучение: начиная с начального размеченного пула L и немаркированного пула U, модель f через стратегию запроса Q(x,f) выбирает новые образцы A для разметки, цель - достичь лучшей производительности с минимальной разметкой.
Обнаружение OOD: для модели f, обученной на распределении Ω, определить, является ли тестовый образец x̃ внутри распределения (InD) или вне распределения (OOD):
G(x,f)={InDOODесли S(x;f)≥λесли S(x;f)<λ
SISOM содержит пять основных компонентов:
Построение информативного представления пространства признаков путем соединения нескольких слоев сети:
z=h1(x)⊕⋯⊕hj(x)⊕⋯⊕hn(x)
Использование взвешивания признаков градиентом дивергенции Кульбака-Лейблера:
g=∂z∂DKL(u∣∣f(x))z~=σ(z⊙g)
где u - равномерное распределение, ⊙ обозначает произведение Адамара.
Определение внутриклассового и межклассового расстояний:
din(z~)=minz′∈ZL(c′=c)∣∣z~−z~′∣∣2dout(z~)=minz′∈ZL(c′=c)∣∣z~−z~′∣∣2
Оценка SISOM:
r(x)=doutdin
Вычисление среднего отношения расстояний как прокси разделимости пространства признаков:
ravg=∣L∣1∑z∈Ldout(σ(z⊙g))din(σ(z⊙g))
Адаптивное слияние неопределенности и разнообразия:
r^i=min(ravg,1)⋅Ei+max(1−ravg,0)⋅ri
Оптимизация параметра крутизны сигмоиды α для каждого слоя для улучшения разделимости пространства признаков:
αopt=argminαravg(α)
- Унифицированный дизайн метрики: отношение расстояний одновременно захватывает требования AL и обнаружения OOD
- Адаптивное слияние: автоматическое балансирование неопределенности и разнообразия в зависимости от качества пространства признаков
- Интеграция многослойных признаков: использование информации из нескольких слоев сети для улучшения представления
- Взвешивание градиентом: выделение важных нейронов через градиент дивергенции Кульбака-Лейблера
Активное обучение:
- CIFAR-10/100: размер запроса q=1000/2000
- SVHN: размер запроса q=500
- Использование архитектур ResNet18/34
Обнаружение OOD:
- Соответствие установкам эталонного набора OpenOOD
- CIFAR-10: близкие OOD (CIFAR-100, Tiny ImageNet), дальние OOD (MNIST, SVHN и т.д.)
- CIFAR-100: близкие OOD (CIFAR-10, Tiny ImageNet), дальние OOD (MNIST, SVHN и т.д.)
- ImageNet-1k: близкие OOD (SSB-hard, NINCO), дальние OOD (iNaturalist и т.д.)
- Активное обучение: точность классификации в зависимости от процента размеченных данных
- Обнаружение OOD: AUROC (площадь под кривой ROC)
Базовые методы активного обучения:
- CoreSet, Badge, Learning Loss, CoreGCN
- Полусупервизированные установки: TypiClust, ProbCover, PT4AL
Базовые методы обнаружения OOD:
- NAC, KNN, MSP, Energy, ReAct, SCALE и 17 других методов
- CIFAR-10: SISOM и SISOMe превосходят другие методы во всех циклах выбора
- CIFAR-100: достигают наивысшей производительности на поздних этапах выбора
- Полусупервизированная установка: SISOM значительно выигрывает от предварительного обучения, превосходя PT4AL
| Набор данных | SISOMe | SISOM | Лучший базовый метод |
|---|
| CIFAR-10 (близкие OOD) | 91.76 | 91.40 | 91.13 |
| CIFAR-100 (близкие OOD) | 81.10 | 79.42 | 81.31 |
| ImageNet (близкие OOD) | 78.59 | 77.33 | 95.22 |
Общий рейтинг: SISOMe получил место в тройке лучших на всех трех эталонах, общий рейтинг - первое место.
- Оптимальная крутизна сигмоиды: улучшение производительности на CIFAR-100 и ImageNet
- Сокращение выбора подмножества: значительное увеличение скорости вывода с небольшим улучшением производительности
- Эффект улучшения признаков: взвешивание градиентом дивергенции Кульбака-Лейблера значительно улучшает разделимость пространства признаков
| Метод | SISOM | SISOMe | Badge | CoreSet |
|---|
| Время (сек) | 1477±896 | 954±126 | 33664±6682 | 2604±1572 |
При выборе 5% подмножества время выполнения SISOMe сокращается до 266 секунд с небольшим улучшением производительности.
Использование контрольных точек, обученных AL, для обнаружения OOD, SISOMe достигает лучшей производительности как на близких, так и на дальних OOD, подтверждая эффективность унифицированного подхода.
- Методы неопределенности: Monte Carlo Dropout, методы ансамбля
- Методы разнообразия: CoreSet, Badge и другие методы на основе градиентов
- Гибридные методы: методы, объединяющие неопределенность и разнообразие
- Методы предварительной обработки: увеличение данных, смешанное обучение
- Методы постобработки: фильтрация нейронов, операции с весами
- Методы на основе логитов: масштабирование температуры, оценка энергии
- Методы пространства признаков: расстояние Махаланобиса, k-ближайшие соседи
Существующие методы в основном используют независимые модули для обработки AL и OOD, данная работа впервые исследует внутреннюю связь между двумя задачами.
- Осуществимость унификации: впервые доказано, что AL и обнаружение OOD могут быть эффективно решены единым методом
- Превосходство производительности: достигнута или приближена передовая производительность на обеих задачах
- Практическая ценность: упрощена сложность развертывания в практических приложениях
- Вычислительная сложность: вычисление расстояний приносит дополнительные накладные расходы, хотя это можно смягчить выбором подмножества
- Зависимость от пространства признаков: производительность метода зависит от разделимости пространства признаков
- Чувствительность к гиперпараметрам: параметр крутизны сигмоиды требует настройки для разных наборов данных
- Активное обучение в открытом наборе: расширение унифицированного метода на сценарии открытого AL
- Сложные задачи: расширение на более сложные задачи, такие как обнаружение объектов и семантическая сегментация
- Разнообразие пакетов: исследование влияния техник разнообразия пакетов на методы двойной задачи
- Высокая инновационность: впервые предложен унифицированный метод для AL и обнаружения OOD, имеет важное теоретическое и практическое значение
- Умное проектирование метода: дизайн отношения расстояний одновременно прост и эффективен, механизм адаптивного слияния отражает глубокие идеи
- Полные эксперименты: охватывают несколько наборов данных и базовых методов, включают абляционные исследования и анализ времени выполнения
- Прочная теоретическая основа: визуализационный анализ раскрывает внутреннюю связь между двумя задачами
- Недостаточный теоретический анализ: отсутствуют теоретические гарантии сходимости и способности обобщения метода
- Ограничения области применения: в основном проверено на задачах классификации изображений, применимость в других областях неизвестна
- Сложность настройки параметров: несколько гиперпараметров требуют настройки для разных наборов данных, что может повлиять на практичность
- Академический вклад: открывает новое направление унифицированного исследования AL и обнаружения OOD
- Практическая ценность: имеет важное значение для практических приложений, таких как мобильные роботы и автономное вождение
- Воспроизводимость: предоставляет подробные детали реализации и код, облегчает воспроизведение и расширение
- Среды с ограниченными ресурсами: приложения, требующие одновременного рассмотрения эффективности разметки и обнаружения выбросов распределения
- Системы реального времени: через выбор подмножества можно повысить эффективность при сохранении производительности
- Приложения открытого мира: автономное вождение, навигация роботов и другие сценарии, сталкивающиеся с изменением распределения
Статья цитирует большое количество связанных работ, в основном включая:
- Active Learning: Settles (2010), Sener & Savarese (2018), Ash et al. (2020)
- OOD Detection: Yang et al. (2022), Liu et al. (2020), Sun et al. (2022)
- OpenOOD Benchmark: Yang et al. (2022), Zhang et al. (2023)
Общая оценка: это высококачественная исследовательская статья, предлагающая инновационный унифицированный метод для решения двух важных проблем, с достаточной экспериментальной верификацией, имеющая важное значение для продвижения соответствующей области. Несмотря на некоторые недостатки в теоретическом и практическом аспектах, её пионерский вклад и превосходная производительность делают её важной работой в этой области.