2025-11-30T15:19:19.202119

Conformal Object Detection by Sequential Risk Control

andÃ©ol, Mossina, Mazoyer et al.

Recent advances in object detectors have led to their adoption for industrial uses. However, their deployment in safety-critical applications is hindered by the inherent lack of reliability of neural networks and the complex structure of object detection models. To address these challenges, we turn to Conformal Prediction, a post-hoc predictive uncertainty quantification procedure with statistical guarantees that are valid for any dataset size, without requiring prior knowledge on the model or data distribution. Our contribution is manifold. First, we formally define the problem of Conformal Object Detection (COD). We introduce a novel method, Sequential Conformal Risk Control (SeqCRC), that extends the statistical guarantees of Conformal Risk Control to two sequential tasks with two parameters, as required in the COD setting. Then, we present old and new loss functions and prediction sets suited to applying SeqCRC to different cases and certification requirements. Finally, we present a conformal toolkit for replication and further exploration of our method. Using this toolkit, we perform extensive experiments that validate our approach and emphasize trade-offs and other practical consequences.

academic

Конформное обнаружение объектов посредством последовательного контроля риска

Основная информация

ID статьи: 2505.24038
Название: Conformal Object Detection by Sequential Risk Control
Авторы: Léo Andéol, Luca Mossina, Adrien Mazoyer, Sébastien Gerchinovitz
Учреждения: Univ Toulouse (Institut de Mathématiques de Toulouse), SNCF, IRT Saint Exupéry
Классификация: stat.ML, cs.CV, cs.LG
Время подачи: май 2025 г. (v2: 31 октября 2025 г.)
Ссылка на статью: https://arxiv.org/abs/2505.24038
Ссылка на код: https://github.com/leoandeol/cods

Аннотация

Модели обнаружения объектов становятся все более распространенными в промышленных приложениях, но при развертывании в системах, критичных по безопасности, сталкиваются с проблемой недостаточной надежности, присущей нейронным сетям. В данной работе используется метод конформного предсказания (Conformal Prediction), обеспечивающий апостериорную квантификацию неопределенности со статистическими гарантиями, действительными для произвольных размеров наборов данных, без предварительного знания модели или распределения данных. Основные вклады включают: (1) формальное определение задачи конформного обнаружения объектов (COD); (2) предложение метода Sequential Conformal Risk Control (SeqCRC), расширяющего статистические гарантии конформного контроля риска на последовательные задачи, требующие двух параметров; (3) предложение функций потерь и наборов предсказаний, применимых к различным сценариям; (4) предоставление инструментария с открытым исходным кодом и проведение крупномасштабной экспериментальной проверки.

Исследовательский контекст и мотивация

Основная проблема

Обнаружение объектов широко применяется в критичных по безопасности областях, таких как автономное вождение и медицинская визуализация, но сталкивается со следующими проблемами:

Проблемы надежности: нейронные сети не имеют гарантий интерпретируемости и надежности
Проблемы сложности: обнаружение объектов включает две задачи — локализацию и классификацию, причем количество объектов в каждом изображении неизвестно
Требования сертификации: системы, критичные по безопасности, требуют статистических гарантий для предсказаний

Важность исследования

Промышленность все больше требует сертификации систем ИИ
Существующие методы квантификации неопределенности в основном являются эвристическими или байесовскими, не имея гарантий на конечных выборках
Сложность обнаружения объектов затрудняет установление единой теоретической базы

Ограничения существующих методов

Эвристические методы (например, MetaDetect): отсутствуют теоретические гарантии
Байесовские методы (например, BayesOD): вычислительная сложность, требуют предположений о распределении
Существующие конформные методы:
- Большинство обрабатывают только задачу локализации 14,15,16
- Ориентированы на конкретные семейства моделей (например, Faster R-CNN) 17
- Отсутствует единая база для одновременной обработки уверенности, локализации и классификации

Исследовательская мотивация

Предоставить модель-независимый, распределение-свободный, статистически действительный фреймворк, обеспечивающий гарантии для полного процесса обнаружения объектов на конечных выборках.

Основные вклады

Теоретический вклад: предложение метода Sequential Conformal Risk Control (SeqCRC)
- Расширение CRC на последовательную установку с параметрами 1+2
- Гарантии на конечных выборках, требующие только одного разбиения данных (в отличие от 25, требующего двух разбиений)
- Строгое теоретическое доказательство (Теорема 2)
Методологический вклад: разработка полного процесса конформного обнаружения объектов
- Калибровка порога уверенности (λ^cnf)
- Границы ошибки локализации (λ^loc)
- Наборы предсказаний классификации (λ^cls)
Практический вклад: предоставление множества функций потерь и наборов предсказаний
- Функции потерь уверенности: box-count-threshold, box-count-recall
- Функции потерь локализации: thresholded, boxwise, pixelwise
- Методы классификации: LAC, APS
- Стратегии сопоставления: Hausdorff, LAC, GIoU, Mix
Инструментальный вклад: открытый инструментарий COD
- Поддержка множества популярных детекторов (YOLO, DETR и т.д.)
- Полный код для воспроизведения экспериментов
- Инструменты визуализации

Подробное описание метода

Определение задачи

Пространство входов: $\mathcal{X}$ (пространство изображений)

Пространство выходов:

Пространство ограничивающих прямоугольников: $\mathcal{B} = \mathbb{R}^4_+$ , где $b = (b_\leftarrow, b_\uparrow, b_\rightarrow, b_\downarrow)$
Пространство классов: $\mathcal{C} = \{1, \ldots, K\}$
Истинные метки: $y \in (\mathcal{B} \times \mathcal{C})^{|y|}$ (последовательность переменной длины)

Детектор: $f: \mathcal{X} \to (\mathcal{B} \times \Sigma^{K-1} \times [0,1])^{N^{\text{nms}}}$

Выходные ограничивающие прямоугольники, оценки softmax и уверенность
Включает постобработку NMS

Цель: калибровка трех параметров для контроля риска

$\lambda^{\text{cnf}} \in \Lambda^{\text{cnf}}$ : порог уверенности
$\lambda^{\text{loc}} \in \Lambda^{\text{loc}}$ : граница локализации
$\lambda^{\text{cls}} \in \Lambda^{\text{cls}}$ : порог классификации

Основной алгоритм SeqCRC

Первый этап: калибровка уверенности

Определение консервативного эмпирического риска: $\tilde{R}^{\text{cnf}}_n(\lambda^{\text{cnf}}) = \max\{R^{\text{cnf}}_n(\lambda^{\text{cnf}}), R^{\text{loc}}_n(\lambda^{\text{cnf}}, \bar{\lambda}^{\text{loc}}), R^{\text{cls}}_n(\lambda^{\text{cnf}}, \bar{\lambda}^{\text{cls}})\}$

Вычисление двух оценок: $\lambda^{\text{cnf}}_+ = \inf\left\{\lambda^{\text{cnf}}: \frac{n\tilde{R}^{\text{cnf}}_n(\lambda^{\text{cnf}})}{n+1} + \frac{\tilde{B}^{\text{cnf}}}{n+1} \leq \alpha^{\text{cnf}}\right\}$

$\lambda^{\text{cnf}}_- = \inf\left\{\lambda^{\text{cnf}}: \frac{n\tilde{R}^{\text{cnf}}_n(\lambda^{\text{cnf}})}{n+1} \leq \alpha^{\text{cnf}}\right\}$

где $\tilde{B}^{\text{cnf}} = \max\{B^{\text{cnf}}, B^{\text{loc}}, B^{\text{cls}}\}$

Инновационные моменты:

$\lambda^{\text{cnf}}_+$ используется для тестирования при выводе
$\lambda^{\text{cnf}}_-$ используется для калибровки второго этапа (обеспечивает осуществимость)
$\tilde{R}^{\text{cnf}}_n$ учитывает влияние последующих задач

Второй этап: калибровка локализации и классификации

Для $\bullet \in \{\text{loc}, \text{cls}\}$ : $\lambda^\bullet_+ = \inf\left\{\lambda^\bullet: \frac{nR^\bullet_n(\lambda^{\text{cnf}}_-, \lambda^\bullet)}{n+1} + \frac{B^\bullet}{n+1} \leq \alpha^\bullet\right\}$

Ключевая техника: использование "оптимистичной" оценки $\lambda^{\text{cnf}}_-$ для реализации симметрии

Теоретические гарантии

Теорема 2 (основной результат): При Предположении 1 (данные i.i.d.) и Предположении 3 (монотонность потерь), если $\alpha^{\text{cnf}} \geq 0$ и $\alpha^\bullet \geq \alpha^{\text{cnf}} + \frac{B^\bullet}{n+1}$ , то:

$\mathbb{E}[L^\bullet_{\text{test}}(\lambda^{\text{cnf}}_+, \lambda^\bullet_+)] \leq \alpha^\bullet$

Если дополнительно предположить $L^{\text{cnf}}_i(\bar{\lambda}^{\text{cnf}}) \leq \alpha^{\text{cnf}}$ , то: $\mathbb{E}[L^{\text{cnf}}_{\text{test}}(\lambda^{\text{cnf}}_+)] \leq \alpha^{\text{cnf}}$

Следствие 1 (совместная гарантия): $\mathbb{E}[\max(L^{\text{loc}}_{\text{test}}(\lambda^{\text{cnf}}_+, \lambda^{\text{loc}}_+), L^{\text{cls}}_{\text{test}}(\lambda^{\text{cnf}}_+, \lambda^{\text{cls}}_+))] \leq \alpha^{\text{tot}}$

где $\alpha^{\text{tot}} = \alpha^{\text{loc}} + \alpha^{\text{cls}}$

Проектирование функций потерь

Функции потерь уверенности

box-count-threshold: $L^{\text{cnf}}_{\text{box-count-threshold}}(\lambda^{\text{cnf}}) = \mathbb{1}_{|\Gamma^{\text{cnf}}_{\lambda^{\text{cnf}}}(x)| < |y|}$
box-count-recall (ослабленная версия): $L^{\text{cnf}}_{\text{box-count-recall}}(\lambda^{\text{cnf}}) = \frac{(|y| - |\Gamma^{\text{cnf}}_{\lambda^{\text{cnf}}}(x)|)_+}{|y|}$

Функции потерь локализации

boxwise recall: $L^{\text{loc}}_{\text{box}}(\lambda^{\text{cnf}}, \lambda^{\text{loc}}) = 1 - \frac{|\{b_j \in y: b_j \subseteq \hat{b}^{\lambda^{\text{loc}}}_{\pi_x(j)}\}|}{|y|}$
pixelwise (более ослабленная): $L^{\text{loc}}_{\text{pix}}(\lambda^{\text{cnf}}, \lambda^{\text{loc}}) = 1 - \frac{1}{|y|}\sum_{b_j \in y} \frac{\text{area}(b_j \cap \hat{b}^{\lambda^{\text{loc}}}_{\pi_x(j)})}{\text{area}(b_j)}$

Функции потерь классификации

$L^{\text{cls}}(\lambda^{\text{cnf}}, \lambda^{\text{cls}}) = \frac{1}{|y|}\sum_{c_j \in y} \mathbb{1}_{c_j \notin \Gamma^{\text{cls}}_{\lambda^{\text{cnf}}, \lambda^{\text{cls}}}(x)_{\pi_x(j)}}$

Конструкция наборов предсказаний

Наборы предсказаний локализации

аддитивная граница: $\Gamma^{\text{loc}}_{\lambda^{\text{cnf}}, \lambda^{\text{loc}}}(x)_k = \hat{b}_k + (-\lambda^{\text{loc}}, -\lambda^{\text{loc}}, \lambda^{\text{loc}}, \lambda^{\text{loc}})$
мультипликативная граница (адаптивная): $\Gamma^{\text{loc}}_{\lambda^{\text{cnf}}, \lambda^{\text{loc}}}(x)_k = \hat{b}_k + \lambda^{\text{loc}}(-\hat{w}_k, -\hat{h}_k, \hat{w}_k, \hat{h}_k)$

Наборы предсказаний классификации

LAC (Least Ambiguous Classifier): $\Gamma^{\text{cls}}_{\lambda^{\text{cnf}}, \lambda^{\text{cls}}}(x)_k = \{\kappa \in \mathcal{C}: \hat{c}_k(\kappa) \geq 1-\lambda^{\text{cls}}\}$
APS (Adaptive Prediction Sets): $\Gamma^{\text{cls}}_{\lambda^{\text{cnf}}, \lambda^{\text{cls}}}(x)_k = \{\kappa_{[1]}, \ldots, \kappa_{[\hat{m}(\lambda^{\text{cls}})]}\}$ где $\hat{m}(\lambda^{\text{cls}}) = \min\{m: \sum_{l=1}^m \hat{c}_k(\kappa_{[l]}) > \lambda^{\text{cls}}\}$

Стратегии сопоставления

Определение функции расстояния $d: (\mathcal{B} \times \mathcal{C}) \times (\mathcal{B} \times \Sigma^{K-1}) \to \mathbb{R}_+$ :

расстояние Хаусдорфа (локализация): $d_{\text{haus}}(b, \hat{b}) = \max\{\hat{b}_\leftarrow - b_\leftarrow, \hat{b}_\uparrow - b_\uparrow, b_\rightarrow - \hat{b}_\rightarrow, b_\downarrow - \hat{b}_\downarrow\}$
расстояние LAC (классификация): $d_{\text{LAC}}(c, \hat{c}) = 1 - \hat{c}_c$
смешанное расстояние: $d_{\text{mix}}((b,c), (\hat{b}, \hat{c})) = \tau d_{\text{LAC}}(c, \hat{c}) + (1-\tau)d_{\text{haus}}(b, \hat{b})$

Техника монотонизации

Поскольку процесс сопоставления может привести к немонотонности потерь по $\lambda^{\text{cnf}}$ , в алгоритме используется: $\sup_{\lambda' \geq \lambda^{\text{cnf}}} L^\bullet_i(\lambda', \lambda^\bullet)$ вместо исходных потерь, вычисляемых в режиме реального времени для обеспечения эффективности.

Экспериментальная установка

Наборы данных

Набор валидации MS-COCO: 5000 изображений
- Набор калибровки: 2500 изображений (n=2500)
- Набор тестирования: 2500 изображений
80 классов повседневных объектов
Порог NMS: IoU=0.5
Предварительная фильтрация уверенности: >0.001 (независимо от данных)

Модели

DETR-101 (60M параметров)
- Детектор на основе Transformer
- Обучение end-to-end
YOLOv8x (68M параметров)
- Одноэтапный детектор
- Последняя серия YOLO

Обе модели предварительно обучены, подчеркивая модель-независимость метода.

Метрики оценки

Метрики риска

j-Risk: $\frac{1}{n_{\text{test}}}\sum_{i=1}^{n_{\text{test}}} L^j_{\text{test},i}(\lambda^j_+)$
Global Risk: $\frac{1}{n_{\text{test}}}\sum_{i=1}^{n_{\text{test}}} \max\{L^{\text{loc}}_{\text{test},i}, L^{\text{cls}}_{\text{test},i}\}$
Сравнение с целевыми $\alpha^j$ или $\alpha^{\text{tot}}$

Метрики размера набора

Размер набора уверенности: среднее количество предсказанных прямоугольников $\frac{1}{n_{\text{test}}}\sum_{i=1}^{n_{\text{test}}} |\Gamma^{\text{cnf}}_{\lambda^{\text{cnf}}_+}(X_{\text{test},i})|$
Размер набора локализации (Stretch): $\frac{1}{n_{\text{test}}}\sum_{i=1}^{n_{\text{test}}} \frac{1}{n_{\text{test},i}}\sum_{k} \sqrt{\frac{\text{area}(\hat{b}^{\lambda^{\text{loc}}_+}_k)}{\text{area}(\hat{b}_k)}}$
Размер набора классификации: среднее количество классов $\frac{1}{n_{\text{test}}}\sum_{i=1}^{n_{\text{test}}} \frac{1}{n_{\text{test},i}}\sum_k |\hat{c}^{\lambda^{\text{cls}}_+}_k|$

Конфигурация экспериментов

Уровни риска:
- $\alpha^{\text{tot}}=0.1$ : $\alpha^{\text{cnf}}=0.02, \alpha^{\text{loc}}=0.05, \alpha^{\text{cls}}=0.05$
- $\alpha^{\text{tot}}=0.2$ : $\alpha^{\text{cnf}}=0.03, \alpha^{\text{loc}}=0.10, \alpha^{\text{cls}}=0.10$
Параметр смешанного расстояния: $\tau=0.25$
Оборудование: одна видеокарта NVIDIA RTX 4090
Время выполнения: примерно 20 минут на эксперимент

Результаты экспериментов

Основные результаты (Таблица I, DETR-101, α_tot=0.1)

Задача	Установка	Размер набора	Риск задачи	Глобальный риск
Уверенность	box_count_threshold	25.588	0.022	0.086
	box_count_recall	17.778	0.019	0.085
Локализация	thresholded	1.552	0.046	0.097
	boxwise	1.504	0.049	0.097
	pixelwise	1.043	0.047	0.096
Граница локализации	additive	1.047	0.052	0.100
	multiplicative	1.043	0.047	0.096
Классификация	aps	1.007	0.050	0.082
	lac	0.994	0.051	0.087

Ключевые выводы:

Эффективный контроль риска: все эксперименты имеют риск ≤ целевого уровня
Ослабленные потери лучше: потеря pixelwise производит наименьшую границу локализации (1.043 vs 1.552)
Компактные наборы классификации: в среднем требуется только 0.994-1.007 класса
Консервативный глобальный риск: 0.082-0.100 < 0.1, есть место для улучшения

Сравнение функций сопоставления (Таблица II)

Сопоставление	α_tot	Размер уверенности	Размер локализации	Размер классификации
GIoU	0.1	17.778	28.241	44.471
	0.2	14.046	23.690	32.335
Hausdorff	0.1	25.588	1.043	41.846
	0.2	14.046	0.999	22.035
LAC	0.1	25.588	14.147	0.994
	0.2	22.657	7.786	0.653
Mix	0.1	25.588	1.334	8.228
	0.2	22.657	1.018	0.931

Ключевые выводы:

Mix оптимален: достигает лучшего баланса между локализацией и классификацией
GIoU неудачен: несогласованность с последующими потерями приводит к чрезмерной коррекции
Специализированные расстояния эффективны: Hausdorff оптимизирует локализацию, LAC оптимизирует классификацию
Нелинейное влияние уровня риска: при увеличении α с 0.1 до 0.2 размер набора классификации резко меняется

Проверка модель-независимости (Таблица III, α_tot=0.1)

Метрика	DETR	YOLOv8
Уверенность (box_count_threshold)
Риск	0.022	0.012
Размер	25.588	18.855
Локализация (pixelwise)
Риск	0.047	0.049
Размер	1.043	3.867
Классификация (lac)
Риск	0.051	0.049
Размер	0.994	0.717

Ключевые наблюдения:

Универсальные гарантии: риск контролируется для обеих моделей
Различия в производительности: YOLO предсказывает меньше, но требует большей коррекции локализации
Различные компромиссы: DETR имеет более точную локализацию, YOLO более уверен в классификации
Эффективность метода: подтверждает модель-независимость

Абляционные эксперименты

Влияние уровня риска (α_tot: 0.1 vs 0.2)

Из сравнения Таблиц V и VI:

Размер локализации: 1.043 → 1.018 (Mix, DETR)
Размер классификации: 8.228 → 0.931 (Mix, DETR)
Риск: 0.096 → ~0.15

Вывод: больший α позволяет более компактные наборы, но отношение нелинейно

Эксперимент с количеством границ (Таблица IV)

Количество границ	Значение границы (пиксели)	Покрытие	Размер набора
1 (равномерная)	11.88	96.30%	142
2 (ширина-высота)	19.58, 16.18	97.43%	145
4 (каждая граница)	26.34, 24.89, 28.11, 14.30	97.99%	151

Выводы: коррекция Бонферрони дорогостояща, единая граница более эффективна

Анализ конкретных случаев

Успешные случаи (Рис. 6, 9):

Обнаружение медведя и башни с часами: единственный класс в наборе, малая граница локализации
Обнаружение самолета: несмотря на дополнительные предсказания, истинное значение покрыто (гарантия полноты)

Неудачные случаи (Рис. 11):

Несогласованность аннотаций: книги иногда аннотируются отдельно, иногда вместе
Неясные определения: скульптура помечена как "человек"
Ложные срабатывания: луна предсказана как воздушный змей (гарантия полноты позволяет это)

Распределительная статистика (Рис. 7, 12)

Распределение размера набора: распределение с тяжелыми хвостами, большинство экспериментов производят малые наборы, несколько экстремально больших
Распределение количества объектов: после калибровки распределение ближе к истинному
Влияние монотонизации (Рис. 4): исходные потери немонотонны, после монотонизации немного консервативнее

Связанные работы

Конформное предсказание для обнаружения объектов

Только локализация:
- 14 de Grancey et al. (2022): расстояние Хаусдорфа, аддитивная граница
- 15,16 Andéol et al. (2023,2024): приложения к железнодорожным сигналам
Специфичные для модели:
- 17 Li et al. (2022): PAC гарантии для Faster R-CNN
- 18 Blot et al. (2024): контроль точности-полноты для медицинской визуализации
Классификация + локализация:
- 24 Timans et al. (2025): коррекция локализации с условием по классу
- Данная работа: единая база, модель-независимая

Последовательное конформное предсказание

25 Xu et al. (2024): двухэтапный CRC для поиска с рейтингом
- Отличие: требует двух разбиений данных или асимптотических гарантий
- Преимущество данной работы: одно разбиение + гарантии на конечных выборках

Фреймворк Learn-Then-Test

22 Angelopoulos et al. (2025): LTT для многопараметрических задач
- Применение к языковым моделям 26 и медицинскому OD 18
- Данная работа использует другую последовательную стратегию

Другие методы квантификации неопределенности

Эвристические:
- MetaDetect 10: метасеть для оценки IoU
- 27: калибровка уверенности с учетом позиции
Байесовские:
- BayesOD 8: байесовское слияние вместо NMS
- 7: выборка Dropout для оценки неопределенности

Заключение и обсуждение

Основные выводы

Теоретический вклад: SeqCRC обеспечивает гарантии на конечных выборках для последовательных задач с параметрами 1+2
Практическая эффективность: проверена на DETR и YOLO, контроль риска точен
Гибкая база: поддерживает множество функций потерь, наборов предсказаний и стратегий сопоставления
Инструментальная поддержка: открытый инструментарий способствует воспроизведению и расширению

Ограничения

На уровне метода

Контроль только полноты: точность (ложные срабатывания) не может быть напрямую контролируема
- Причина: точность немонотонна по параметрам
- Влияние: может производить дополнительные предсказания (Рис. 8, 11)
Зависимость от аннотаций:
- Аннотации MS-COCO несогласованны (отдельные vs совокупные)
- Если истинное значение ошибочно, коррекция может быть чрезмерной
Стоимость монотонизации:
- Сопоставление и потери не полностью согласованы, приводя к немонотонности
- Монотонизация делает предсказания немного консервативнее
Консервативность глобального риска:
- Следствие 1 использует max{a,b} ≤ a+b
- Фактический риск намного ниже αtot, есть место для улучшения

На уровне экспериментов

Ограничение набора данных: только валидация MS-COCO
Выбор моделей: только DETR и YOLO из двух семейств
Вычислительная стоимость: монотонизация требует 20 минут/эксперимент

Будущие направления

Теоретические расширения

Контроль точности: исследование обработки немонотонных потерь
Условные гарантии: гарантии с условием по классу или тесту
Более плотные границы: улучшение аддитивной границы в Следствии 1

Улучшения метода

Адаптивные границы: интеграция оценок неопределенности из BayesOD
Лучшее сопоставление: проектирование функций расстояния, согласованных с потерями
Многозадачная оптимизация: совместная оптимизация трех параметров

Расширение приложений

Другие задачи обнаружения: 3D обнаружение, сегментация экземпляров
Онлайн обучение: динамическая калибровка для потоковых данных
Промышленная сертификация: интеграция со стандартами (например, DO-178C)

Глубокая оценка

Преимущества

Теоретическая строгость

Инновационная теория: первое решение последовательного CRC с параметрами 1+2
- Одно разбиение данных
- Гарантии на конечных выборках
- Строгие доказательства (Теорема 2, Лемма 1)
Техника симметрии: введение λ^cnf_- остроумно
- Обеспечивает осуществимость второго этапа
- Сохраняет симметрию для вычисления математического ожидания
Эффективная монотонизация: вычисление в реальном времени

Полнота метода

End-to-end фреймворк: охватывает полный процесс OD
- Пороги уверенности
- Коррекция локализации
- Наборы классификации
Модель-независимость: применимо к любому детектору
- DETR (Transformer)
- YOLO (одноэтапный)
- Теоретически поддерживает Faster R-CNN и т.д.
Богатые варианты:
- 6 функций потерь
- 4 стратегии сопоставления
- 2 типа границ локализации
- 2 метода классификации

Достаточность экспериментов

Крупномасштабный бенчмарк: сотни конфигураций экспериментов
Многомерный анализ:
- Сравнение функций потерь
- Влияние стратегий сопоставления
- Проверка модель-независимости
- Влияние уровней риска
Богатая визуализация: анализ успешных/неудачных случаев

Практическая ценность

Открытый инструментарий: полностью воспроизводимо
Вычислительная эффективность: практически без дополнительных затрат при выводе
Plug-and-play: без необходимости переобучения

Недостатки

Теоретические ограничения

Гарантии математического ожидания:
- Не поточечные гарантии
- Может не выполняться для конкретного тестового изображения
- 55 доказывает невозможность test-conditionality
Строгие предположения:
- Предположение i.i.d. для данных
- Использование набора валидации как набора калибровки может нарушить независимость
- Монотонность потерь требует техники монотонизации
Консервативность:
- Слабая граница для глобального риска
- Коррекция типа Бонферрони

Методологические недостатки

Проблема точности:
- Невозможно контролировать ложные срабатывания
- В практических приложениях может производить чрезмерно много предсказаний
- Требует постобработки или эвристических фильтров
Чувствительность к аннотациям:
- Серьезная несогласованность в MS-COCO
- Требует высококачественных аннотаций
- Хрупкость к ошибкам аннотирования
Дилемма сопоставления:
- Сложно унифицировать расстояния локализации и классификации
- Параметр τ в Mix требует настройки
- Отказ GIoU показывает критичность проектирования расстояния

Недостаточность экспериментов

Единственный набор данных:
- Только MS-COCO
- Отсутствуют специализированные области (медицина, автономное вождение)
- Не тестирована смещение распределения
Ограниченные модели:
- Только 2 архитектуры
- Отсутствуют Faster R-CNN, RetinaNet и т.д.
- Не тестированы малые модели
Неполная абляция:
- Влияние параметра τ не детально исследовано
- Влияние размера набора калибровки не проанализировано
- Влияние различных порогов NMS не тестировано
Отсутствие сравнений:
- Нет прямого численного сравнения с 17,18,24
- Нет сравнения с байесовскими методами по вычислительной стоимости

Влияние

Академический вклад

Теоретический прорыв: первый метод конечных выборок для последовательного CRC
Единая база: первый конформный метод, охватывающий полный процесс OD
Потенциал цитирования:
- Сообщество конформного предсказания: теоретическая инновация
- Компьютерное зрение: практический инструмент
- Безопасность ИИ: метод сертификации

Практическая ценность

Промышленные приложения:
- Автономное вождение: критичные по безопасности решения
- Медицинская визуализация: вспомогательная диагностика
- Железнодорожные системы: уже применяется 15,16
Поддержка сертификации:
- Предоставление статистических гарантий
- Соответствие стандартам типа DO-178C
- Снижение затрат на сертификацию
Удобство использования:
- Без необходимости переобучения
- Низкая вычислительная стоимость
- Хорошо разработанный открытый инструментарий

Воспроизводимость

Открытый код: https://github.com/leoandeol/cods
Полная документация:
- Псевдокод алгоритмов (Алгоритмы 1-4)
- Детальные настройки экспериментов
- Обширные дополнительные материалы
Инструментальная поддержка:
- Интеграция множества моделей
- Инструменты визуализации
- Легко расширяемо

Применимые сценарии

Идеальные сценарии

Системы, критичные по безопасности:
- Требуют статистических гарантий
- Допускают консервативные предсказания
- Высокое качество аннотаций
Развертывание предварительно обученных моделей:
- Невозможно переобучить
- Требуется быстрая адаптация
- Имеется небольшое количество аннотированных данных
Задачи, приоритизирующие полноту:
- Высокая стоимость пропусков
- Приемлемы ложные срабатывания
- Например, медицинский скрининг

Неподходящие сценарии

Критичная точность:
- Высокая стоимость ложных срабатываний
- Например, фильтрация спама
- Требуется дополнительный метод
Ненадежные аннотации:
- Краудсорсинг
- Неясные определения
- Требуется предварительная очистка данных
Системы реального времени:
- Время калибровки (20 мин) может быть чрезмерным
- Время вывода приемлемо
- Требуется офлайн калибровка
Малые наборы данных:
- n=2500 может быть недостаточно
- Гарантии более консервативны
- Требуется компромисс

Ссылки

Основные методы

13 Vovk et al. (2005): Algorithmic learning in a random world - основы конформного предсказания
53 Angelopoulos et al. (2024): Conformal risk control - метод CRC
22 Angelopoulos et al. (2025): Learn then test - фреймворк LTT

Конформное предсказание для OD

14 de Grancey et al. (2022): первый конформный метод для OD
15,16 Andéol et al. (2023,2024): приложения к железнодорожным сигналам
17 Li et al. (2022): PAC многообъектное обнаружение
24 Timans et al. (2025): двухэтапное конформное (независимая работа)

Модели обнаружения

38-40 Серия YOLO: одноэтапные детекторы
43 DETR: детектор на основе Transformer
42 Faster R-CNN: двухэтапный детектор

Квантификация неопределенности

7,8 BayesOD: байесовский метод
10 MetaDetect: эвристический метод
27 Küppers et al.: калибровка уверенности

Общая оценка

Данная работа представляет собой важный теоретический и практический прорыв в применении конформного предсказания к обнаружению объектов. Метод SeqCRC элегантно решает проблему гарантий на конечных выборках для многопараметрических последовательных задач, заполняя пробел в этой области. Полные эксперименты и открытый инструментарий значительно повышают ценность работы.

Настоятельно рекомендуется для чтения:

Исследователям конформного предсказания (теоретическая инновация)
Практикам обнаружения объектов (практический инструмент)
Инженерам по безопасности ИИ (метод сертификации)

Рекомендуемые направления будущих исследований: контроль точности, проверка на большем количестве наборов данных, численное сравнение с существующими методами.