Learning to defer uncertain predictions to costly experts offers a powerful strategy for improving the accuracy and efficiency of machine learning systems. However, standard training procedures for deferral algorithms typically require querying all experts for every training instance, an approach that becomes prohibitively expensive when expert queries incur significant computational or resource costs. This undermines the core goal of deferral: to limit unnecessary expert usage. To overcome this challenge, we introduce the budgeted deferral framework, which aims to train effective deferral algorithms while minimizing expert query costs during training. We propose new algorithms for both two-stage and single-stage multiple-expert deferral settings that selectively query only a subset of experts per training example. While inspired by active learning, our setting is fundamentally different: labels are already known, and the core challenge is to decide which experts to query in order to balance cost and predictive performance. We establish theoretical guarantees for both of our algorithms, including generalization bounds and label complexity analyses. Empirical results across several domains show that our algorithms substantially reduce training costs without sacrificing prediction accuracy, demonstrating the practical value of our budget-aware deferral algorithms.
Обучение делегированию неопределённых предсказаний дорогостоящим экспертам является мощной стратегией повышения точности и эффективности систем машинного обучения. Однако стандартные процедуры обучения алгоритмов делегирования обычно требуют запроса всех экспертов для каждого обучающего примера, что становится чрезвычайно дорогостоящим при значительных вычислительных или ресурсных затратах на запросы экспертов, противоречив основной цели делегирования: ограничению ненужного использования экспертов. Для преодоления этого вызова в данной работе представляется фреймворк бюджетированного делегирования, предназначенный для обучения эффективных алгоритмов делегирования при минимизации стоимости запросов экспертов во время обучения.
Традиционное обучение многоэкспертному делегированию (Learning to Defer) сталкивается с фундаментальным противоречием:
Основная цель: снижение затрат путём выборочного делегирования задач предсказания экспертам
Реальность обучения: стандартные процедуры требуют запроса всех экспертов для каждого обучающего образца с общей стоимостью neT (количество экспертов × количество обучающих образцов)
Парадокс стоимости: сам процесс обучения противоречит цели контроля затрат
Практические требования: в сценариях с дорогостоящими ресурсами, такими как большие языковые модели и человеческие эксперты, стоимость обучения может быть чрезвычайно высокой
Проблемы масштабируемости: стоимость обучения растёт линейно с увеличением количества экспертов, что ограничивает практическое применение метода
Среды с ограниченными ресурсами: существующие методы сложно развёртывать в условиях ограниченных вычислительных ресурсов
Предложение фреймворка бюджетированного делегирования: первое систематическое исследование проблемы контроля стоимости запросов экспертов во время обучения
Ключевое нововведение: разложение решения на две части
Выбор эксперта: выбор эксперта k с вероятностью qₜ,ₖ
Решение о запросе: запрос стоимости выбранного эксперта с вероятностью pₜ,ₖ
Процедура алгоритма:
для t = 1 до T:
получить (xₜ, yₜ)
вычислить вектор вероятностей запроса pₜ ← SAMPLING-PROBS(...)
выбрать эксперта kₜ ~ q_t
запросить стоимость cₜ,ₖₜ с вероятностью pₜ,ₖₜ
обновить обучающий набор Sₜ (с весами важности 1/(qₜ,ₖₜpₜ,ₖₜ))
обновить функцию маршрутизации rₜ
Наборы данных бинарной классификации: коэффициент запроса снижен до 35-40%
Наборы данных многоклассовой классификации: коэффициент запроса снижен ниже 30%
Эффект количества экспертов: преимущество бюджетированного метода более выражено с увеличением количества экспертов (лучший результат на наборе данных letter с 26 экспертами)
Сохранение точности:
Точность системы на всех наборах данных сравнима со стандартным методом
Доверительные интервалы ошибок на наборах данных бинарной классификации минимальны, что указывает на стабильность результатов
На наборах данных многоклассовой классификации наблюдается некоторая вариативность, но общая тенденция согласуется
Ограничения экспериментальной установки: установка экспертов относительно искусственна, может отличаться от реальных сценариев приложений
Единственная базовая линия сравнения: основное сравнение со стандартным методом делегирования, отсутствуют сравнения с другими методами с ограничениями по бюджету
Недостаточный анализ вычислительной сложности: отсутствует подробный анализ вычислительных затрат алгоритма
В работе цитируются важные труды в области обучения делегированию, активного обучения и многорукого бандита, в частности:
Mao et al. (2023a, 2024a): теоретические основы многоэкспертного делегирования
Beygelzimer et al. (2009): идея взвешивания по важности в алгоритме IWAL
Reid et al. (2024): пионерская работа по бюджетированному делегированию
Общая оценка: это высококачественная статья по теории машинного обучения, решающая важную практическую проблему в обучении делегированию с предоставлением строгого теоретического анализа и убедительной экспериментальной проверки. Основной вклад работы заключается в первом систематическом исследовании контроля стоимости запросов экспертов на этапе обучения, что закладывает важную основу для практического применения методов делегирования в данной области.