Learning to defer uncertain predictions to costly experts offers a powerful strategy for improving the accuracy and efficiency of machine learning systems. However, standard training procedures for deferral algorithms typically require querying all experts for every training instance, an approach that becomes prohibitively expensive when expert queries incur significant computational or resource costs. This undermines the core goal of deferral: to limit unnecessary expert usage. To overcome this challenge, we introduce the budgeted deferral framework, which aims to train effective deferral algorithms while minimizing expert query costs during training. We propose new algorithms for both two-stage and single-stage multiple-expert deferral settings that selectively query only a subset of experts per training example. While inspired by active learning, our setting is fundamentally different: labels are already known, and the core challenge is to decide which experts to query in order to balance cost and predictive performance. We establish theoretical guarantees for both of our algorithms, including generalization bounds and label complexity analyses. Empirical results across several domains show that our algorithms substantially reduce training costs without sacrificing prediction accuracy, demonstrating the practical value of our budget-aware deferral algorithms.
불확실한 예측을 비용이 많이 드는 전문가에게 선택적으로 위임하는 학습은 기계학습 시스템의 정확성과 효율성을 향상시키는 강력한 전략입니다. 그러나 표준 위임 알고리즘 훈련 절차는 일반적으로 각 훈련 인스턴스에 대해 모든 전문가를 조회해야 하며, 전문가 조회가 상당한 계산 또는 자원 비용을 발생시킬 때 이 방법은 극도로 비효율적이 되어 위임의 핵심 목표인 불필요한 전문가 사용 제한을 위반합니다. 이 문제를 극복하기 위해 본 논문은 훈련 중 전문가 조회 비용을 최소화하면서 효과적인 위임 알고리즘을 훈련하기 위한 예산 위임 프레임워크를 제시합니다.
t = 1부터 T까지:
(xₜ, yₜ) 수신
조회 확률 벡터 pₜ ← SAMPLING-PROBS(...)
전문가 kₜ ~ q_t 선택
확률 pₜ,ₖₜ로 비용 cₜ,ₖₜ 조회
훈련 집합 Sₜ 업데이트 (중요도 가중치 1/(qₜ,ₖₜpₜ,ₖₜ) 포함)
라우팅 함수 rₜ 업데이트
본 논문은 위임 학습, 능동 학습 및 다중 팔 도박 등 분야의 중요 문헌을 인용하며, 특히:
Mao et al. (2023a, 2024a): 다중 전문가 위임의 이론적 기초
Beygelzimer et al. (2009): IWAL 알고리즘의 중요도 가중치 개념
Reid et al. (2024): 예산 제약 위임의 선구적 연구
종합 평가: 이는 위임 학습의 중요한 실제 문제를 해결하는 고품질의 기계학습 이론 논문으로, 엄격한 이론 분석과 설득력 있는 실험 검증을 제공합니다. 본 논문의 주요 기여는 훈련 단계의 전문가 조회 비용 제어 문제를 처음으로 체계적으로 연구하여 해당 분야의 실제 응용을 위한 중요한 기초를 마련했다는 점입니다.