Learning to defer uncertain predictions to costly experts offers a powerful strategy for improving the accuracy and efficiency of machine learning systems. However, standard training procedures for deferral algorithms typically require querying all experts for every training instance, an approach that becomes prohibitively expensive when expert queries incur significant computational or resource costs. This undermines the core goal of deferral: to limit unnecessary expert usage. To overcome this challenge, we introduce the budgeted deferral framework, which aims to train effective deferral algorithms while minimizing expert query costs during training. We propose new algorithms for both two-stage and single-stage multiple-expert deferral settings that selectively query only a subset of experts per training example. While inspired by active learning, our setting is fundamentally different: labels are already known, and the core challenge is to decide which experts to query in order to balance cost and predictive performance. We establish theoretical guarantees for both of our algorithms, including generalization bounds and label complexity analyses. Empirical results across several domains show that our algorithms substantially reduce training costs without sacrificing prediction accuracy, demonstrating the practical value of our budget-aware deferral algorithms.
يعتبر تعلم إحالة التنبؤات غير المؤكدة للخبراء المتخصصين المكلفين استراتيجية قوية لتحسين دقة وكفاءة أنظمة التعلم الآلي. ومع ذلك، فإن إجراءات التدريب القياسية للخوارزميات المعروفة عادة ما تتطلب الاستعلام عن جميع الخبراء لكل عينة تدريب، مما يصبح مكلفاً للغاية عندما تنتج استعلامات الخبراء تكاليف حسابية أو موارد كبيرة، مما يتعارض مع الهدف الأساسي للإحالة: تحديد استخدام الخبراء غير الضروري. للتغلب على هذا التحدي، تقدم هذه الورقة إطار عمل الإحالة ذات الميزانية، الذي يهدف إلى تدريب خوارزميات إحالة فعالة مع تقليل تكاليف استعلام الخبراء أثناء التدريب.
قرار الاستعلام: الاستعلام عن تكلفة الخبير المختار باحتمالية pₜ,ₖ
تدفق الخوارزمية:
لـ t = 1 إلى T:
استقبال (xₜ, yₜ)
حساب متجه احتمالية الاستعلام pₜ ← SAMPLING-PROBS(...)
اختيار الخبير kₜ ~ q_t
الاستعلام عن التكلفة cₜ,ₖₜ باحتمالية pₜ,ₖₜ
تحديث مجموعة التدريب Sₜ (مع أوزان الأهمية 1/(qₜ,ₖₜpₜ,ₖₜ))
تحديث دالة التوجيه rₜ
تستشهد هذه الورقة بأدبيات مهمة في مجالات التعلم بالإحالة والتعلم النشط وآلات القمار متعددة الأذرع، خاصة:
Mao et al. (2023a, 2024a): الأساس النظري للإحالة المتعددة للخبراء
Beygelzimer et al. (2009): فكرة الأهمية المرجحة في خوارزمية IWAL
Reid et al. (2024): العمل الرائد في الإحالة المقيدة بالميزانية
التقييم الشامل: هذه ورقة عالية الجودة في التعلم الآلي النظري، تحل مشكلة عملية مهمة في التعلم بالإحالة، وتوفر تحليلاً نظرياً صارماً والتحقق التجريبي المقنع. تكمن المساهمة الرئيسية للورقة في أول دراسة منهجية لمشكلة التحكم في تكاليف استعلام الخبراء أثناء التدريب، مما يضع أساساً مهماً للتطبيقات العملية في هذا المجال.