Learning to defer uncertain predictions to costly experts offers a powerful strategy for improving the accuracy and efficiency of machine learning systems. However, standard training procedures for deferral algorithms typically require querying all experts for every training instance, an approach that becomes prohibitively expensive when expert queries incur significant computational or resource costs. This undermines the core goal of deferral: to limit unnecessary expert usage. To overcome this challenge, we introduce the budgeted deferral framework, which aims to train effective deferral algorithms while minimizing expert query costs during training. We propose new algorithms for both two-stage and single-stage multiple-expert deferral settings that selectively query only a subset of experts per training example. While inspired by active learning, our setting is fundamentally different: labels are already known, and the core challenge is to decide which experts to query in order to balance cost and predictive performance. We establish theoretical guarantees for both of our algorithms, including generalization bounds and label complexity analyses. Empirical results across several domains show that our algorithms substantially reduce training costs without sacrificing prediction accuracy, demonstrating the practical value of our budget-aware deferral algorithms.
Das Erlernen, unsichere Vorhersagen an teure Experten zu delegieren, ist eine wirksame Strategie zur Verbesserung der Genauigkeit und Effizienz von Maschinenlern-Systemen. Allerdings erfordern Standard-Trainingsverfahren für Delegationsalgorithmen typischerweise die Abfrage aller Experten für jede Trainingsinstanz, was bei signifikanten Rechenkosten oder Ressourcenkosten extrem teuer wird und das Kernziel der Delegation – die Begrenzung unnötiger Expertennutzung – unterläuft. Um diese Herausforderung zu bewältigen, führt dieses Paper das Framework der budgetierten Delegation ein, das darauf abzielt, effektive Delegationsalgorithmen zu trainieren und gleichzeitig die Kosten für Expertenabfragen während des Trainings zu minimieren.
Das traditionelle Lernen zur Delegation mit mehreren Experten (Learning to Defer) steht vor einem grundlegenden Widerspruch:
Kernziel: Kostenreduktion durch selektive Delegation von Vorhersageaufgaben an Experten
Trainingsrealität: Standard-Trainingsverfahren erfordern die Abfrage aller Experten für jede Trainingsmuster mit Gesamtkosten von neT (Anzahl der Experten × Trainingsmuster)
Kostenparadoxon: Der Trainingsprozess selbst widerspricht dem Ziel der Kostenkontrolle
Praktische Anforderungen: In Szenarien mit teuren Ressourcen wie großen Sprachmodellen oder menschlichen Experten können Trainingskosten extrem hoch sein
Skalierungsprobleme: Mit zunehmender Anzahl von Experten wachsen die Trainingskosten linear, was die praktische Anwendbarkeit einschränkt
Ressourcenbeschränkte Umgebungen: In Umgebungen mit begrenzten Rechenressourcen sind bestehende Methoden schwer einsetzbar
Dieses Paper zitiert wichtige Literatur aus den Bereichen Delegationslernens, aktives Lernen und Multi-Armed Bandits, insbesondere:
Mao et al. (2023a, 2024a): Theoretische Grundlagen der Mehrexperten-Delegation
Beygelzimer et al. (2009): Wichtungsgewichtete Ideen des aktiven Lernens
Reid et al. (2024): Pionierarbeit bei budgetierter Delegation
Gesamtbewertung: Dies ist ein hochqualitatives Maschinenlern-Theorie-Paper, das ein wichtiges praktisches Problem im Delegationslernbereich löst und strenge theoretische Analysen sowie überzeugende experimentelle Validierung bietet. Der Hauptbeitrag liegt in der ersten systematischen Untersuchung der Kontrolle von Expertenabfragekosten in der Trainingsphase und legt damit eine wichtige Grundlage für praktische Anwendungen in diesem Bereich.