2025-11-16T14:37:12.620917

Multi-model Online Conformal Prediction with Graph-Structured Feedback

Hajihashemi, Shen

Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.

academic

Multi-Modell Online Konforme Vorhersage mit Graphstrukturiertem Feedback

Grundinformationen

Papier-ID: 2506.20898
Titel: Multi-model Online Conformal Prediction with Graph-Structured Feedback
Autoren: Erfan Hajihashemi, Yanning Shen (University of California, Irvine)
Klassifizierung: cs.LG
Veröffentlichungszeitpunkt/Konferenz: Transactions on Machine Learning Research (10/2025)
Papierlink: https://arxiv.org/abs/2506.20898

Zusammenfassung

Die Online konforme Vorhersage hat ihre Fähigkeit demonstriert, für jeden eingehenden Datenpunkt eine Vorhersagemenge zu konstruieren, die das echte Label mit einer vordefinierten Wahrscheinlichkeit abdeckt. Um mit potenziellen Verteilungsverschiebungen umzugehen, wurde die Multi-Modell Online konforme Vorhersage eingeführt, um verschiedene Modelle aus einer vorausgewählten Kandidatenmenge auszuwählen und zu nutzen. Zusammen mit der verbesserten Flexibilität bringt die Wahl der vorausgewählten Menge auch Herausforderungen mit sich. Eine Kandidatenmenge, die eine große Anzahl von Modellen enthält, kann die Rechenkomplexität erhöhen. Darüber hinaus kann die Aufnahme irrelevanter Modelle mit schlechter Leistung die Leistung negativ beeinflussen und zu unnötig großen Vorhersagemengen führen. Um diese Herausforderungen zu bewältigen, schlagen wir einen neuartigen Multi-Modell Online konformen Vorhersagealgorithmus vor, der eine Teilmenge effektiver Modelle bei jedem Zeitschritt durch Sammlung von Feedback aus einem bipartiten Graphen identifiziert, der bei Empfang neuer Daten verfeinert wird. Ein Modell wird dann aus dieser Teilmenge ausgewählt, um die Vorhersagemenge zu konstruieren, was zu reduzierter Rechenkomplexität und kleineren Vorhersagemengen führt. Zusätzlich demonstrieren wir, dass die Verwendung der Vorhersagemengen-Größe als Feedback zusammen mit Modellverlust die Effizienz erheblich verbessern kann, indem kleinere Vorhersagemengen konstruiert werden, während die erforderliche Abdeckungsgarantie noch erfüllt wird. Die vorgeschlagenen Algorithmen werden bewiesen, um gültige Abdeckung zu gewährleisten und sublineares Bedauern zu erreichen. Experimente auf realen und synthetischen Datensätzen validieren, dass die vorgeschlagenen Methoden kleinere Vorhersagemengen konstruieren und bestehende Multi-Modell Online konforme Vorhersageansätze übertreffen.

Forschungshintergrund und Motivation

Zu lösende Probleme: Bestehende Multi-Modell Online konforme Vorhersagemethoden sehen sich bei der Behandlung von Verteilungsverschiebungen mit hoher Rechenkomplexität und übermäßig großen Vorhersagemengen konfrontiert. Traditionelle Methoden erfordern die Aktualisierung und Bewertung aller Kandidatenmodelle, was bei großen Kandidatenmengen oder Modellen mit schlechter Leistung zu Ineffizienz führt.
Bedeutung des Problems: In sicherheitskritischen Anwendungen (wie autonomes Fahren, medizinische Diagnostik) ist eine zuverlässige Unsicherheitsquantifizierung erforderlich, um die Glaubwürdigkeit von Entscheidungen zu gewährleisten. Die konforme Vorhersage kann gültige Vorhersagemengen ohne Abhängigkeit von Verteilungsannahmen bereitstellen, erfordert aber in Online-Umgebungen die Bewältigung dynamischer Änderungen der Datenverteilung.
Einschränkungen bestehender Methoden:
- Rechenkomplexität wächst linear mit der Anzahl der Kandidatenmodelle
- Die Aufnahme von Modellen mit niedriger Leistung beeinträchtigt die Gesamtleistung negativ
- Mangel an effektiven Modellauswahlmechanismen zur dynamischen Anpassung an Verteilungsverschiebungen
Forschungsmotivation: Entwicklung eines Multi-Modell Online konformen Vorhersagealgorithmus, der adaptive Modelluntermengenwahl ermöglicht, während die Abdeckungsgarantie beibehalten, die Rechenkomplexität reduziert und die Vorhersagemengen-Größe verringert wird.

Kernbeiträge

Vorschlag des GMOCP-Algorithmus: Entwurf eines Multi-Modell Online konformen Vorhersagealgorithmus basierend auf graphstrukturiertem Feedback, der durch bipartite Graphen dynamisch effektive Modelluntermengen identifiziert
Konstruktion eines adaptiven Graphgenerierungsrahmens: Dynamische Konstruktion und Aktualisierung des bipartiten Graphen basierend auf historischer Modellleistung, um Online-Modellauswahl zu ermöglichen
Entwicklung des EGMOCP-Erweiterungsalgorithmus: Verwendung der Vorhersagemengen-Größe als zusätzliches Feedbacksignal zur weiteren Verbesserung der Vorhersageeffizienz
Bereitstellung theoretischer Garantien: Beweis der gültigen Abdeckungsrate und sublinearer Bedauerungsgrenzen des Algorithmus
Validierung der Wirksamkeit auf mehreren Datensätzen: Realisierung kleinerer Vorhersagemengen und niedrigerer Rechenkomplexität auf Datensätzen wie CIFAR-10C und CIFAR-100C

Methodische Erläuterung

Aufgabendefinition

Gegeben historische Daten $\{(X_τ, Y^{true}_τ)\}^{t-1}_{τ=1}$ und neue Eingabe $X_t$ , konstruiere eine Vorhersagemenge $C^m_α(X_t) ⊆ Y$ so dass das echte Label $Y^{true}_t$ mit Wahrscheinlichkeit $1-α$ in der Vorhersagemenge enthalten ist, wobei $α$ die Fehlabdeckungswahrscheinlichkeit ist.

Modellarchitektur

1. Bipartite Graphstruktur-Design

Modellknoten: $\{v^{(l)}_1, ..., v^{(l)}_M\}$ stellen M Kandidatenmodelle dar
Auswahlknoten: $\{v^{(s)}_1, ..., v^{(s)}_J\}$ stellen J Auswahlknoten dar
Verbindungsbeschränkungen: Jeder Auswahlknoten verbindet sich mit höchstens N Modellknoten

Graphstrukturierter Feedbackmechanismus: Dynamische Modelluntermengenwahl durch bipartite Graphen, vermeidung von Aktualisierungen aller Modelle
Duales Feedbackdesign: EGMOCP berücksichtigt gleichzeitig Vorhersageverlust und Vorhersagemengen-Größe als Feedbacksignale
Adaptive Explorations-Exploitations-Balance: Realisierung mehrschichtiger Explorationsstrategien durch unterschiedliche Explorationskoeffizienten

Experimentelle Einrichtung

Datensätze

CIFAR-10C/CIFAR-100C: Enthält 15 Korruptionstypen, 5 Schweregrade
TinyImageNet-C: Korruptionsversion des 200-Klassen-Datensatzes
Synthetische Datensätze: 3000 Stichproben, 20 Klassen, simulieren Verteilungsverschiebung

Bewertungsmetriken

Coverage: Prozentsatz der Vorhersagemengen, die das echte Label enthalten
Avg Width: Durchschnittliche Größe der Vorhersagemengen
Run Time: Laufzeit des Algorithmus
Single Width: Prozentsatz der Vorhersagemengen mit Größe 1 und korrekter Abdeckung

Vergleichsmethoden

MOCP: Multi-Modell Online konforme Vorhersage-Baseline-Methode
COMA: Konforme Online-Modell-Aggregationsmethode
Einzelmodell-Methoden: ACI, FACI, DECAY, SAOCP

Implementierungsdetails

Zielabdeckungsrate: 90% (α = 0.1)
Hyperparameter: ε = 0.5, η = 0.05, β = 0.05
Zeitschritte: T = 6000
Batch-Größe: 500 Stichproben

Experimentelle Ergebnisse

Hauptergebnisse

In Experimenten mit plötzlicher Verteilungsverschiebung auf dem CIFAR-100C-Datensatz:

GMOCP erreicht schnellere Laufzeit (etwa 50% Verbesserung) und ähnliche Vorhersagemengen-Größe im Vergleich zu MOCP
EGMOCP reduziert die Vorhersagemengen-Größe erheblich, von 12,63 bei MOCP auf 6,18, während die Zielabdeckungsrate von 90% beibehalten wird
Das Single-Width-Verhältnis verbessert sich von 22,43% auf 29,91%

Ablationsstudien

Graphparameter-Einfluss: Test verschiedener Kombinationen von N (Modellknotenzahl) und J (Auswahlknotenzahl)
Explorationsstrategien: Vergleich der Auswirkungen verschiedener Explorationskoeffizient-Einstellungen
Feedbackmechanismen: Validierung der Wirksamkeit von Vorhersagemengen-Größe-Feedback

Fallstudien

Demonstration durch drei Trainingskonfigurationen von DenseNet121 (120D, 10R, 1R):

Hochleistungsmodelle (120D) erhalten höchste Gewichte und Auswahlwahrscheinlichkeiten
EGMOCP kann effektiv leistungsstärkere Modelle identifizieren und bevorzugt auswählen
Vorhersagemengen-Größe korreliert negativ mit Modellleistung

Experimentelle Erkenntnisse

Rechenzeiteffizienz-Verbesserung: EGMOCP-Komplexität pro Schritt ist O(Nt + JMN), deutlich niedriger als MOCP's O(Mt) wenn N << M
Vorhersagequalitäts-Verbesserung: EGMOCP realisiert kleinere Vorhersagemengen durch dualen Feedbackmechanismus
Robustheit-Validierung: Stabile Leistung unter verschiedenen Verteilungsverschiebungs-Szenarien

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Graphstrukturierter Feedbackmechanismus kann Rechenkomplexität effektiv reduzieren und Vorhersageeffizienz verbessern
Vorhersagemengen-Größe als Feedbacksignal verbessert Algorithmusleistung erheblich
Theoretische Garantien stimmen mit experimentellen Ergebnissen überein und validieren die Methodenwirksamkeit

Einschränkungen

Graphkonstruktion erfordert zusätzliche Hyperparameter-Optimierung
Begrenzte Verbesserung wenn Kandidatenmodellqualität ähnlich ist
Theoretische Analyse basiert auf spezifischen Verlustfunktions-Annahmen

Zukünftige Richtungen

Erforschung komplexerer Graphstrukturen und Aktualisierungsstrategien
Erweiterung auf Regressionaufgaben und andere Unsicherheitsquantifizierungsmethoden
Untersuchung der Adaptivität unter starker Verteilungsverschiebung

Tiefgreifende Bewertung

Stärken

Starke Methodische Innovativität: Graphstrukturierter Feedbackmechanismus bietet neue Perspektive für Multi-Modell-Auswahl
Solide theoretische Grundlagen: Strenge Beweise für Abdeckungsrate und Bedauerungsgrenzen
Umfassende Experimentelles Design: Abdeckung mehrerer Datensätze und Verteilungsverschiebungs-Szenarien
Hoher praktischer Wert: Signifikante Reduzierung der Rechenkomplexität bei gleichzeitiger Verbesserung der Vorhersagequalität

Mängel

Hyperparameter-Sensitivität: Erfordert Anpassung mehrerer graphbezogener Parameter
Eingeschränkte Anwendungsszenarien: Vorteil nicht offensichtlich wenn Modellqualitätsunterschiede gering sind
Komplexe theoretische Analyse: Beweisverlauf ist aufwändig, praktische Anwendbarkeit bedarf Validierung

Einflussfähigkeit

Akademischer Beitrag: Bietet neue technische Route für Online-Unsicherheitsquantifizierungsfeld
Anwendungsperspektive: Wichtiger Wert in sicherheitskritischen Systemen, die Echtzeitentscheidungen erfordern
Reproduzierbarkeit: Detaillierte Algorithmusbeschreibung, klare Experimenteinrichtung

Anwendungsszenarien

Online-Lernsysteme, die Echtzeitunsicherheitsquantifizierung erfordern
Dynamische Umgebungen mit Verteilungsverschiebung
Szenarien mit begrenzten Rechenressourcen aber erforderlicher Multi-Modell-Fusion
Zuverlässige Vorhersageanforderungen in sicherheitskritischen Anwendungen

Literaturverzeichnis

Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic learning in a random world
Gibbs, I., & Candès, E. J. (2021). Adaptive conformal inference under distribution shift
Hajihashemi, E., & Shen, Y. (2024). Multi-model ensemble conformal prediction in dynamic environments
Gasparin, M., & Ramdas, A. (2024). Conformal online model aggregation