2025-11-16T14:37:12.620917

Multi-model Online Conformal Prediction with Graph-Structured Feedback

Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic

Multi-Modell Online Konforme Vorhersage mit Graphstrukturiertem Feedback

Grundinformationen

  • Papier-ID: 2506.20898
  • Titel: Multi-model Online Conformal Prediction with Graph-Structured Feedback
  • Autoren: Erfan Hajihashemi, Yanning Shen (University of California, Irvine)
  • Klassifizierung: cs.LG
  • Veröffentlichungszeitpunkt/Konferenz: Transactions on Machine Learning Research (10/2025)
  • Papierlink: https://arxiv.org/abs/2506.20898

Zusammenfassung

Die Online konforme Vorhersage hat ihre Fähigkeit demonstriert, für jeden eingehenden Datenpunkt eine Vorhersagemenge zu konstruieren, die das echte Label mit einer vordefinierten Wahrscheinlichkeit abdeckt. Um mit potenziellen Verteilungsverschiebungen umzugehen, wurde die Multi-Modell Online konforme Vorhersage eingeführt, um verschiedene Modelle aus einer vorausgewählten Kandidatenmenge auszuwählen und zu nutzen. Zusammen mit der verbesserten Flexibilität bringt die Wahl der vorausgewählten Menge auch Herausforderungen mit sich. Eine Kandidatenmenge, die eine große Anzahl von Modellen enthält, kann die Rechenkomplexität erhöhen. Darüber hinaus kann die Aufnahme irrelevanter Modelle mit schlechter Leistung die Leistung negativ beeinflussen und zu unnötig großen Vorhersagemengen führen. Um diese Herausforderungen zu bewältigen, schlagen wir einen neuartigen Multi-Modell Online konformen Vorhersagealgorithmus vor, der eine Teilmenge effektiver Modelle bei jedem Zeitschritt durch Sammlung von Feedback aus einem bipartiten Graphen identifiziert, der bei Empfang neuer Daten verfeinert wird. Ein Modell wird dann aus dieser Teilmenge ausgewählt, um die Vorhersagemenge zu konstruieren, was zu reduzierter Rechenkomplexität und kleineren Vorhersagemengen führt. Zusätzlich demonstrieren wir, dass die Verwendung der Vorhersagemengen-Größe als Feedback zusammen mit Modellverlust die Effizienz erheblich verbessern kann, indem kleinere Vorhersagemengen konstruiert werden, während die erforderliche Abdeckungsgarantie noch erfüllt wird. Die vorgeschlagenen Algorithmen werden bewiesen, um gültige Abdeckung zu gewährleisten und sublineares Bedauern zu erreichen. Experimente auf realen und synthetischen Datensätzen validieren, dass die vorgeschlagenen Methoden kleinere Vorhersagemengen konstruieren und bestehende Multi-Modell Online konforme Vorhersageansätze übertreffen.

Forschungshintergrund und Motivation

  1. Zu lösende Probleme: Bestehende Multi-Modell Online konforme Vorhersagemethoden sehen sich bei der Behandlung von Verteilungsverschiebungen mit hoher Rechenkomplexität und übermäßig großen Vorhersagemengen konfrontiert. Traditionelle Methoden erfordern die Aktualisierung und Bewertung aller Kandidatenmodelle, was bei großen Kandidatenmengen oder Modellen mit schlechter Leistung zu Ineffizienz führt.
  2. Bedeutung des Problems: In sicherheitskritischen Anwendungen (wie autonomes Fahren, medizinische Diagnostik) ist eine zuverlässige Unsicherheitsquantifizierung erforderlich, um die Glaubwürdigkeit von Entscheidungen zu gewährleisten. Die konforme Vorhersage kann gültige Vorhersagemengen ohne Abhängigkeit von Verteilungsannahmen bereitstellen, erfordert aber in Online-Umgebungen die Bewältigung dynamischer Änderungen der Datenverteilung.
  3. Einschränkungen bestehender Methoden:
    • Rechenkomplexität wächst linear mit der Anzahl der Kandidatenmodelle
    • Die Aufnahme von Modellen mit niedriger Leistung beeinträchtigt die Gesamtleistung negativ
    • Mangel an effektiven Modellauswahlmechanismen zur dynamischen Anpassung an Verteilungsverschiebungen
  4. Forschungsmotivation: Entwicklung eines Multi-Modell Online konformen Vorhersagealgorithmus, der adaptive Modelluntermengenwahl ermöglicht, während die Abdeckungsgarantie beibehalten, die Rechenkomplexität reduziert und die Vorhersagemengen-Größe verringert wird.

Kernbeiträge

  1. Vorschlag des GMOCP-Algorithmus: Entwurf eines Multi-Modell Online konformen Vorhersagealgorithmus basierend auf graphstrukturiertem Feedback, der durch bipartite Graphen dynamisch effektive Modelluntermengen identifiziert
  2. Konstruktion eines adaptiven Graphgenerierungsrahmens: Dynamische Konstruktion und Aktualisierung des bipartiten Graphen basierend auf historischer Modellleistung, um Online-Modellauswahl zu ermöglichen
  3. Entwicklung des EGMOCP-Erweiterungsalgorithmus: Verwendung der Vorhersagemengen-Größe als zusätzliches Feedbacksignal zur weiteren Verbesserung der Vorhersageeffizienz
  4. Bereitstellung theoretischer Garantien: Beweis der gültigen Abdeckungsrate und sublinearer Bedauerungsgrenzen des Algorithmus
  5. Validierung der Wirksamkeit auf mehreren Datensätzen: Realisierung kleinerer Vorhersagemengen und niedrigerer Rechenkomplexität auf Datensätzen wie CIFAR-10C und CIFAR-100C

Methodische Erläuterung

Aufgabendefinition

Gegeben historische Daten {(Xτ,Yτtrue)}τ=1t1\{(X_τ, Y^{true}_τ)\}^{t-1}_{τ=1} und neue Eingabe XtX_t, konstruiere eine Vorhersagemenge Cαm(Xt)YC^m_α(X_t) ⊆ Y so dass das echte Label YttrueY^{true}_t mit Wahrscheinlichkeit 1α1-α in der Vorhersagemenge enthalten ist, wobei αα die Fehlabdeckungswahrscheinlichkeit ist.

Modellarchitektur

1. Bipartite Graphstruktur-Design

  • Modellknoten: {v1(l),...,vM(l)}\{v^{(l)}_1, ..., v^{(l)}_M\} stellen M Kandidatenmodelle dar
  • Auswahlknoten: {v1(s),...,vJ(s)}\{v^{(s)}_1, ..., v^{(s)}_J\} stellen J Auswahlknoten dar
  • Verbindungsbeschränkungen: Jeder Auswahlknoten verbindet sich mit höchstens N Modellknoten

2. Graphgenerierungsalgorithmus

Verbindungswahrscheinlichkeit für Modellknoten: ptm=(1ηe)wtmmˉ=1Mwtmˉ+ηeMp^m_t = (1 - η_e) \frac{w^m_t}{\sum^M_{\bar{m}=1} w^{\bar{m}}_t} + \frac{η_e}{M}

wobei ηeη_e der Explorationskoeffizient ist und wtmw^m_t das Modellgewicht ist.

3. Modellgewichtsaktualisierung

Verwendung von Wichtigkeitsstichproben-Verlustschätzung: wt+1m=wtmexp(εltm/2b)w^m_{t+1} = w^m_t \exp(-ε l^m_t / 2^b)

wobei die Verlustfunktion wie folgt definiert ist: ltm=L(αˉtm,αtm)qtmI{mSt}l^m_t = \frac{L(\bar{α}^m_t, α^m_t)}{q^m_t} I\{m ∈ S_t\}

4. Adaptive Fehlabdeckungswahrscheinlichkeits-Aktualisierung

Verwendung von Scale-Free Online-Gradientenabstieg: αt+1m=αtmηαtmL(αˉtm,αtm)τ=1tατmL(αˉτm,ατm)22α^m_{t+1} = α^m_t - η \frac{∇_{α^m_t} L(\bar{α}^m_t, α^m_t)}{\sqrt{\sum^t_{τ=1} \|∇_{α^m_τ} L(\bar{α}^m_τ, α^m_τ)\|^2_2}}

Technische Innovationspunkte

  1. Graphstrukturierter Feedbackmechanismus: Dynamische Modelluntermengenwahl durch bipartite Graphen, vermeidung von Aktualisierungen aller Modelle
  2. Duales Feedbackdesign: EGMOCP berücksichtigt gleichzeitig Vorhersageverlust und Vorhersagemengen-Größe als Feedbacksignale
  3. Adaptive Explorations-Exploitations-Balance: Realisierung mehrschichtiger Explorationsstrategien durch unterschiedliche Explorationskoeffizienten

Experimentelle Einrichtung

Datensätze

  1. CIFAR-10C/CIFAR-100C: Enthält 15 Korruptionstypen, 5 Schweregrade
  2. TinyImageNet-C: Korruptionsversion des 200-Klassen-Datensatzes
  3. Synthetische Datensätze: 3000 Stichproben, 20 Klassen, simulieren Verteilungsverschiebung

Bewertungsmetriken

  • Coverage: Prozentsatz der Vorhersagemengen, die das echte Label enthalten
  • Avg Width: Durchschnittliche Größe der Vorhersagemengen
  • Run Time: Laufzeit des Algorithmus
  • Single Width: Prozentsatz der Vorhersagemengen mit Größe 1 und korrekter Abdeckung

Vergleichsmethoden

  • MOCP: Multi-Modell Online konforme Vorhersage-Baseline-Methode
  • COMA: Konforme Online-Modell-Aggregationsmethode
  • Einzelmodell-Methoden: ACI, FACI, DECAY, SAOCP

Implementierungsdetails

  • Zielabdeckungsrate: 90% (α = 0.1)
  • Hyperparameter: ε = 0.5, η = 0.05, β = 0.05
  • Zeitschritte: T = 6000
  • Batch-Größe: 500 Stichproben

Experimentelle Ergebnisse

Hauptergebnisse

In Experimenten mit plötzlicher Verteilungsverschiebung auf dem CIFAR-100C-Datensatz:

  • GMOCP erreicht schnellere Laufzeit (etwa 50% Verbesserung) und ähnliche Vorhersagemengen-Größe im Vergleich zu MOCP
  • EGMOCP reduziert die Vorhersagemengen-Größe erheblich, von 12,63 bei MOCP auf 6,18, während die Zielabdeckungsrate von 90% beibehalten wird
  • Das Single-Width-Verhältnis verbessert sich von 22,43% auf 29,91%

Ablationsstudien

  1. Graphparameter-Einfluss: Test verschiedener Kombinationen von N (Modellknotenzahl) und J (Auswahlknotenzahl)
  2. Explorationsstrategien: Vergleich der Auswirkungen verschiedener Explorationskoeffizient-Einstellungen
  3. Feedbackmechanismen: Validierung der Wirksamkeit von Vorhersagemengen-Größe-Feedback

Fallstudien

Demonstration durch drei Trainingskonfigurationen von DenseNet121 (120D, 10R, 1R):

  • Hochleistungsmodelle (120D) erhalten höchste Gewichte und Auswahlwahrscheinlichkeiten
  • EGMOCP kann effektiv leistungsstärkere Modelle identifizieren und bevorzugt auswählen
  • Vorhersagemengen-Größe korreliert negativ mit Modellleistung

Experimentelle Erkenntnisse

  1. Rechenzeiteffizienz-Verbesserung: EGMOCP-Komplexität pro Schritt ist O(Nt + JMN), deutlich niedriger als MOCP's O(Mt) wenn N << M
  2. Vorhersagequalitäts-Verbesserung: EGMOCP realisiert kleinere Vorhersagemengen durch dualen Feedbackmechanismus
  3. Robustheit-Validierung: Stabile Leistung unter verschiedenen Verteilungsverschiebungs-Szenarien

Verwandte Arbeiten

  1. Konforme Vorhersage-Grundlagen: Basierend auf klassischem Framework von Vovk et al., erweitert auf Online-Umgebungen
  2. Adaptive konforme Vorhersage: Zeitvariable Fehlabdeckungswahrscheinlichkeits-Methode von Gibbs & Candès
  3. Multi-Modell-Methoden: Vergleich mit Arbeiten von Hajihashemi & Shen sowie Gasparin & Ramdas
  4. Online-Lerntheorie: Anlehnung an Gedanken aus Experten-Lernen und Multi-Armed-Bandit-Problemen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Graphstrukturierter Feedbackmechanismus kann Rechenkomplexität effektiv reduzieren und Vorhersageeffizienz verbessern
  2. Vorhersagemengen-Größe als Feedbacksignal verbessert Algorithmusleistung erheblich
  3. Theoretische Garantien stimmen mit experimentellen Ergebnissen überein und validieren die Methodenwirksamkeit

Einschränkungen

  1. Graphkonstruktion erfordert zusätzliche Hyperparameter-Optimierung
  2. Begrenzte Verbesserung wenn Kandidatenmodellqualität ähnlich ist
  3. Theoretische Analyse basiert auf spezifischen Verlustfunktions-Annahmen

Zukünftige Richtungen

  1. Erforschung komplexerer Graphstrukturen und Aktualisierungsstrategien
  2. Erweiterung auf Regressionaufgaben und andere Unsicherheitsquantifizierungsmethoden
  3. Untersuchung der Adaptivität unter starker Verteilungsverschiebung

Tiefgreifende Bewertung

Stärken

  1. Starke Methodische Innovativität: Graphstrukturierter Feedbackmechanismus bietet neue Perspektive für Multi-Modell-Auswahl
  2. Solide theoretische Grundlagen: Strenge Beweise für Abdeckungsrate und Bedauerungsgrenzen
  3. Umfassende Experimentelles Design: Abdeckung mehrerer Datensätze und Verteilungsverschiebungs-Szenarien
  4. Hoher praktischer Wert: Signifikante Reduzierung der Rechenkomplexität bei gleichzeitiger Verbesserung der Vorhersagequalität

Mängel

  1. Hyperparameter-Sensitivität: Erfordert Anpassung mehrerer graphbezogener Parameter
  2. Eingeschränkte Anwendungsszenarien: Vorteil nicht offensichtlich wenn Modellqualitätsunterschiede gering sind
  3. Komplexe theoretische Analyse: Beweisverlauf ist aufwändig, praktische Anwendbarkeit bedarf Validierung

Einflussfähigkeit

  1. Akademischer Beitrag: Bietet neue technische Route für Online-Unsicherheitsquantifizierungsfeld
  2. Anwendungsperspektive: Wichtiger Wert in sicherheitskritischen Systemen, die Echtzeitentscheidungen erfordern
  3. Reproduzierbarkeit: Detaillierte Algorithmusbeschreibung, klare Experimenteinrichtung

Anwendungsszenarien

  1. Online-Lernsysteme, die Echtzeitunsicherheitsquantifizierung erfordern
  2. Dynamische Umgebungen mit Verteilungsverschiebung
  3. Szenarien mit begrenzten Rechenressourcen aber erforderlicher Multi-Modell-Fusion
  4. Zuverlässige Vorhersageanforderungen in sicherheitskritischen Anwendungen

Literaturverzeichnis

  1. Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic learning in a random world
  2. Gibbs, I., & Candès, E. J. (2021). Adaptive conformal inference under distribution shift
  3. Hajihashemi, E., & Shen, Y. (2024). Multi-model ensemble conformal prediction in dynamic environments
  4. Gasparin, M., & Ramdas, A. (2024). Conformal online model aggregation