Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
Multi-Modell Online Konforme Vorhersage mit Graphstrukturiertem Feedback
Die Online konforme Vorhersage hat ihre Fähigkeit demonstriert, für jeden eingehenden Datenpunkt eine Vorhersagemenge zu konstruieren, die das echte Label mit einer vordefinierten Wahrscheinlichkeit abdeckt. Um mit potenziellen Verteilungsverschiebungen umzugehen, wurde die Multi-Modell Online konforme Vorhersage eingeführt, um verschiedene Modelle aus einer vorausgewählten Kandidatenmenge auszuwählen und zu nutzen. Zusammen mit der verbesserten Flexibilität bringt die Wahl der vorausgewählten Menge auch Herausforderungen mit sich. Eine Kandidatenmenge, die eine große Anzahl von Modellen enthält, kann die Rechenkomplexität erhöhen. Darüber hinaus kann die Aufnahme irrelevanter Modelle mit schlechter Leistung die Leistung negativ beeinflussen und zu unnötig großen Vorhersagemengen führen. Um diese Herausforderungen zu bewältigen, schlagen wir einen neuartigen Multi-Modell Online konformen Vorhersagealgorithmus vor, der eine Teilmenge effektiver Modelle bei jedem Zeitschritt durch Sammlung von Feedback aus einem bipartiten Graphen identifiziert, der bei Empfang neuer Daten verfeinert wird. Ein Modell wird dann aus dieser Teilmenge ausgewählt, um die Vorhersagemenge zu konstruieren, was zu reduzierter Rechenkomplexität und kleineren Vorhersagemengen führt. Zusätzlich demonstrieren wir, dass die Verwendung der Vorhersagemengen-Größe als Feedback zusammen mit Modellverlust die Effizienz erheblich verbessern kann, indem kleinere Vorhersagemengen konstruiert werden, während die erforderliche Abdeckungsgarantie noch erfüllt wird. Die vorgeschlagenen Algorithmen werden bewiesen, um gültige Abdeckung zu gewährleisten und sublineares Bedauern zu erreichen. Experimente auf realen und synthetischen Datensätzen validieren, dass die vorgeschlagenen Methoden kleinere Vorhersagemengen konstruieren und bestehende Multi-Modell Online konforme Vorhersageansätze übertreffen.
Zu lösende Probleme: Bestehende Multi-Modell Online konforme Vorhersagemethoden sehen sich bei der Behandlung von Verteilungsverschiebungen mit hoher Rechenkomplexität und übermäßig großen Vorhersagemengen konfrontiert. Traditionelle Methoden erfordern die Aktualisierung und Bewertung aller Kandidatenmodelle, was bei großen Kandidatenmengen oder Modellen mit schlechter Leistung zu Ineffizienz führt.
Bedeutung des Problems: In sicherheitskritischen Anwendungen (wie autonomes Fahren, medizinische Diagnostik) ist eine zuverlässige Unsicherheitsquantifizierung erforderlich, um die Glaubwürdigkeit von Entscheidungen zu gewährleisten. Die konforme Vorhersage kann gültige Vorhersagemengen ohne Abhängigkeit von Verteilungsannahmen bereitstellen, erfordert aber in Online-Umgebungen die Bewältigung dynamischer Änderungen der Datenverteilung.
Einschränkungen bestehender Methoden:
Rechenkomplexität wächst linear mit der Anzahl der Kandidatenmodelle
Die Aufnahme von Modellen mit niedriger Leistung beeinträchtigt die Gesamtleistung negativ
Mangel an effektiven Modellauswahlmechanismen zur dynamischen Anpassung an Verteilungsverschiebungen
Forschungsmotivation: Entwicklung eines Multi-Modell Online konformen Vorhersagealgorithmus, der adaptive Modelluntermengenwahl ermöglicht, während die Abdeckungsgarantie beibehalten, die Rechenkomplexität reduziert und die Vorhersagemengen-Größe verringert wird.
Vorschlag des GMOCP-Algorithmus: Entwurf eines Multi-Modell Online konformen Vorhersagealgorithmus basierend auf graphstrukturiertem Feedback, der durch bipartite Graphen dynamisch effektive Modelluntermengen identifiziert
Konstruktion eines adaptiven Graphgenerierungsrahmens: Dynamische Konstruktion und Aktualisierung des bipartiten Graphen basierend auf historischer Modellleistung, um Online-Modellauswahl zu ermöglichen
Entwicklung des EGMOCP-Erweiterungsalgorithmus: Verwendung der Vorhersagemengen-Größe als zusätzliches Feedbacksignal zur weiteren Verbesserung der Vorhersageeffizienz
Bereitstellung theoretischer Garantien: Beweis der gültigen Abdeckungsrate und sublinearer Bedauerungsgrenzen des Algorithmus
Validierung der Wirksamkeit auf mehreren Datensätzen: Realisierung kleinerer Vorhersagemengen und niedrigerer Rechenkomplexität auf Datensätzen wie CIFAR-10C und CIFAR-100C
Gegeben historische Daten {(Xτ,Yτtrue)}τ=1t−1 und neue Eingabe Xt, konstruiere eine Vorhersagemenge Cαm(Xt)⊆Y so dass das echte Label Yttrue mit Wahrscheinlichkeit 1−α in der Vorhersagemenge enthalten ist, wobei α die Fehlabdeckungswahrscheinlichkeit ist.