Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
Prédiction Conforme Multi-modèle En Ligne avec Rétroaction Structurée par Graphe
La prédiction conforme en ligne a démontré sa capacité à construire un ensemble de prédiction pour chaque point de données entrant qui couvre l'étiquette véritable avec une probabilité prédéterminée. Pour faire face aux changements potentiels de distribution, la prédiction conforme multi-modèle en ligne a été introduite pour sélectionner et exploiter différents modèles à partir d'un ensemble de candidats présélectionnés. Parallèlement à la flexibilité accrue, le choix de l'ensemble présélectionné pose également des défis. Un ensemble de candidats incluant un grand nombre de modèles peut augmenter la complexité computationnelle. De plus, l'inclusion de modèles non pertinents avec de mauvaises performances peut affecter négativement les performances et conduire à des ensembles de prédiction inutilement volumineux. Pour résoudre ces défis, nous proposons un nouvel algorithme de prédiction conforme multi-modèle en ligne qui identifie un sous-ensemble de modèles efficaces à chaque étape temporelle en collectant des rétroactions à partir d'un graphe bipartite, qui est affiné lors de la réception de nouvelles données. Un modèle est ensuite sélectionné à partir de ce sous-ensemble pour construire l'ensemble de prédiction, ce qui réduit la complexité computationnelle et les ensembles de prédiction plus petits. De plus, nous démontrons que l'utilisation de la taille de l'ensemble de prédiction comme rétroaction, aux côtés de la perte du modèle, peut améliorer significativement l'efficacité en construisant des ensembles de prédiction plus petits tout en satisfaisant la garantie de couverture requise. Les algorithmes proposés sont prouvés pour assurer une couverture valide et atteindre un regret sous-linéaire. Les expériences sur des ensembles de données réels et synthétiques valident que les méthodes proposées construisent des ensembles de prédiction plus petits et surpassent les approches existantes de prédiction conforme multi-modèle en ligne.
Problème à résoudre: Les méthodes existantes de prédiction conforme multi-modèle en ligne font face à des problèmes de complexité computationnelle élevée et d'ensembles de prédiction trop volumineux lors du traitement des changements de distribution. Les méthodes traditionnelles nécessitent la mise à jour et l'évaluation de tous les modèles candidats, ce qui entraîne une inefficacité lorsque l'ensemble de candidats contient un grand nombre de modèles ou des modèles de faible performance.
Importance du problème: Dans les applications critiques pour la sécurité (comme la conduite autonome, le diagnostic médical), une quantification fiable de l'incertitude est nécessaire pour assurer la crédibilité des décisions. La prédiction conforme peut fournir des ensembles de prédiction valides sans dépendre d'hypothèses de distribution, mais elle doit faire face aux changements dynamiques de la distribution des données dans un environnement en ligne.
Limitations des méthodes existantes:
La complexité computationnelle augmente linéairement avec le nombre de modèles candidats
L'inclusion de modèles de faible performance affecte négativement les performances globales
Absence de mécanisme efficace de sélection de modèles pour s'adapter dynamiquement aux changements de distribution
Motivation de la recherche: Développer un algorithme de prédiction conforme multi-modèle en ligne capable de sélectionner adaptativement un sous-ensemble de modèles efficaces, réduisant la complexité computationnelle et la taille de l'ensemble de prédiction tout en garantissant la couverture.
Proposition de l'algorithme GMOCP: Conception d'un algorithme de prédiction conforme multi-modèle en ligne basé sur une rétroaction structurée par graphe, identifiant dynamiquement les sous-ensembles de modèles efficaces via un graphe bipartite
Construction d'un cadre de génération de graphe adaptatif: Construction et mise à jour dynamique du graphe bipartite basées sur les performances historiques des modèles, réalisant la sélection de modèles en ligne
Développement de l'algorithme d'extension EGMOCP: Utilisation de la taille de l'ensemble de prédiction comme signal de rétroaction supplémentaire, améliorant davantage l'efficacité de prédiction
Fourniture de garanties théoriques: Preuve de la couverture valide de l'algorithme et des bornes de regret sous-linéaire
Validation de l'efficacité sur plusieurs ensembles de données: Réalisation d'ensembles de prédiction plus petits et d'une complexité computationnelle inférieure sur les ensembles de données CIFAR-10C, CIFAR-100C, etc.
Étant donné les données historiques {(Xτ,Yτtrue)}τ=1t−1 et la nouvelle entrée Xt, construire un ensemble de prédiction Cαm(Xt)⊆Y tel que l'étiquette véritable Yttrue soit contenue dans l'ensemble de prédiction avec une probabilité 1−α, où α est la probabilité de non-couverture.
Mécanisme de rétroaction structuré par graphe: Sélection dynamique des sous-ensembles de modèles via un graphe bipartite, évitant la mise à jour de tous les modèles
Conception de rétroaction double: EGMOCP considère simultanément la perte de prédiction et la taille de l'ensemble de prédiction comme signaux de rétroaction
Équilibre adaptatif exploration-exploitation: Réalisation d'une stratégie d'exploration multi-niveaux via différents coefficients d'exploration
Dans l'expérience de changement de distribution soudain sur l'ensemble de données CIFAR-100C:
GMOCP réalise un temps d'exécution plus rapide (amélioration d'environ 50%) et une taille d'ensemble de prédiction similaire par rapport à MOCP
EGMOCP réduit significativement la taille de l'ensemble de prédiction, passant de 12.63 pour MOCP à 6.18, tout en maintenant le taux de couverture cible de 90%
Le ratio de largeur unique passe de 22.43% à 29.91%
Amélioration de l'efficacité computationnelle: La complexité par étape de GMOCP est O(Nt + JMN), significativement réduite par rapport à O(Mt) de MOCP lorsque N << M
Amélioration de la qualité de prédiction: EGMOCP réalise des ensembles de prédiction plus petits via le mécanisme de rétroaction double
Vérification de la robustesse: Maintien de performances stables dans divers scénarios de changement de distribution