Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
Predizione Conforme Online Multi-modello con Feedback Strutturato a Grafo
La predizione conforme online ha dimostrato la sua capacità di costruire un insieme di predizioni per ogni punto dati in arrivo che copre l'etichetta vera con una probabilità predeterminata. Per affrontare potenziali cambiamenti di distribuzione, è stata introdotta la predizione conforme online multi-modello per selezionare e sfruttare diversi modelli da un insieme di candidati preselezionati. Insieme alla maggiore flessibilità, la scelta dell'insieme preselezionato presenta anche sfide. Un insieme di candidati che include un gran numero di modelli può aumentare la complessità computazionale. Inoltre, l'inclusione di modelli irrilevanti con prestazioni scadenti può influire negativamente sulle prestazioni e portare a insiemi di predizioni inutilmente grandi. Per affrontare queste sfide, proponiamo un nuovo algoritmo di predizione conforme online multi-modello che identifica un sottoinsieme di modelli efficaci ad ogni passo temporale raccogliendo feedback da un grafo bipartito, che viene raffinato al ricevimento di nuovi dati. Un modello viene quindi selezionato da questo sottoinsieme per costruire l'insieme di predizioni, risultando in una complessità computazionale ridotta e insiemi di predizioni più piccoli. Inoltre, dimostriamo che l'utilizzo della dimensione dell'insieme di predizioni come feedback, insieme alla perdita del modello, può migliorare significativamente l'efficienza costruendo insiemi di predizioni più piccoli mantenendo comunque la garanzia di copertura richiesta. Gli algoritmi proposti sono provati garantire una copertura valida e raggiungere un rimpianto sublineare. Gli esperimenti su dataset reali e sintetici convalidano che i metodi proposti costruiscono insiemi di predizioni più piccoli e superano gli approcci di predizione conforme online multi-modello esistenti.
Problema da risolvere: I metodi di predizione conforme online multi-modello esistenti affrontano problemi di elevata complessità computazionale e insiemi di predizioni eccessivamente grandi nel trattare cambiamenti di distribuzione. I metodi tradizionali richiedono l'aggiornamento e la valutazione di tutti i modelli candidati, il che porta a inefficienza quando l'insieme di candidati contiene numerosi modelli o modelli con prestazioni scadenti.
Importanza del problema: In applicazioni critiche per la sicurezza (come la guida autonoma, la diagnosi medica), è necessaria una quantificazione affidabile dell'incertezza per garantire l'affidabilità delle decisioni. La predizione conforme può fornire insiemi di predizioni validi senza dipendere da assunzioni distributive, ma negli ambienti online deve affrontare cambiamenti dinamici nella distribuzione dei dati.
Limitazioni dei metodi esistenti:
La complessità computazionale cresce linearmente con il numero di modelli candidati
L'inclusione di modelli con basse prestazioni influisce negativamente sulle prestazioni complessive
Mancanza di meccanismi efficaci di selezione dei modelli per adattarsi dinamicamente ai cambiamenti di distribuzione
Motivazione della ricerca: Sviluppare un algoritmo di predizione conforme online multi-modello che possa selezionare adattivamente un sottoinsieme di modelli efficaci, riducendo la complessità computazionale e la dimensione dell'insieme di predizioni mantenendo le garanzie di copertura.
Proposta dell'algoritmo GMOCP: Progettazione di un algoritmo di predizione conforme online multi-modello basato su feedback strutturato a grafo che identifica dinamicamente sottoinsiemi di modelli efficaci attraverso un grafo bipartito
Costruzione di un framework di generazione di grafi adattivi: Costruzione e aggiornamento dinamici del grafo bipartito basati sulle prestazioni storiche dei modelli, realizzando la selezione online dei modelli
Sviluppo dell'algoritmo esteso EGMOCP: Utilizzo della dimensione dell'insieme di predizioni come segnale di feedback aggiuntivo per migliorare ulteriormente l'efficienza predittiva
Fornitura di garanzie teoriche: Dimostrazione della copertura valida dell'algoritmo e dei limiti di rimpianto sublineare
Convalida dell'efficacia su più dataset: Realizzazione di insiemi di predizioni più piccoli e complessità computazionale inferiore su dataset come CIFAR-10C, CIFAR-100C
Dati i dati storici {(Xτ,Yτtrue)}τ=1t−1 e il nuovo input Xt, costruire un insieme di predizioni Cαm(Xt)⊆Y tale che l'etichetta vera Yttrue sia contenuta nell'insieme di predizioni con probabilità 1−α, dove α è la probabilità di non copertura.
Meccanismo di feedback strutturato a grafo: Selezione dinamica del sottoinsieme di modelli attraverso un grafo bipartito, evitando l'aggiornamento di tutti i modelli
Progettazione di feedback duale: EGMOCP considera contemporaneamente la perdita di predizione e la dimensione dell'insieme di predizioni come segnali di feedback
Equilibrio adattivo esplorazione-sfruttamento: Realizzazione di strategie di esplorazione multilivello attraverso diversi coefficienti di esplorazione
Miglioramento dell'efficienza computazionale: La complessità per passo di GMOCP è O(Nt + JMN), significativamente inferiore a O(Mt) di MOCP quando N << M
Miglioramento della qualità predittiva: EGMOCP realizza insiemi di predizioni più piccoli attraverso il meccanismo di feedback duale
Convalida della robustezza: Mantiene prestazioni stabili in vari scenari di cambiamento di distribuzione