2025-11-16T14:37:12.620917

Multi-model Online Conformal Prediction with Graph-Structured Feedback

Hajihashemi, Shen

Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.

academic

Predizione Conforme Online Multi-modello con Feedback Strutturato a Grafo

Informazioni Fondamentali

ID Articolo: 2506.20898
Titolo: Multi-model Online Conformal Prediction with Graph-Structured Feedback
Autori: Erfan Hajihashemi, Yanning Shen (University of California, Irvine)
Classificazione: cs.LG
Data di Pubblicazione/Conferenza: Transactions on Machine Learning Research (10/2025)
Link Articolo: https://arxiv.org/abs/2506.20898

Riassunto

La predizione conforme online ha dimostrato la sua capacità di costruire un insieme di predizioni per ogni punto dati in arrivo che copre l'etichetta vera con una probabilità predeterminata. Per affrontare potenziali cambiamenti di distribuzione, è stata introdotta la predizione conforme online multi-modello per selezionare e sfruttare diversi modelli da un insieme di candidati preselezionati. Insieme alla maggiore flessibilità, la scelta dell'insieme preselezionato presenta anche sfide. Un insieme di candidati che include un gran numero di modelli può aumentare la complessità computazionale. Inoltre, l'inclusione di modelli irrilevanti con prestazioni scadenti può influire negativamente sulle prestazioni e portare a insiemi di predizioni inutilmente grandi. Per affrontare queste sfide, proponiamo un nuovo algoritmo di predizione conforme online multi-modello che identifica un sottoinsieme di modelli efficaci ad ogni passo temporale raccogliendo feedback da un grafo bipartito, che viene raffinato al ricevimento di nuovi dati. Un modello viene quindi selezionato da questo sottoinsieme per costruire l'insieme di predizioni, risultando in una complessità computazionale ridotta e insiemi di predizioni più piccoli. Inoltre, dimostriamo che l'utilizzo della dimensione dell'insieme di predizioni come feedback, insieme alla perdita del modello, può migliorare significativamente l'efficienza costruendo insiemi di predizioni più piccoli mantenendo comunque la garanzia di copertura richiesta. Gli algoritmi proposti sono provati garantire una copertura valida e raggiungere un rimpianto sublineare. Gli esperimenti su dataset reali e sintetici convalidano che i metodi proposti costruiscono insiemi di predizioni più piccoli e superano gli approcci di predizione conforme online multi-modello esistenti.

Contesto di Ricerca e Motivazione

Problema da risolvere: I metodi di predizione conforme online multi-modello esistenti affrontano problemi di elevata complessità computazionale e insiemi di predizioni eccessivamente grandi nel trattare cambiamenti di distribuzione. I metodi tradizionali richiedono l'aggiornamento e la valutazione di tutti i modelli candidati, il che porta a inefficienza quando l'insieme di candidati contiene numerosi modelli o modelli con prestazioni scadenti.
Importanza del problema: In applicazioni critiche per la sicurezza (come la guida autonoma, la diagnosi medica), è necessaria una quantificazione affidabile dell'incertezza per garantire l'affidabilità delle decisioni. La predizione conforme può fornire insiemi di predizioni validi senza dipendere da assunzioni distributive, ma negli ambienti online deve affrontare cambiamenti dinamici nella distribuzione dei dati.
Limitazioni dei metodi esistenti:
- La complessità computazionale cresce linearmente con il numero di modelli candidati
- L'inclusione di modelli con basse prestazioni influisce negativamente sulle prestazioni complessive
- Mancanza di meccanismi efficaci di selezione dei modelli per adattarsi dinamicamente ai cambiamenti di distribuzione
Motivazione della ricerca: Sviluppare un algoritmo di predizione conforme online multi-modello che possa selezionare adattivamente un sottoinsieme di modelli efficaci, riducendo la complessità computazionale e la dimensione dell'insieme di predizioni mantenendo le garanzie di copertura.

Contributi Fondamentali

Proposta dell'algoritmo GMOCP: Progettazione di un algoritmo di predizione conforme online multi-modello basato su feedback strutturato a grafo che identifica dinamicamente sottoinsiemi di modelli efficaci attraverso un grafo bipartito
Costruzione di un framework di generazione di grafi adattivi: Costruzione e aggiornamento dinamici del grafo bipartito basati sulle prestazioni storiche dei modelli, realizzando la selezione online dei modelli
Sviluppo dell'algoritmo esteso EGMOCP: Utilizzo della dimensione dell'insieme di predizioni come segnale di feedback aggiuntivo per migliorare ulteriormente l'efficienza predittiva
Fornitura di garanzie teoriche: Dimostrazione della copertura valida dell'algoritmo e dei limiti di rimpianto sublineare
Convalida dell'efficacia su più dataset: Realizzazione di insiemi di predizioni più piccoli e complessità computazionale inferiore su dataset come CIFAR-10C, CIFAR-100C

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dati i dati storici $\{(X_τ, Y^{true}_τ)\}^{t-1}_{τ=1}$ e il nuovo input $X_t$ , costruire un insieme di predizioni $C^m_α(X_t) ⊆ Y$ tale che l'etichetta vera $Y^{true}_t$ sia contenuta nell'insieme di predizioni con probabilità $1-α$ , dove $α$ è la probabilità di non copertura.

Architettura del Modello

1. Progettazione della Struttura del Grafo Bipartito

Nodi modello: $\{v^{(l)}_1, ..., v^{(l)}_M\}$ rappresentano M modelli candidati
Nodi di selezione: $\{v^{(s)}_1, ..., v^{(s)}_J\}$ rappresentano J nodi di selezione
Vincoli di connessione: Ogni nodo di selezione si connette al massimo a N nodi modello

Meccanismo di feedback strutturato a grafo: Selezione dinamica del sottoinsieme di modelli attraverso un grafo bipartito, evitando l'aggiornamento di tutti i modelli
Progettazione di feedback duale: EGMOCP considera contemporaneamente la perdita di predizione e la dimensione dell'insieme di predizioni come segnali di feedback
Equilibrio adattivo esplorazione-sfruttamento: Realizzazione di strategie di esplorazione multilivello attraverso diversi coefficienti di esplorazione

Configurazione Sperimentale

Dataset

CIFAR-10C/CIFAR-100C: Contengono 15 tipi di corruzione, 5 livelli di gravità
TinyImageNet-C: Dataset corrotto con 200 classi
Dataset sintetici: 3000 campioni, 20 classi, simulazione di cambiamento di distribuzione

Metriche di Valutazione

Coverage: Percentuale di insiemi di predizioni che contengono l'etichetta vera
Avg Width: Dimensione media dell'insieme di predizioni
Run Time: Tempo di esecuzione dell'algoritmo
Single Width: Percentuale di insiemi di predizioni di dimensione 1 che coprono correttamente

Metodi di Confronto

MOCP: Metodo di base per la predizione conforme online multi-modello
COMA: Metodo di aggregazione di modelli conformi online
Metodi a singolo modello: ACI, FACI, DECAY, SAOCP

Dettagli di Implementazione

Tasso di copertura target: 90% (α = 0.1)
Iperparametri: ε = 0.5, η = 0.05, β = 0.05
Numero di passi temporali: T = 6000
Dimensione del batch: 500 campioni

Risultati Sperimentali

Risultati Principali

Negli esperimenti di cambiamento di distribuzione improvviso sul dataset CIFAR-100C:

GMOCP realizza un tempo di esecuzione più veloce rispetto a MOCP (circa 50% di miglioramento) e dimensioni di insiemi di predizioni simili
EGMOCP riduce significativamente la dimensione dell'insieme di predizioni, da 12.63 di MOCP a 6.18, mantenendo il tasso di copertura target del 90%
La percentuale di larghezza singola aumenta dal 22.43% al 29.91%

Esperimenti di Ablazione

Impatto dei parametri del grafo: Test di diverse combinazioni di N (numero di nodi modello) e J (numero di nodi di selezione)
Strategie di esplorazione: Confronto dell'efficacia di diverse impostazioni di coefficienti di esplorazione
Meccanismo di feedback: Convalida dell'efficacia del feedback sulla dimensione dell'insieme di predizioni

Analisi di Casi

Attraverso tre configurazioni di addestramento di DenseNet121 (120D, 10R, 1R) si dimostra:

I modelli ad alte prestazioni (120D) ottengono il peso più alto e la probabilità di selezione più elevata
EGMOCP può identificare efficacemente e favorire la selezione di modelli con prestazioni migliori
La dimensione dell'insieme di predizioni è correlata negativamente con le prestazioni del modello

Scoperte Sperimentali

Miglioramento dell'efficienza computazionale: La complessità per passo di GMOCP è O(Nt + JMN), significativamente inferiore a O(Mt) di MOCP quando N << M
Miglioramento della qualità predittiva: EGMOCP realizza insiemi di predizioni più piccoli attraverso il meccanismo di feedback duale
Convalida della robustezza: Mantiene prestazioni stabili in vari scenari di cambiamento di distribuzione

Lavori Correlati

Fondamenti della predizione conforme: Basato sul framework classico di Vovk et al., esteso all'ambiente online
Predizione conforme adattiva: Metodo della probabilità di non copertura variabile nel tempo di Gibbs & Candès
Metodi multi-modello: Confronto con i lavori di Hajihashemi & Shen, Gasparin & Ramdas
Teoria dell'apprendimento online: Ispirazione da apprendimento da esperti e problemi di multi-armed bandit

Conclusioni e Discussione

Conclusioni Principali

Il meccanismo di feedback strutturato a grafo può ridurre efficacemente la complessità computazionale e migliorare l'efficienza predittiva
La dimensione dell'insieme di predizioni come segnale di feedback migliora significativamente le prestazioni dell'algoritmo
Le garanzie teoriche sono coerenti con i risultati sperimentali, convalidando l'efficacia del metodo

Limitazioni

La costruzione del grafo richiede ulteriore sintonizzazione degli iperparametri
Il miglioramento è limitato quando la qualità dei modelli candidati è simile
L'analisi teorica si basa su assunzioni specifiche della funzione di perdita

Direzioni Future

Esplorazione di strutture di grafi più complesse e strategie di aggiornamento
Estensione a compiti di regressione e altri metodi di quantificazione dell'incertezza
Ricerca sull'adattabilità sotto cambiamenti di distribuzione forti

Valutazione Approfondita

Punti di Forza

Forte innovazione metodologica: Il meccanismo di feedback strutturato a grafo fornisce una nuova prospettiva per la selezione multi-modello
Fondamenti teorici solidi: Fornisce dimostrazioni rigorose di copertura e limiti di rimpianto
Progettazione sperimentale completa: Copre molteplici dataset e scenari di cambiamento di distribuzione
Alto valore pratico: Riduce significativamente la complessità computazionale migliorando al contempo la qualità predittiva

Insufficienze

Sensibilità agli iperparametri: Richiede l'aggiustamento di molteplici parametri relativi al grafo
Limitazioni dello scenario applicabile: I vantaggi non sono evidenti quando le differenze di qualità tra i modelli sono piccole
Analisi teorica complessa: Il processo di dimostrazione è piuttosto elaborato, con applicabilità pratica da verificare

Impatto

Contributo accademico: Fornisce una nuova rotta tecnica per il campo della quantificazione dell'incertezza online
Prospettive di applicazione: Ha un valore importante nei sistemi critici per la sicurezza che richiedono decisioni in tempo reale
Riproducibilità: La descrizione dell'algoritmo è dettagliata e la configurazione sperimentale è chiara

Scenari Applicabili

Sistemi di apprendimento online che richiedono quantificazione dell'incertezza in tempo reale
Ambienti dinamici che affrontano cambiamenti di distribuzione
Scenari con risorse computazionali limitate ma che richiedono fusione multi-modello
Esigenze di predizioni affidabili in applicazioni critiche per la sicurezza

Riferimenti Bibliografici

Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic learning in a random world
Gibbs, I., & Candès, E. J. (2021). Adaptive conformal inference under distribution shift
Hajihashemi, E., & Shen, Y. (2024). Multi-model ensemble conformal prediction in dynamic environments
Gasparin, M., & Ramdas, A. (2024). Conformal online model aggregation