2025-11-16T14:37:12.620917

Multi-model Online Conformal Prediction with Graph-Structured Feedback

Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic

Predizione Conforme Online Multi-modello con Feedback Strutturato a Grafo

Informazioni Fondamentali

  • ID Articolo: 2506.20898
  • Titolo: Multi-model Online Conformal Prediction with Graph-Structured Feedback
  • Autori: Erfan Hajihashemi, Yanning Shen (University of California, Irvine)
  • Classificazione: cs.LG
  • Data di Pubblicazione/Conferenza: Transactions on Machine Learning Research (10/2025)
  • Link Articolo: https://arxiv.org/abs/2506.20898

Riassunto

La predizione conforme online ha dimostrato la sua capacità di costruire un insieme di predizioni per ogni punto dati in arrivo che copre l'etichetta vera con una probabilità predeterminata. Per affrontare potenziali cambiamenti di distribuzione, è stata introdotta la predizione conforme online multi-modello per selezionare e sfruttare diversi modelli da un insieme di candidati preselezionati. Insieme alla maggiore flessibilità, la scelta dell'insieme preselezionato presenta anche sfide. Un insieme di candidati che include un gran numero di modelli può aumentare la complessità computazionale. Inoltre, l'inclusione di modelli irrilevanti con prestazioni scadenti può influire negativamente sulle prestazioni e portare a insiemi di predizioni inutilmente grandi. Per affrontare queste sfide, proponiamo un nuovo algoritmo di predizione conforme online multi-modello che identifica un sottoinsieme di modelli efficaci ad ogni passo temporale raccogliendo feedback da un grafo bipartito, che viene raffinato al ricevimento di nuovi dati. Un modello viene quindi selezionato da questo sottoinsieme per costruire l'insieme di predizioni, risultando in una complessità computazionale ridotta e insiemi di predizioni più piccoli. Inoltre, dimostriamo che l'utilizzo della dimensione dell'insieme di predizioni come feedback, insieme alla perdita del modello, può migliorare significativamente l'efficienza costruendo insiemi di predizioni più piccoli mantenendo comunque la garanzia di copertura richiesta. Gli algoritmi proposti sono provati garantire una copertura valida e raggiungere un rimpianto sublineare. Gli esperimenti su dataset reali e sintetici convalidano che i metodi proposti costruiscono insiemi di predizioni più piccoli e superano gli approcci di predizione conforme online multi-modello esistenti.

Contesto di Ricerca e Motivazione

  1. Problema da risolvere: I metodi di predizione conforme online multi-modello esistenti affrontano problemi di elevata complessità computazionale e insiemi di predizioni eccessivamente grandi nel trattare cambiamenti di distribuzione. I metodi tradizionali richiedono l'aggiornamento e la valutazione di tutti i modelli candidati, il che porta a inefficienza quando l'insieme di candidati contiene numerosi modelli o modelli con prestazioni scadenti.
  2. Importanza del problema: In applicazioni critiche per la sicurezza (come la guida autonoma, la diagnosi medica), è necessaria una quantificazione affidabile dell'incertezza per garantire l'affidabilità delle decisioni. La predizione conforme può fornire insiemi di predizioni validi senza dipendere da assunzioni distributive, ma negli ambienti online deve affrontare cambiamenti dinamici nella distribuzione dei dati.
  3. Limitazioni dei metodi esistenti:
    • La complessità computazionale cresce linearmente con il numero di modelli candidati
    • L'inclusione di modelli con basse prestazioni influisce negativamente sulle prestazioni complessive
    • Mancanza di meccanismi efficaci di selezione dei modelli per adattarsi dinamicamente ai cambiamenti di distribuzione
  4. Motivazione della ricerca: Sviluppare un algoritmo di predizione conforme online multi-modello che possa selezionare adattivamente un sottoinsieme di modelli efficaci, riducendo la complessità computazionale e la dimensione dell'insieme di predizioni mantenendo le garanzie di copertura.

Contributi Fondamentali

  1. Proposta dell'algoritmo GMOCP: Progettazione di un algoritmo di predizione conforme online multi-modello basato su feedback strutturato a grafo che identifica dinamicamente sottoinsiemi di modelli efficaci attraverso un grafo bipartito
  2. Costruzione di un framework di generazione di grafi adattivi: Costruzione e aggiornamento dinamici del grafo bipartito basati sulle prestazioni storiche dei modelli, realizzando la selezione online dei modelli
  3. Sviluppo dell'algoritmo esteso EGMOCP: Utilizzo della dimensione dell'insieme di predizioni come segnale di feedback aggiuntivo per migliorare ulteriormente l'efficienza predittiva
  4. Fornitura di garanzie teoriche: Dimostrazione della copertura valida dell'algoritmo e dei limiti di rimpianto sublineare
  5. Convalida dell'efficacia su più dataset: Realizzazione di insiemi di predizioni più piccoli e complessità computazionale inferiore su dataset come CIFAR-10C, CIFAR-100C

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dati i dati storici {(Xτ,Yτtrue)}τ=1t1\{(X_τ, Y^{true}_τ)\}^{t-1}_{τ=1} e il nuovo input XtX_t, costruire un insieme di predizioni Cαm(Xt)YC^m_α(X_t) ⊆ Y tale che l'etichetta vera YttrueY^{true}_t sia contenuta nell'insieme di predizioni con probabilità 1α1-α, dove αα è la probabilità di non copertura.

Architettura del Modello

1. Progettazione della Struttura del Grafo Bipartito

  • Nodi modello: {v1(l),...,vM(l)}\{v^{(l)}_1, ..., v^{(l)}_M\} rappresentano M modelli candidati
  • Nodi di selezione: {v1(s),...,vJ(s)}\{v^{(s)}_1, ..., v^{(s)}_J\} rappresentano J nodi di selezione
  • Vincoli di connessione: Ogni nodo di selezione si connette al massimo a N nodi modello

2. Algoritmo di Generazione del Grafo

Probabilità di connessione del nodo modello: ptm=(1ηe)wtmmˉ=1Mwtmˉ+ηeMp^m_t = (1 - η_e) \frac{w^m_t}{\sum^M_{\bar{m}=1} w^{\bar{m}}_t} + \frac{η_e}{M}

dove ηeη_e è il coefficiente di esplorazione e wtmw^m_t è il peso del modello.

3. Aggiornamento del Peso del Modello

Utilizzo della stima della perdita con campionamento per importanza: wt+1m=wtmexp(εltm/2b)w^m_{t+1} = w^m_t \exp(-ε l^m_t / 2^b)

dove la funzione di perdita è: ltm=L(αˉtm,αtm)qtmI{mSt}l^m_t = \frac{L(\bar{α}^m_t, α^m_t)}{q^m_t} I\{m ∈ S_t\}

4. Aggiornamento Adattivo della Probabilità di Non Copertura

Utilizzo della discesa del gradiente online Scale-Free: αt+1m=αtmηαtmL(αˉtm,αtm)τ=1tατmL(αˉτm,ατm)22α^m_{t+1} = α^m_t - η \frac{∇_{α^m_t} L(\bar{α}^m_t, α^m_t)}{\sqrt{\sum^t_{τ=1} \|∇_{α^m_τ} L(\bar{α}^m_τ, α^m_τ)\|^2_2}}

Punti di Innovazione Tecnica

  1. Meccanismo di feedback strutturato a grafo: Selezione dinamica del sottoinsieme di modelli attraverso un grafo bipartito, evitando l'aggiornamento di tutti i modelli
  2. Progettazione di feedback duale: EGMOCP considera contemporaneamente la perdita di predizione e la dimensione dell'insieme di predizioni come segnali di feedback
  3. Equilibrio adattivo esplorazione-sfruttamento: Realizzazione di strategie di esplorazione multilivello attraverso diversi coefficienti di esplorazione

Configurazione Sperimentale

Dataset

  1. CIFAR-10C/CIFAR-100C: Contengono 15 tipi di corruzione, 5 livelli di gravità
  2. TinyImageNet-C: Dataset corrotto con 200 classi
  3. Dataset sintetici: 3000 campioni, 20 classi, simulazione di cambiamento di distribuzione

Metriche di Valutazione

  • Coverage: Percentuale di insiemi di predizioni che contengono l'etichetta vera
  • Avg Width: Dimensione media dell'insieme di predizioni
  • Run Time: Tempo di esecuzione dell'algoritmo
  • Single Width: Percentuale di insiemi di predizioni di dimensione 1 che coprono correttamente

Metodi di Confronto

  • MOCP: Metodo di base per la predizione conforme online multi-modello
  • COMA: Metodo di aggregazione di modelli conformi online
  • Metodi a singolo modello: ACI, FACI, DECAY, SAOCP

Dettagli di Implementazione

  • Tasso di copertura target: 90% (α = 0.1)
  • Iperparametri: ε = 0.5, η = 0.05, β = 0.05
  • Numero di passi temporali: T = 6000
  • Dimensione del batch: 500 campioni

Risultati Sperimentali

Risultati Principali

Negli esperimenti di cambiamento di distribuzione improvviso sul dataset CIFAR-100C:

  • GMOCP realizza un tempo di esecuzione più veloce rispetto a MOCP (circa 50% di miglioramento) e dimensioni di insiemi di predizioni simili
  • EGMOCP riduce significativamente la dimensione dell'insieme di predizioni, da 12.63 di MOCP a 6.18, mantenendo il tasso di copertura target del 90%
  • La percentuale di larghezza singola aumenta dal 22.43% al 29.91%

Esperimenti di Ablazione

  1. Impatto dei parametri del grafo: Test di diverse combinazioni di N (numero di nodi modello) e J (numero di nodi di selezione)
  2. Strategie di esplorazione: Confronto dell'efficacia di diverse impostazioni di coefficienti di esplorazione
  3. Meccanismo di feedback: Convalida dell'efficacia del feedback sulla dimensione dell'insieme di predizioni

Analisi di Casi

Attraverso tre configurazioni di addestramento di DenseNet121 (120D, 10R, 1R) si dimostra:

  • I modelli ad alte prestazioni (120D) ottengono il peso più alto e la probabilità di selezione più elevata
  • EGMOCP può identificare efficacemente e favorire la selezione di modelli con prestazioni migliori
  • La dimensione dell'insieme di predizioni è correlata negativamente con le prestazioni del modello

Scoperte Sperimentali

  1. Miglioramento dell'efficienza computazionale: La complessità per passo di GMOCP è O(Nt + JMN), significativamente inferiore a O(Mt) di MOCP quando N << M
  2. Miglioramento della qualità predittiva: EGMOCP realizza insiemi di predizioni più piccoli attraverso il meccanismo di feedback duale
  3. Convalida della robustezza: Mantiene prestazioni stabili in vari scenari di cambiamento di distribuzione

Lavori Correlati

  1. Fondamenti della predizione conforme: Basato sul framework classico di Vovk et al., esteso all'ambiente online
  2. Predizione conforme adattiva: Metodo della probabilità di non copertura variabile nel tempo di Gibbs & Candès
  3. Metodi multi-modello: Confronto con i lavori di Hajihashemi & Shen, Gasparin & Ramdas
  4. Teoria dell'apprendimento online: Ispirazione da apprendimento da esperti e problemi di multi-armed bandit

Conclusioni e Discussione

Conclusioni Principali

  1. Il meccanismo di feedback strutturato a grafo può ridurre efficacemente la complessità computazionale e migliorare l'efficienza predittiva
  2. La dimensione dell'insieme di predizioni come segnale di feedback migliora significativamente le prestazioni dell'algoritmo
  3. Le garanzie teoriche sono coerenti con i risultati sperimentali, convalidando l'efficacia del metodo

Limitazioni

  1. La costruzione del grafo richiede ulteriore sintonizzazione degli iperparametri
  2. Il miglioramento è limitato quando la qualità dei modelli candidati è simile
  3. L'analisi teorica si basa su assunzioni specifiche della funzione di perdita

Direzioni Future

  1. Esplorazione di strutture di grafi più complesse e strategie di aggiornamento
  2. Estensione a compiti di regressione e altri metodi di quantificazione dell'incertezza
  3. Ricerca sull'adattabilità sotto cambiamenti di distribuzione forti

Valutazione Approfondita

Punti di Forza

  1. Forte innovazione metodologica: Il meccanismo di feedback strutturato a grafo fornisce una nuova prospettiva per la selezione multi-modello
  2. Fondamenti teorici solidi: Fornisce dimostrazioni rigorose di copertura e limiti di rimpianto
  3. Progettazione sperimentale completa: Copre molteplici dataset e scenari di cambiamento di distribuzione
  4. Alto valore pratico: Riduce significativamente la complessità computazionale migliorando al contempo la qualità predittiva

Insufficienze

  1. Sensibilità agli iperparametri: Richiede l'aggiustamento di molteplici parametri relativi al grafo
  2. Limitazioni dello scenario applicabile: I vantaggi non sono evidenti quando le differenze di qualità tra i modelli sono piccole
  3. Analisi teorica complessa: Il processo di dimostrazione è piuttosto elaborato, con applicabilità pratica da verificare

Impatto

  1. Contributo accademico: Fornisce una nuova rotta tecnica per il campo della quantificazione dell'incertezza online
  2. Prospettive di applicazione: Ha un valore importante nei sistemi critici per la sicurezza che richiedono decisioni in tempo reale
  3. Riproducibilità: La descrizione dell'algoritmo è dettagliata e la configurazione sperimentale è chiara

Scenari Applicabili

  1. Sistemi di apprendimento online che richiedono quantificazione dell'incertezza in tempo reale
  2. Ambienti dinamici che affrontano cambiamenti di distribuzione
  3. Scenari con risorse computazionali limitate ma che richiedono fusione multi-modello
  4. Esigenze di predizioni affidabili in applicazioni critiche per la sicurezza

Riferimenti Bibliografici

  1. Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic learning in a random world
  2. Gibbs, I., & Candès, E. J. (2021). Adaptive conformal inference under distribution shift
  3. Hajihashemi, E., & Shen, Y. (2024). Multi-model ensemble conformal prediction in dynamic environments
  4. Gasparin, M., & Ramdas, A. (2024). Conformal online model aggregation