Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
Predicción Conforme En Línea Multimodelo con Retroalimentación Estructurada en Grafos
La predicción conforme en línea ha demostrado su capacidad para construir un conjunto de predicción para cada punto de datos entrante que cubra la etiqueta verdadera con una probabilidad predeterminada. Para hacer frente a posibles cambios de distribución, se ha introducido la predicción conforme en línea multimodelo para seleccionar y aprovechar diferentes modelos de un conjunto de candidatos preseleccionado. Junto con la flexibilidad mejorada, la elección del conjunto preseleccionado también presenta desafíos. Un conjunto de candidatos que incluye un gran número de modelos puede aumentar la complejidad computacional. Además, la inclusión de modelos irrelevantes con bajo rendimiento puede impactar negativamente el desempeño y conducir a conjuntos de predicción innecesariamente grandes. Para abordar estos desafíos, proponemos un nuevo algoritmo de predicción conforme en línea multimodelo que identifica un subconjunto de modelos efectivos en cada paso de tiempo recopilando retroalimentación de un grafo bipartito, que se refina al recibir nuevos datos. Luego se selecciona un modelo de este subconjunto para construir el conjunto de predicción, lo que resulta en complejidad computacional reducida y conjuntos de predicción más pequeños. Además, demostramos que utilizar el tamaño del conjunto de predicción como retroalimentación, junto con la pérdida del modelo, puede mejorar significativamente la eficiencia al construir conjuntos de predicción más pequeños mientras se mantiene la garantía de cobertura requerida. Se demuestra que los algoritmos propuestos garantizan cobertura válida y logran arrepentimiento sublineal. Los experimentos en conjuntos de datos reales y sintéticos validan que los métodos propuestos construyen conjuntos de predicción más pequeños y superan los enfoques existentes de predicción conforme en línea multimodelo.
Problema a Resolver: Los métodos existentes de predicción conforme en línea multimodelo enfrentan alta complejidad computacional y conjuntos de predicción excesivamente grandes al tratar cambios de distribución. Los métodos tradicionales requieren actualizar y evaluar todos los modelos candidatos, lo que resulta en ineficiencia cuando el conjunto de candidatos contiene muchos modelos o modelos con bajo rendimiento.
Importancia del Problema: En aplicaciones críticas para la seguridad (como conducción autónoma, diagnóstico médico), se requiere cuantificación confiable de incertidumbre para garantizar la confiabilidad de las decisiones. La predicción conforme puede proporcionar conjuntos de predicción válidos sin depender de suposiciones de distribución, pero en entornos en línea debe hacer frente a cambios dinámicos en la distribución de datos.
Limitaciones de Métodos Existentes:
La complejidad computacional crece linealmente con el número de modelos candidatos
La inclusión de modelos de bajo rendimiento impacta negativamente el desempeño general
Falta de mecanismos efectivos de selección de modelos para adaptarse dinámicamente a cambios de distribución
Motivación de Investigación: Desarrollar un algoritmo de predicción conforme en línea multimodelo que pueda seleccionar adaptativamente subconjuntos de modelos efectivos, reduciendo la complejidad computacional y el tamaño del conjunto de predicción mientras se garantiza la cobertura.
Propuesta del Algoritmo GMOCP: Diseño de un algoritmo de predicción conforme en línea multimodelo basado en retroalimentación estructurada en grafos que identifica dinámicamente subconjuntos de modelos efectivos mediante un grafo bipartito
Construcción de Marco de Generación de Grafos Adaptativo: Construcción y actualización dinámica del grafo bipartito basada en desempeño histórico de modelos, realizando selección de modelos en línea
Desarrollo del Algoritmo Extendido EGMOCP: Utilización del tamaño del conjunto de predicción como señal de retroalimentación adicional para mejorar aún más la eficiencia de predicción
Provisión de Garantías Teóricas: Demostración de cobertura válida del algoritmo y límites de arrepentimiento sublineal
Validación en Múltiples Conjuntos de Datos: Logro de conjuntos de predicción más pequeños y menor complejidad computacional en conjuntos de datos como CIFAR-10C y CIFAR-100C
Dado el historial de datos {(Xτ,Yτtrue)}τ=1t−1 y entrada nueva Xt, construir conjunto de predicción Cαm(Xt)⊆Y tal que la etiqueta verdadera Yttrue esté contenida en el conjunto de predicción con probabilidad 1−α, donde α es la probabilidad de no cobertura.
Mecanismo de Retroalimentación Estructurada en Grafos: Selección dinámica de subconjuntos de modelos mediante grafo bipartito, evitando actualización de todos los modelos
Diseño de Retroalimentación Dual: EGMOCP considera simultáneamente pérdida de predicción y tamaño del conjunto de predicción como señales de retroalimentación
Balance Adaptativo de Exploración-Explotación: Implementación de estrategia de exploración multinivel mediante diferentes coeficientes de exploración
Mejora de Eficiencia Computacional: La complejidad por paso de GMOCP es O(Nt + JMN), significativamente reducida en comparación con O(Mt) de MOCP cuando N << M
Mejora de Calidad de Predicción: EGMOCP logra conjuntos de predicción más pequeños mediante mecanismo de retroalimentación dual
Validación de Robustez: Mantiene desempeño estable bajo múltiples escenarios de cambio de distribución
El mecanismo de retroalimentación estructurada en grafos puede reducir efectivamente la complejidad computacional y mejorar la eficiencia de predicción
El tamaño del conjunto de predicción como señal de retroalimentación mejora significativamente el desempeño del algoritmo
Las garantías teóricas son consistentes con los resultados experimentales, validando la efectividad del método