Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन ग्राफ-संरचित प्रतिक्रिया के साथ
ऑनलाइन कनफॉर्मल प्रेडिक्शन प्रत्येक आने वाले डेटा बिंदु के लिए एक पूर्वनिर्धारित संभावना के साथ सही लेबल को कवर करने वाले प्रेडिक्शन सेट का निर्माण करने की क्षमता प्रदर्शित करता है। संभावित वितरण बदलाव से निपटने के लिए, बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन पूर्वनिर्धारित उम्मीदवार सेट से विभिन्न मॉडल का चयन और लाभ उठाने के लिए पेश किया गया है। बेहतर लचीलेपन के साथ, पूर्वनिर्धारित सेट की पसंद भी चुनौतियाँ लाती है। बड़ी संख्या में मॉडल वाला उम्मीदवार सेट कम्प्यूटेशनल जटिलता बढ़ा सकता है। इसके अलावा, खराब प्रदर्शन वाले अप्रासंगिक मॉडल का समावेश प्रदर्शन को नकारात्मक रूप से प्रभावित कर सकता है और अनावश्यक रूप से बड़े प्रेडिक्शन सेट का कारण बन सकता है। इन चुनौतियों का समाधान करने के लिए, हम एक नवीन बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन एल्गोरिदम प्रस्तावित करते हैं जो द्विपक्षीय ग्राफ से प्रतिक्रिया एकत्र करके प्रत्येक समय चरण पर प्रभावी मॉडल के सबसेट की पहचान करता है, जिसे नए डेटा प्राप्त करने पर परिष्कृत किया जाता है। फिर इस सबसेट से एक मॉडल का चयन किया जाता है ताकि प्रेडिक्शन सेट का निर्माण किया जा सके, जिससे कम्प्यूटेशनल जटिलता कम हो और प्रेडिक्शन सेट छोटे हों। इसके अतिरिक्त, हम प्रदर्शित करते हैं कि प्रेडिक्शन सेट आकार को प्रतिक्रिया के रूप में उपयोग करना, मॉडल हानि के साथ, आवश्यक कवरेज गारंटी को संतुष्ट करते हुए छोटे प्रेडिक्शन सेट का निर्माण करके दक्षता में काफी सुधार कर सकता है। प्रस्तावित एल्गोरिदम को वैध कवरेज सुनिश्चित करने और उप-रैखिक खेद प्राप्त करने के लिए सिद्ध किया गया है। वास्तविक और सिंथेटिक डेटासेट पर प्रयोग सत्यापित करते हैं कि प्रस्तावित विधियाँ छोटे प्रेडिक्शन सेट का निर्माण करती हैं और मौजूदा बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन दृष्टिकोणों को पार करती हैं।
समाधान की जाने वाली समस्या: मौजूदा बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन विधियाँ वितरण बदलाव को संभालते समय उच्च कम्प्यूटेशनल जटिलता और अत्यधिक बड़े प्रेडिक्शन सेट का सामना करती हैं। पारंपरिक विधियों को सभी उम्मीदवार मॉडल को अपडेट और मूल्यांकन करने की आवश्यकता होती है, जब उम्मीदवार सेट में बड़ी संख्या में मॉडल या खराब प्रदर्शन वाले मॉडल होते हैं, तो यह अक्षमता का कारण बनता है।
समस्या की महत्ता: सुरक्षा-महत्वपूर्ण अनुप्रयोगों (जैसे स्वायत्त ड्राइविंग, चिकित्सा निदान) में, निर्णय की विश्वसनीयता सुनिश्चित करने के लिए विश्वसनीय अनिश्चितता परिमाणीकरण की आवश्यकता होती है। कनफॉर्मल प्रेडिक्शन वितरण धारणा पर निर्भर किए बिना प्रभावी प्रेडिक्शन सेट प्रदान कर सकता है, लेकिन ऑनलाइन वातावरण में डेटा वितरण के गतिशील परिवर्तन का सामना करने की आवश्यकता होती है।
मौजूदा विधियों की सीमाएँ:
कम्प्यूटेशनल जटिलता उम्मीदवार मॉडल की संख्या के साथ रैखिक रूप से बढ़ती है
कम प्रदर्शन वाले मॉडल का समावेश समग्र प्रदर्शन को नकारात्मक रूप से प्रभावित करता है
वितरण परिवर्तन के अनुकूल होने के लिए गतिशील मॉडल चयन तंत्र की कमी
अनुसंधान प्रेरणा: एक ऐसा एल्गोरिदम विकसित करना जो कवरेज दर को सुनिश्चित करते हुए कम्प्यूटेशनल जटिलता को कम करे और प्रेडिक्शन सेट आकार को कम करे, प्रभावी मॉडल के सबसेट का स्व-अनुकूल चयन कर सके।
GMOCP एल्गोरिदम प्रस्तावित किया: ग्राफ-संरचित प्रतिक्रिया के आधार पर बहु-मॉडल ऑनलाइन कनफॉर्मल प्रेडिक्शन एल्गोरिदम डिज़ाइन किया, द्विपक्षीय ग्राफ के माध्यम से प्रभावी मॉडल के सबसेट की गतिशील पहचान
स्व-अनुकूल ग्राफ जनरेशन फ्रेमवर्क का निर्माण: मॉडल के ऑनलाइन चयन को सक्षम करते हुए, मॉडल के ऐतिहासिक प्रदर्शन के आधार पर द्विपक्षीय ग्राफ को गतिशील रूप से निर्माण और अपडेट करना
EGMOCP विस्तार एल्गोरिदम विकसित किया: प्रेडिक्शन सेट आकार को अतिरिक्त प्रतिक्रिया संकेत के रूप में उपयोग करना, प्रेडिक्शन दक्षता को और बढ़ाना
सैद्धांतिक गारंटी प्रदान की: एल्गोरिदम की वैध कवरेज दर और उप-रैखिक खेद सीमा सिद्ध की
कई डेटासेट पर प्रभावशीलता सत्यापित की: CIFAR-10C, CIFAR-100C आदि डेटासेट पर छोटे प्रेडिक्शन सेट और कम कम्प्यूटेशनल जटिलता प्राप्त की
ऐतिहासिक डेटा {(Xτ,Yτtrue)}τ=1t−1 और नई इनपुट Xt दी गई है, प्रेडिक्शन सेट Cαm(Xt)⊆Y का निर्माण करें ताकि सही लेबल Yttrue संभावना 1−α के साथ प्रेडिक्शन सेट में समाहित हो, जहाँ α गलत कवरेज संभावना है।