Multi-model Online Conformal Prediction with Graph-Structured Feedback
Hajihashemi, Shen
Online conformal prediction has demonstrated its capability to construct a prediction set for each incoming data point that covers the true label with a predetermined probability. To cope with potential distribution shift, multi-model online conformal prediction has been introduced to select and leverage different models from a preselected candidate set. Along with the improved flexibility, the choice of the preselected set also brings challenges. A candidate set that includes a large number of models may increase the computational complexity. In addition, the inclusion of irrelevant models with poor performance may negatively impact the performance and lead to unnecessarily large prediction sets. To address these challenges, we propose a novel multi-model online conformal prediction algorithm that identifies a subset of effective models at each time step by collecting feedback from a bipartite graph, which is refined upon receiving new data. A model is then selected from this subset to construct the prediction set, resulting in reduced computational complexity and smaller prediction sets. Additionally, we demonstrate that using prediction set size as feedback, alongside model loss, can significantly improve efficiency by constructing smaller prediction sets while still satisfying the required coverage guarantee. The proposed algorithms are proven to ensure valid coverage and achieve sublinear regret. Experiments on real and synthetic datasets validate that the proposed methods construct smaller prediction sets and outperform existing multi-model online conformal prediction approaches.
academic
বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন গ্রাফ-স্ট্রাকচার্ড ফিডব্যাক সহ
অনলাইন কনফরমাল প্রেডিকশন প্রতিটি আগত ডেটা পয়েন্টের জন্য একটি প্রেডিকশন সেট তৈরি করার ক্ষমতা প্রদর্শন করেছে যা পূর্বনির্ধারিত সম্ভাবনার সাথে সত্য লেবেল কভার করে। সম্ভাব্য বিতরণ পরিবর্তনের মোকাবেলা করার জন্য, বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন একটি পূর্বনির্বাচিত প্রার্থী সেট থেকে বিভিন্ন মডেল নির্বাচন এবং ব্যবহার করার জন্য প্রবর্তিত হয়েছে। উন্নত নমনীয়তার সাথে, পূর্বনির্বাচিত সেটের পছন্দও চ্যালেঞ্জ নিয়ে আসে। বড় সংখ্যক মডেল অন্তর্ভুক্ত করে এমন একটি প্রার্থী সেট গণনামূলক জটিলতা বৃদ্ধি করতে পারে। অতিরিক্তভাবে, দুর্বল কর্মক্ষমতা সহ অপ্রাসঙ্গিক মডেলের অন্তর্ভুক্তি কর্মক্ষমতা নেতিবাচকভাবে প্রভাবিত করতে পারে এবং অপ্রয়োজনীয়ভাবে বড় প্রেডিকশন সেটের দিকে পরিচালিত করতে পারে। এই চ্যালেঞ্জগুলি মোকাবেলা করার জন্য, আমরা একটি উপন্যাস বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন অ্যালগরিদম প্রস্তাব করি যা প্রতিটি সময় পদক্ষেপে একটি দ্বিপক্ষীয় গ্রাফ থেকে ফিডব্যাক সংগ্রহ করে কার্যকর মডেলের একটি উপসেট চিহ্নিত করে, যা নতুন ডেটা প্রাপ্তির পরে পরিমার্জিত হয়। এই উপসেট থেকে একটি মডেল নির্বাচন করা হয় প্রেডিকশন সেট তৈরি করতে, যার ফলে গণনামূলক জটিলতা হ্রাস এবং ছোট প্রেডিকশন সেট পাওয়া যায়। অতিরিক্তভাবে, আমরা প্রদর্শন করি যে প্রেডিকশন সেট আকার ফিডব্যাক হিসাবে ব্যবহার করা, মডেল ক্ষতির সাথে, প্রয়োজনীয় কভারেজ গ্যারান্টি বজায় রেখে ছোট প্রেডিকশন সেট তৈরি করে দক্ষতা উল্লেখযোগ্যভাবে উন্নত করতে পারে। প্রস্তাবিত অ্যালগরিদমগুলি বৈধ কভারেজ নিশ্চিত করতে এবং সাব-লিনিয়ার অনুশোচনা অর্জন করতে প্রমাণিত হয়েছে। বাস্তব এবং সিন্থেটিক ডেটাসেটে পরীক্ষা-নিরীক্ষা যাচাই করে যে প্রস্তাবিত পদ্ধতিগুলি ছোট প্রেডিকশন সেট তৈরি করে এবং বিদ্যমান বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন পদ্ধতিগুলিকে ছাড়িয়ে যায়।
সমাধান করার সমস্যা: বিতরণ পরিবর্তন পরিচালনা করার সময় বিদ্যমান বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন পদ্ধতিগুলি উচ্চ গণনামূলক জটিলতা এবং অত্যধিক বড় প্রেডিকশন সেটের সমস্যার সম্মুখীন হয়। ঐতিহ্যবাহী পদ্ধতিগুলির জন্য সমস্ত প্রার্থী মডেলের আপডেট এবং মূল্যায়ন প্রয়োজন, যখন প্রার্থী সেটে বড় সংখ্যক মডেল বা দুর্বল কর্মক্ষমতা সহ মডেল থাকে তখন অদক্ষতার দিকে পরিচালিত করে।
সমস্যার গুরুত্ব: নিরাপত্তা-সমালোচনামূলক অ্যাপ্লিকেশনে (যেমন স্বয়ংক্রিয় ড্রাইভিং, চিকিৎসা নির্ণয়), সিদ্ধান্তের বিশ্বাসযোগ্যতা নিশ্চিত করতে নির্ভরযোগ্য অনিশ্চয়তা পরিমাপের প্রয়োজন। কনফরমাল প্রেডিকশন বিতরণ অনুমানের উপর নির্ভর না করে কার্যকর প্রেডিকশন সেট প্রদান করতে পারে, তবে অনলাইন পরিবেশে ডেটা বিতরণের গতিশীল পরিবর্তনের সাথে মোকাবেলা করতে হবে।
বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
গণনামূলক জটিলতা প্রার্থী মডেলের সংখ্যার সাথে রৈখিকভাবে বৃদ্ধি পায়
কম কর্মক্ষমতা সহ মডেলের অন্তর্ভুক্তি সামগ্রিক কর্মক্ষমতা নেতিবাচকভাবে প্রভাবিত করে
বিতরণ পরিবর্তনের সাথে গতিশীলভাবে খাপ খাইয়ে নেওয়ার জন্য কার্যকর মডেল নির্বাচন প্রক্রিয়ার অভাব রয়েছে
গবেষণা প্রেরণা: এমন একটি বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন অ্যালগরিদম বিকাশ করা যা কভারেজ গ্যারান্টি বজায় রেখে গণনামূলক জটিলতা হ্রাস এবং প্রেডিকশন সেট আকার হ্রাস করার সময় কার্যকর মডেলের উপসেট স্ব-অভিযোজিতভাবে নির্বাচন করতে পারে।
GMOCP অ্যালগরিদম প্রস্তাব: গ্রাফ-স্ট্রাকচার্ড ফিডব্যাকের উপর ভিত্তি করে বহু-মডেল অনলাইন কনফরমাল প্রেডিকশন অ্যালগরিদম ডিজাইন করা হয়েছে, যা দ্বিপক্ষীয় গ্রাফের মাধ্যমে কার্যকর মডেলের উপসেট গতিশীলভাবে চিহ্নিত করে
স্ব-অভিযোজিত গ্রাফ প্রজন্ম কাঠামো তৈরি: মডেলের ঐতিহাসিক কর্মক্ষমতার উপর ভিত্তি করে দ্বিপক্ষীয় গ্রাফ গতিশীলভাবে নির্মাণ এবং আপডেট করা, অনলাইন মডেল নির্বাচন বাস্তবায়ন করা
EGMOCP সম্প্রসারণ অ্যালগরিদম বিকাশ: প্রেডিকশন সেট আকার অতিরিক্ত ফিডব্যাক সংকেত হিসাবে গ্রহণ করা, প্রেডিকশন দক্ষতা আরও উন্নত করা
তাত্ত্বিক গ্যারান্টি প্রদান: অ্যালগরিদমের বৈধ কভারেজ এবং সাব-লিনিয়ার অনুশোচনা সীমানা প্রমাণ করা
একাধিক ডেটাসেটে কার্যকারিতা যাচাই: CIFAR-10C, CIFAR-100C এবং অন্যান্য ডেটাসেটে ছোট প্রেডিকশন সেট এবং কম গণনামূলক জটিলতা অর্জন করা
ঐতিহাসিক ডেটা {(Xτ,Yτtrue)}τ=1t−1 এবং নতুন ইনপুট Xt দেওয়া, একটি প্রেডিকশন সেট Cαm(Xt)⊆Y তৈরি করুন যাতে সত্য লেবেল Yttrue সম্ভাবনা 1−α এর সাথে প্রেডিকশন সেটে অন্তর্ভুক্ত থাকে, যেখানে α হল অ-কভারেজ সম্ভাবনা।