2025-11-20T12:34:13.863172

CaReTS: A Multi-Task Framework Unifying Classification and Regression for Time Series Forecasting

Yao, Zhao, Zheng et al.
Recent advances in deep forecasting models have achieved remarkable performance, yet most approaches still struggle to provide both accurate predictions and interpretable insights into temporal dynamics. This paper proposes CaReTS, a novel multi-task learning framework that combines classification and regression tasks for multi-step time series forecasting problems. The framework adopts a dual-stream architecture, where a classification branch learns the stepwise trend into the future, while a regression branch estimates the corresponding deviations from the latest observation of the target variable. The dual-stream design provides more interpretable predictions by disentangling macro-level trends from micro-level deviations in the target variable. To enable effective learning in output prediction, deviation estimation, and trend classification, we design a multi-task loss with uncertainty-aware weighting to adaptively balance the contribution of each task. Furthermore, four variants (CaReTS1--4) are instantiated under this framework to incorporate mainstream temporal modelling encoders, including convolutional neural networks (CNNs), long short-term memory networks (LSTMs), and Transformers. Experiments on real-world datasets demonstrate that CaReTS outperforms state-of-the-art (SOTA) algorithms in forecasting accuracy, while achieving higher trend classification performance.
academic

CaReTS: সময় সিরিজ পূর্বাভাসের জন্য শ্রেণীবিভাগ এবং রিগ্রেশন একীভূত করার একটি বহু-কাজের কাঠামো

মৌলিক তথ্য

  • পেপার আইডি: 2511.09789
  • শিরোনাম: CaReTS: A Multi-Task Framework Unifying Classification and Regression for Time Series Forecasting
  • লেখক: Fulong Yao (কার্ডিফ বিশ্ববিদ্যালয়), Wanqing Zhao (নিউক্যাসেল বিশ্ববিদ্যালয়), Chao Zheng (নিউক্যাসেল বিশ্ববিদ্যালয়), Xiaofei Han (লিডস বিশ্ববিদ্যালয়)
  • শ্রেণীবিভাগ: cs.LG (মেশিন লার্নিং)
  • প্রকাশনার সময়: ২০২৫ সালের ১২ নভেম্বর (arXiv প্রি-প্রিন্ট)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2511.09789

সারসংক্ষেপ

গভীর শিক্ষা সময় সিরিজ পূর্বাভাস ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি অর্জন করেছে, তবে বিদ্যমান পদ্ধতিগুলি সঠিক পূর্বাভাস প্রদান করার সাথে সাথে সময়ের গতিশীলতার জন্য ব্যাখ্যাযোগ্য অন্তর্দৃষ্টি প্রদান করতে প্রায়শই অসুবিধা পায়। এই পেপারটি CaReTS প্রস্তাব করে, যা বহু-পদক্ষেপ সময় সিরিজ পূর্বাভাসের জন্য শ্রেণীবিভাগ এবং রিগ্রেশন কাজগুলি একত্রিত করে একটি বহু-কাজের শিক্ষার কাঠামো। কাঠামোটি একটি দ্বি-প্রবাহ স্থাপত্য ব্যবহার করে: শ্রেণীবিভাগ শাখা ভবিষ্যতের ধাপে ধাপে প্রবণতা শিখে, রিগ্রেশন শাখা সর্বশেষ পর্যবেক্ষণের সাপেক্ষে বিচ্যুতি অনুমান করে। এই ডিজাইন ম্যাক্রো প্রবণতা এবং মাইক্রো বিচ্যুতি আলাদা করে আরও ব্যাখ্যাযোগ্য পূর্বাভাস প্রদান করে। কার্যকর শিক্ষার জন্য, অনিশ্চয়তা-সচেতন বহু-কাজের ক্ষতি ফাংশন ডিজাইন করা হয়েছে যা প্রতিটি কাজের অবদান স্বয়ংক্রিয়ভাবে ভারসাম্য করে। পেপারটি চারটি ভেরিয়েন্ট (CaReTS1-4) তৈরি করে, যা প্রধান সময় মডেলিং এনকোডার (CNN, LSTM, Transformer) এর সাথে একত্রিত। পরীক্ষাগুলি দেখায় যে CaReTS পূর্বাভাসের নির্ভুলতা এবং প্রবণতা শ্রেণীবিভাগ কর্মক্ষমতা উভয় ক্ষেত্রেই বিদ্যমান অত্যাধুনিক অ্যালগরিদমকে অতিক্রম করে।

গবেষণা পটভূমি এবং প্রেরণা

1. সমাধান করার সমস্যা

সময় সিরিজ পূর্বাভাস শক্তি ব্যবস্থাপনা, আর্থিক বিশ্লেষণ, চিকিৎসা পর্যবেক্ষণ এবং জলবায়ু মডেলিং সহ বিভিন্ন ক্ষেত্রের একটি মৌলিক সমস্যা। বহু-পদক্ষেপ পূর্বাভাস বিশেষভাবে গুরুত্বপূর্ণ, তবে দুটি প্রধান চ্যালেঞ্জের সম্মুখীন:

  • নির্ভুলতা হ্রাস: পূর্বাভাসের সময় ডোমেইন বৃদ্ধির সাথে, পূর্বাভাসের নির্ভুলতা সাধারণত হ্রাস পায়
  • ব্যাখ্যাযোগ্যতার অভাব: উচ্চ ঝুঁকির পরিস্থিতিতে, মডেলের স্বচ্ছতার অভাব বিশ্বাসযোগ্যতা হ্রাস করে

2. সমস্যার গুরুত্ব

বহু-পদক্ষেপ পূর্বাভাস সিস্টেমের স্বল্পমেয়াদী এবং দীর্ঘমেয়াদী সময়ের গতিশীলতা ক্যাপচার করার জন্য গুরুত্বপূর্ণ, যা জ্ঞাত সিদ্ধান্ত সমর্থন করতে পারে। তবে, বিদ্যমান গভীর শিক্ষার মডেলগুলি যদিও নির্ভুলতায় উন্নতি করেছে, তবুও ব্যাখ্যাযোগ্যতার ক্ষেত্রে উল্লেখযোগ্য ঘাটতি রয়েছে, যা বাস্তব প্রয়োগে তাদের নির্ভরযোগ্যতা সীমিত করে।

3. বিদ্যমান পদ্ধতির সীমাবদ্ধতা

  • একক রিগ্রেশন প্যারাডাইম: বেশিরভাগ গভীর পূর্বাভাস মডেল পূর্বাভাসকে একটি একক রিগ্রেশন কাজ হিসাবে মডেল করে, শুধুমাত্র সংখ্যাসূচক পূর্বাভাসের উপর ফোকাস করে
  • প্রবণতা এবং বিচ্যুতি সংযুক্ত: ম্যাক্রো প্রবণতা (যেমন ঊর্ধ্বমুখী/নিম্নমুখী গতিপথ) এবং মাইক্রো বিচ্যুতি আলাদা করা কঠিন
  • স্পষ্ট প্রবণতা মডেলিং অনুপস্থিত: যদিও Autoformer, FEDformer ইত্যাদি মডেলগুলি বিয়োজন প্রক্রিয়া চালু করেছে, তবে তারা প্রধানত ইনপুট বা প্রতিনিধিত্ব স্তরে কাজ করে, আউটপুট স্তরে প্রবণতা এবং প্রশস্ততা স্পষ্টভাবে আলাদা করে না

4. গবেষণা প্রেরণা

এই পেপারের মূল অন্তর্দৃষ্টি হল: সময় সিরিজ পূর্বাভাসকে প্রবণতা শ্রেণীবিভাগ (দিক) এবং বিচ্যুতি রিগ্রেশন (প্রশস্ততা) দুটি পরিপূরক কাজে বিভক্ত করা পূর্বাভাসের নির্ভুলতা এবং ব্যাখ্যাযোগ্যতা উভয়ই বৃদ্ধি করতে পারে। এই আউটপুট-স্তরের বিয়োজন বহু-কাজের শিক্ষার জন্য একটি নতুন দৃষ্টিভঙ্গি প্রদান করে।

মূল অবদান

  1. দ্বি-প্রবাহ স্থাপত্য ডিজাইন: CaReTS কাঠামো প্রস্তাব করে, যা একটি দ্বি-প্রবাহ স্থাপত্য ব্যবহার করে, শ্রেণীবিভাগ শাখা ধাপে ধাপে ম্যাক্রো প্রবণতা পূর্বাভাস দেয়, রিগ্রেশন শাখা সর্বশেষ পর্যবেক্ষণের সাপেক্ষে সূক্ষ্ম-দানাদার বিচ্যুতি অনুমান করে
  2. অনিশ্চয়তা-সচেতন বহু-কাজের শিক্ষা: অনিশ্চয়তার উপর ভিত্তি করে একটি বহু-কাজের ক্ষতি ফাংশন ডিজাইন করা হয়েছে, যা স্বয়ংক্রিয় ওজন দ্বারা শ্রেণীবিভাগ এবং রিগ্রেশন কাজগুলি যৌথভাবে অপ্টিমাইজ করে, ম্যানুয়াল টিউনিং এড়ায়
  3. কাঠামোর সার্বজনীনতা: চারটি ভেরিয়েন্ট (CaReTS1-4) তৈরি করা হয়, যা প্রধান সময় এনকোডার (CNN, LSTM, Transformer) এর সাথে ব্যবহার করা যায়, কাঠামোর বিস্তৃত সামঞ্জস্যতা প্রদর্শন করে
  4. কর্মক্ষমতা উন্নতি এবং ব্যাখ্যাযোগ্যতা বৃদ্ধি: বাস্তব ডেটাসেটে অত্যাধুনিক পূর্বাভাসের নির্ভুলতা অর্জন করে, একই সাথে প্রবণতা শ্রেণীবিভাগের নির্ভুলতা ৯১% অতিক্রম করে, গণনার ওভারহেড নিয়ন্ত্রণযোগ্য

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

ইনপুট: সময় সিরিজ x={x1,x2,,xn}\mathbf{x} = \{x_1, x_2, \ldots, x_n\}, যেখানে xnx_n লক্ষ্য ভেরিয়েবলের সর্বশেষ পর্যবেক্ষণ
আউটপুট: ভবিষ্যতের K পদক্ষেপ পূর্বাভাস y^={y^1,y^2,,y^K}\hat{\mathbf{y}} = \{\hat{y}_1, \hat{y}_2, \ldots, \hat{y}_K\}
মূল ধারণা: প্রতিটি পদক্ষেপ পূর্বাভাসকে প্রবণতা দিক d(k)d^{(k)} এবং বিচ্যুতি প্রশস্ততা δ(k)\delta^{(k)} এ বিভক্ত করা

মডেল স্থাপত্য

1. দুটি দ্বি-প্রবাহ স্থাপত্য

স্থাপত্য (a): সমান্তরাল দ্বি-প্রবাহ

  • সময় এনকোডার (CNN/LSTM/Transformer) সময়ের বৈশিষ্ট্য নিষ্কাশন করে
  • বৈশিষ্ট্য দুটি স্বাধীন সম্পূর্ণ সংযুক্ত প্রবাহে সমান্তরালভাবে ইনপুট করা হয়:
    • শ্রেণীবিভাগ প্রবাহ: ধাপে ধাপে প্রবণতা পূর্বাভাস দেয় (ঊর্ধ্বমুখী/নিম্নমুখী)
    • রিগ্রেশন প্রবাহ: xnx_n এর সাপেক্ষে বিচ্যুতি অনুমান করে
  • অবশিষ্ট সংমিশ্রণ: y^(k)=xn+সংমিশ্রণ(d(k),δ(k))\hat{y}^{(k)} = x_n + \text{সংমিশ্রণ}(d^{(k)}, \delta^{(k)})

স্থাপত্য (b): ক্রমিক দ্বি-প্রবাহ

  • প্রথমে শ্রেণীবিভাগ প্রবাহের মাধ্যমে প্রবণতা অনুমান করে
  • শ্রেণীবিভাগ আউটপুট মূল সময় বৈশিষ্ট্যের সাথে সংযুক্ত করে
  • রিগ্রেশন প্রবাহে ইনপুট করে বিচ্যুতি অনুমান করে
  • সরাসরি সংমিশ্রণ: y^(k)=xn+δ^(k)\hat{y}^{(k)} = x_n + \hat{\delta}^{(k)}

2. চারটি মডেল ভেরিয়েন্ট

মডেলস্থাপত্যপ্রবণতা প্রতিনিধিত্ববিচ্যুতি প্রতিনিধিত্বসংমিশ্রণ পদ্ধতি
CaReTS1(a)বাইনারি লেবেল d^(k){+1,1}\hat{d}^{(k)} \in \{+1,-1\}একক অ-নেতিবাচক বিচ্যুতি δ^(k)\hat{\delta}^{(k)}y^(k)=xn+d^(k)δ^(k)\hat{y}^{(k)} = x_n + \hat{d}^{(k)} \cdot \hat{\delta}^{(k)}
CaReTS2(a)বাইনারি লেবেল d^(k){+1,1}\hat{d}^{(k)} \in \{+1,-1\}দিক-নির্দিষ্ট বিচ্যুতি (δ^up(k),δ^down(k))(\hat{\delta}^{(k)}_{up}, \hat{\delta}^{(k)}_{down})প্রবণতা অনুযায়ী সংশ্লিষ্ট বিচ্যুতি নির্বাচন করুন
CaReTS3(a)সম্ভাবনা (pup(k),pdown(k))(p^{(k)}_{up}, p^{(k)}_{down})দিক-নির্দিষ্ট বিচ্যুতি (δ^up(k),δ^down(k))(\hat{\delta}^{(k)}_{up}, \hat{\delta}^{(k)}_{down})y^(k)=xn+pup(k)δ^up(k)pdown(k)δ^down(k)\hat{y}^{(k)} = x_n + p^{(k)}_{up}\hat{\delta}^{(k)}_{up} - p^{(k)}_{down}\hat{\delta}^{(k)}_{down}
CaReTS4(b)সম্ভাবনা p(k)p^{(k)}স্বাক্ষরিত বিচ্যুতি δ^(k)\hat{\delta}^{(k)}y^(k)=xn+δ^(k)\hat{y}^{(k)} = x_n + \hat{\delta}^{(k)}

বহু-কাজের ক্ষতি ফাংশন

স্থাপত্য (a) এর ক্ষতি ফাংশন

L(a)=αcaLca+αdeLde+αopLopL^{(a)} = \alpha_{ca}L_{ca} + \alpha_{de}L_{de} + \alpha_{op}L_{op}

যেখানে:

  • LcaL_{ca}: প্রবণতা শ্রেণীবিভাগ ক্ষতি (বাইনারি ক্রস-এন্ট্রপি বা শ্রেণীবিভাগ ক্রস-এন্ট্রপি)
  • LdeL_{de}: বিচ্যুতি অনুমান ক্ষতি (MSE)
  • LopL_{op}: আউটপুট পূর্বাভাস ক্ষতি (MSE)

স্থাপত্য (b) এর ক্ষতি ফাংশন

L(b)=αcaLca+αopLopL^{(b)} = \alpha_{ca}L_{ca} + \alpha_{op}L_{op}

অনিশ্চয়তা-সচেতন ওজন

মূল উদ্ভাবন: কাজের ওজনকে শেখার যোগ্য পরামিতি হিসাবে মডেল করা, পূর্বাভাসের অনিশ্চয়তার উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে সামঞ্জস্য করা:

αi=12σi2,i{ca,de,op}\alpha_i = \frac{1}{2\sigma_i^2}, \quad i \in \{ca, de, op\}

বাস্তবায়নে লগ ভেরিয়েন্স logσi2\log \sigma_i^2 শেখার যোগ্য পরামিতি হিসাবে, চূড়ান্ত ক্ষতি হিসাবে:

L(a)=i{ca,de,op}(12elogσi2Li+12logσi2)L^{(a)} = \sum_{i \in \{ca,de,op\}} \left(\frac{1}{2}e^{-\log \sigma_i^2}L_i + \frac{1}{2}\log \sigma_i^2\right)

স্থিতিশীলতা কৌশল:

  1. নরম নিয়মিতকরণ: লগ ভেরিয়েন্স পরামিতিতে শাস্তি যোগ করুন
  2. মূল্য পরিসীমা সীমাবদ্ধতা: logσi2\log \sigma_i^2 কে [10,10][-10, 10] পরিসরে সীমাবদ্ধ করুন

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. আউটপুট-স্তর বিয়োজন: Autoformer ইত্যাদির বিপরীতে যা ইনপুট স্তরে বিয়োজন করে, CaReTS আউটপুট স্তরে স্পষ্টভাবে প্রবণতা এবং বিচ্যুতি আলাদা করে, আরও সরাসরি ব্যাখ্যাযোগ্যতা প্রদান করে
  2. নরম সংমিশ্রণ প্রক্রিয়া (CaReTS3): দুটি দিকের বিচ্যুতি সম্ভাবনা-ভিত্তিক সংমিশ্রণের মাধ্যমে, প্রবণতা অনিশ্চিত হলে মসৃণ রূপান্তর অর্জন করে
  3. স্বয়ংক্রিয় কাজ ভারসাম্য: অনিশ্চয়তা-ভিত্তিক ওজন শেখা ম্যানুয়াল টিউনিং এড়ায়, মডেল স্বয়ংক্রিয়ভাবে আরও নির্ভরযোগ্য কাজে ফোকাস করে
  4. ক্রমিক জটিলতা ডিজাইন: CaReTS1 থেকে CaReTS4 পর্যন্ত, ক্রমান্বয়ে মডেলিং ক্ষমতা বৃদ্ধি, ডিজাইন স্থানের সিস্টেমেটিক অন্বেষণ

পরীক্ষামূলক সেটআপ

ডেটাসেট

দুটি বাস্তব-বিশ্ব সময় সিরিজ পূর্বাভাস কাজ:

  1. বিদ্যুৎ মূল্য পূর্বাভাস: ৮,৭৮৪ ঘন্টা পর্যবেক্ষণ (এক বছর)
  2. আমদানি-রপ্তানি বিদ্যুৎ চাহিদা পূর্বাভাস (অপূর্ণ বিদ্যুৎ): ৮,৭৮৪ ঘন্টা পর্যবেক্ষণ

পূর্বাভাস সেটআপ: ১৫-থেকে-৬ স্কিম

  • ইনপুট: বর্তমান সময় ধাপের মাস, সপ্তাহ, ঘন্টা + অতীতের ১২ ধাপ লক্ষ্য ভেরিয়েবল পর্যবেক্ষণ
  • আউটপুট: ভবিষ্যতের ৬ ধাপ লক্ষ্য ভেরিয়েবল পূর্বাভাস

ডেটা বিভাজন:

  • প্রশিক্ষণ সেট: ৬,০৪৮ পয়েন্ট
  • পরীক্ষা সেট: ২,৭৩৬ পয়েন্ট
  • মূল্যায়ন পদ্ধতি: ১০-ফোল্ড ক্রস-ভ্যালিডেশন

মূল্যায়ন মেট্রিক্স

  1. RMSE (মূল গড় বর্গ ত্রুটি): পূর্বাভাসের নির্ভুলতা পরিমাপ করে
  2. প্রবণতা শ্রেণীবিভাগ নির্ভুলতা: প্রবণতা দিক পূর্বাভাসের সঠিকতা পরিমাপ করে

তুলনামূলক পদ্ধতি

ডিজাইন বেসলাইন (৩টি):

  • Baseline1: ঐতিহ্যবাহী এনকোডার-ডিকোডার স্থাপত্য
  • Baseline2: অবশিষ্ট সংযোগ সরানো সরলীকৃত সংস্করণ
  • Baseline3: সংমিশ্রণ মডিউল একটি একক FC স্তর দিয়ে প্রতিস্থাপন করুন

SOTA অ্যালগরিদম (১০টি):

  • Transformer সিরিজ: Autoformer, FEDformer, Non-stationary Transformer, Informer
  • হাইব্রিড মডেল: TimesNet, TimeXer, D-CNN-LSTM
  • হালকা মডেল: DLinear, NLinear, TimeMixer
  • অস্পষ্ট নিউরাল নেটওয়ার্ক: SOIT2FNN-MO

বাস্তবায়ন বিবরণ

  • প্ল্যাটফর্ম: Google Colab with T4 GPU
  • এনকোডার: ২ স্তর, ৬৪ লুকানো ইউনিট
    • CNN: কনভোলিউশন কার্নেল আকার ৩, প্যাডিং ১
    • Transformer: ৪টি মনোযোগ মাথা
  • শ্রেণীবিভাগ/রিগ্রেশন শাখা: ২ স্তর FC, ৬৪ লুকানো ইউনিট
  • অপ্টিমাইজার: Adam, শেখার হার ০.০০১
  • ব্যাচ আকার: ৬৪
  • **প্রশিক্ষণ পর্যায়: সর্বাধিক ৬০০ পর্যায়, প্রাথমিক থামার কৌশল (৫০ পর্যায় কোন উন্নতি নেই)
  • সক্রিয়করণ ফাংশন: ReLU
  • নর্মালাইজেশন: Min-Max নর্মালাইজেশন

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

1. স্থাপত্য মূল্যায়ন (টেবিল ২)

অপূর্ণ বিদ্যুৎ পূর্বাভাস (পরীক্ষা সেট RMSE):

  • সেরা: CaReTS2-Transformer (0.0691 ± 0.0018)
  • দ্বিতীয় সেরা: CaReTS3-CNN (0.0692 ± 0.0010)
  • সমস্ত CaReTS2-4 ভেরিয়েন্ট বেসলাইনের চেয়ে উন্নত

বিদ্যুৎ মূল্য পূর্বাভাস (পরীক্ষা সেট RMSE):

  • সেরা: CaReTS2-Transformer (0.0465 ± 0.0012)
  • CaReTS1-4 সমস্ত এনকোডার কনফিগারেশনে বেসলাইনের চেয়ে উন্নত (CaReTS1-LSTM ছাড়া)

মূল আবিষ্কার:

  • CaReTS2 সবচেয়ে স্থিতিশীল, ৬টি কনফিগারেশনে ৪ বার সেরা, ২ বার দ্বিতীয় সেরা
  • Transformer এনকোডার সাধারণত CNN এবং LSTM এর চেয়ে উন্নত
  • CaReTS1 বিচ্যুতি শাখা সরলীকরণের কারণে স্পষ্ট সুবিধা নেই

2. প্রবণতা শ্রেণীবিভাগ কর্মক্ষমতা (টেবিল ৩)

সমস্ত ভেরিয়েন্ট ৯০% এর উপরে নির্ভুলতা অর্জন করে:

  • অপূর্ণ বিদ্যুৎ: CaReTS2-Transformer সর্বোচ্চ (0.9192 ± 0.0022)
  • বিদ্যুৎ মূল্য: CaReTS2-Transformer সর্বোচ্চ (0.9146 ± 0.0019)

ক্রস-স্টেপ বিশ্লেষণ (চিত্র ৫):

  • প্রবণতা শ্রেণীবিভাগ নির্ভুলতা ৬-ধাপ পূর্বাভাসে স্থিতিশীল থাকে, এমনকি সামান্য উন্নতি হয়
  • RMSE বৃদ্ধির সাথে বৈপরীত্য, দীর্ঘমেয়াদী পূর্বাসে প্রবণতা সামঞ্জস্য বজায় রাখার কাঠামোর দৃঢ়তা প্রদর্শন করে

অপসারণ পরীক্ষা

বহু-কাজ বনাম একক-কাজ শিক্ষা (টেবিল ৪)

Transformer এনকোডারের উদাহরণ:

অপূর্ণ বিদ্যুৎ:

  • CaReTS2 বহু-কাজ: RMSE 0.0691, প্রবণতা নির্ভুলতা 0.9192
  • CaReTS2 একক-কাজ: RMSE 0.0704, প্রবণতা নির্ভুলতা 0.9060
  • উন্নতি: RMSE ১.৮% হ্রাস, প্রবণতা নির্ভুলতা ১.৩% বৃদ্ধি

বিদ্যুৎ মূল্য:

  • CaReTS1 বহু-কাজ: RMSE 0.0473, প্রবণতা নির্ভুলতা 0.9142
  • CaReTS1 একক-কাজ: RMSE 0.0539, প্রবণতা নির্ভুলতা 0.8663
  • উন্নতি: RMSE ১২.২% হ্রাস, প্রবণতা নির্ভুলতা ৫.৫% বৃদ্ধি

গণনার ওভারহেড:

  • অতিরিক্ত পরামিতি মাত্র ৩টি কাজ ওজন স্কেলার
  • চলমান সময় বৃদ্ধি উপেক্ষণীয় (২৫৩-৪০১ সেকেন্ড বনাম ২১৬-৩৮৬ সেকেন্ড)

SOTA তুলনা (টেবিল ৫)

অপূর্ণ বিদ্যুৎ:

  • CaReTS2: RMSE 0.0691, প্রবণতা নির্ভুলতা 0.9192
  • TimeXer (দ্বিতীয় সেরা SOTA): RMSE 0.0700, প্রবণতা নির্ভুলতা 0.9066
  • সুবিধা: RMSE ১.৩% হ্রাস, প্রবণতা নির্ভুলতা ১.৪% বৃদ্ধি

বিদ্যুৎ মূল্য:

  • CaReTS2: RMSE 0.0465, প্রবণতা নির্ভুলতা 0.9146
  • TimeXer (সেরা SOTA): RMSE 0.0463, প্রবণতা নির্ভুলতা 0.9013
  • সুবিধা: যদিও RMSE সামান্য ০.৪% বেশি, প্রবণতা নির্ভুলতা ১.৫% বেশি

দক্ষতা তুলনা:

  • CaReTS চলমান সময়: ২০০-৪০০ সেকেন্ড
  • হালকা মডেল (DLinear/NLinear): <৭০ সেকেন্ড
  • ভারী মডেল (Autoformer/TimeXer): >৪৬০ সেকেন্ড
  • উপসংহার: CaReTS নির্ভুলতা এবং দক্ষতার মধ্যে ভাল ভারসাম্য অর্জন করে

সম্প্রসারণ পরীক্ষা (পরিশিষ্ট A.6)

১৫-থেকে-৪ এবং ১৫-থেকে-৮ পূর্বাভাস সেটআপে:

  • CaReTS2 সর্বদা RMSE এবং প্রবণতা নির্ভুলতায় শীর্ষ তিনে থাকে
  • বিভিন্ন পূর্বাভাস সময় ডোমেইনে কাঠামোর স্থিতিশীলতা যাচাই করে

পরীক্ষামূলক আবিষ্কার

  1. প্রবণতা স্থিতিশীলতা: প্রবণতা শ্রেণীবিভাগ নির্ভুলতা পূর্বাভাস ধাপ সংখ্যা বৃদ্ধির সাথে হ্রাস পায় না, ম্যাক্রো প্রবণতা মডেলিংয়ের দৃঢ়তা প্রদর্শন করে
  2. পরিপূরক শিক্ষা: বহু-কাজ শিক্ষা পরিপূরক শিক্ষা প্রচার করে, কাজ হস্তক্ষেপ নয়, যৌথ অপ্টিমাইজেশন একক-কাজের চেয়ে উন্নত
  3. এনকোডার সামঞ্জস্যতা: কাঠামো বিভিন্ন এনকোডারের সাথে ভাল সামঞ্জস্যপূর্ণ, Transformer সাধারণত সেরা কর্মক্ষমতা প্রদর্শন করে
  4. দিক-নির্দিষ্ট মডেলিং: CaReTS2 এর দিক-নির্দিষ্ট বিচ্যুতি ডিজাইন অ-প্রতিসম গতিশীলতা ক্যাপচার করে, একক বিচ্যুতির চেয়ে উন্নত (CaReTS1)
  5. নরম সংমিশ্রণ সুবিধা: CaReTS3 এর সম্ভাবনা-ভিত্তিক ওজন প্রবণতা অনিশ্চিত হলে মসৃণ রূপান্তর প্রদান করে

সম্পর্কিত কাজ

1. গভীর সময় সিরিজ পূর্বাভাস

  • CNN পদ্ধতি: স্থানীয় স্থানকালীন প্যাটার্ন নিষ্কাশন করে
  • RNN পদ্ধতি: LSTM, GRU ক্রম নির্ভরতা ক্যাপচার করে
  • Transformer পদ্ধতি:
    • Informer: ProbSparse মনোযোগ
    • Autoformer: ঋতু-প্রবণতা বিয়োজন + স্বয়ংসম্পর্ক মনোযোগ
    • FEDformer: ফ্রিকোয়েন্সি ডোমেইন ফিল্টারিং
    • PatchTST: প্যাচ-ভিত্তিক এমবেডিং
    • iTransformer: বিপরীত মডেলিং অক্ষ ভেরিয়েবল নির্ভরতা মনোযোগ

2. বিয়োজন এবং ব্যাখ্যাযোগ্যতা

  • রৈখিক বিয়োজন: DLinear, NLinear সহজ প্রবণতা-ঋতু বিয়োজনের মাধ্যমে প্রতিযোগিতামূলক ফলাফল অর্জন করে
  • Transformer বিয়োজন: ETSformer, Autoformer, FEDformer ইনপুট/প্রতিনিধিত্ব স্তরে উপাদান মডেল করে
  • এই পেপারের পার্থক্য: আউটপুট-স্তর বিয়োজন, পূর্বাভাসের লক্ষ্যের প্রবণতা এবং বিচ্যুতি সরাসরি আলাদা করে

3. বহু-কাজ এবং মডিউলার স্থাপত্য

  • TimeXer: অন্তর্জাত এবং বহির্জাত সংকেত পার্থক্য করে
  • TimesNet: বিভিন্ন সময় স্কেলে বহু-পিরিয়ড মডিউল ক্যাপচার করে
  • হালকা MLP: TimeMixer, LightTS, TSMixer
  • এই পেপারের উদ্ভাবন: আউটপুট-স্তর দ্বি-প্রবাহ কাঠামো, অনিশ্চয়তা-ভিত্তিক স্বয়ংক্রিয় কাজ ভারসাম্য

উপসংহার এবং আলোচনা

প্রধান উপসংহার

  1. CaReTS দ্বি-প্রবাহ স্থাপত্যের মাধ্যমে সফলভাবে প্রবণতা শ্রেণীবিভাগ এবং বিচ্যুতি অনুমান আলাদা করে, পূর্বাভাসের নির্ভুলতা এবং ব্যাখ্যাযোগ্যতা উভয়ই বৃদ্ধি করে
  2. অনিশ্চয়তা-ভিত্তিক বহু-কাজ শিক্ষা প্রক্রিয়া তিনটি কাজের অবদান কার্যকরভাবে ভারসাম্য করে, ম্যানুয়াল টিউনিং এড়ায়
  3. চারটি ভেরিয়েন্ট কাঠামোর নমনীয়তা প্রদর্শন করে, CaReTS2-Transformer সমন্বয় সেরা কর্মক্ষমতা প্রদর্শন করে
  4. বাস্তব ডেটাসেটে SOTA কর্মক্ষমতা অর্জন বা অতিক্রম করে, প্রবণতা শ্রেণীবিভাগ নির্ভুলতা ৯১% অতিক্রম করে, গণনার ওভারহেড নিয়ন্ত্রণযোগ্য

সীমাবদ্ধতা

  1. দীর্ঘমেয়াদী পূর্বাভাস যাচাইকরণ অপর্যাপ্ত: GPU সম্পদ সীমাবদ্ধতার কারণে, প্রধানত ৬-ধাপ পূর্বাভাসে মূল্যায়ন করা হয়, অতি-দীর্ঘমেয়াদী পূর্বাভাস ক্ষমতা সম্পূর্ণভাবে যাচাই করা হয়নি
  2. ডেটাসেট বৈচিত্র্য: শুধুমাত্র দুটি বিদ্যুৎ-সম্পর্কিত ডেটাসেটে পরীক্ষা করা হয়েছে, ক্রস-ডোমেইন যাচাইকরণ অনুপস্থিত (যেমন আর্থিক, চিকিৎসা)
  3. এনকোডার উদ্ভাবন সীমিত: মান এনকোডার ব্যবহার করে, কাস্টমাইজড সময় বৈশিষ্ট্য নিষ্কাশক অন্বেষণ করা হয়নি
  4. বাইনারি প্রবণতা সরলীকরণ: শুধুমাত্র ঊর্ধ্বমুখী/নিম্নমুখী মডেল করে, প্ল্যাটফর্ম প্রবণতা বা আরও সূক্ষ্ম-দানাদার প্রবণতা শ্রেণীবিভাগ বিবেচনা করা হয়নি
  5. ব্যাখ্যাযোগ্যতা পরিমাণীকরণ অনুপস্থিত: যদিও ব্যাখ্যাযোগ্যতা উন্নতির দাবি করা হয়, ব্যবহারকারী গবেষণা বা ব্যাখ্যাযোগ্যতা মেট্রিক্সের পরিমাণগত মূল্যায়ন অনুপস্থিত

ভবিষ্যত দিকনির্দেশনা

  1. দীর্ঘমেয়াদী পূর্বাভাস সম্প্রসারণ: বৃহত্তর গণনা সম্পদে অতি-দীর্ঘমেয়াদী (যেমন ১০০+ ধাপ) পূর্বাভাস ক্ষমতা যাচাই করুন
  2. ক্রস-ডোমেইন যাচাইকরণ: আর্থিক, চিকিৎসা, জলবায়ু ইত্যাদি বৈচিত্র্যময় ক্ষেত্রে কাঠামোর সাধারণীকরণ ক্ষমতা পরীক্ষা করুন
  3. বহু-স্তরীয় প্রবণতা শ্রেণীবিভাগ: বহু-শ্রেণী প্রবণতায় সম্প্রসারণ করুন (যেমন শক্তিশালী ঊর্ধ্বমুখী, দুর্বল ঊর্ধ্বমুখী, প্ল্যাটফর্ম ইত্যাদি)
  4. কাস্টম এনকোডার: প্রবণতা-বিচ্যুতি বিয়োজনের জন্য অপ্টিমাইজ করা বৈশিষ্ট্য নিষ্কাশক অন্বেষণ করুন
  5. ব্যাখ্যাযোগ্যতা গবেষণা: ব্যবহারকারী গবেষণা পরিচালনা করুন, ব্যাখ্যাযোগ্যতা উন্নতি পরিমাণগতভাবে মূল্যায়ন করুন

গভীর মূল্যায়ন

শক্তি

  1. সমস্যা বিয়োজনের উদ্ভাবন: সময় সিরিজ পূর্বাভাসকে প্রবণতা শ্রেণীবিভাগ এবং বিচ্যুতি রিগ্রেশনে বিভক্ত করা স্বজ্ঞাত এবং কার্যকর, মডেলিংয়ের জন্য নতুন দৃষ্টিভঙ্গি প্রদান করে
  2. দৃঢ় তাত্ত্বিক ভিত্তি: অনিশ্চয়তা-সচেতন বহু-কাজ শিক্ষা দৃঢ় তাত্ত্বিক সমর্থন আছে (Kendall et al., 2018), বাস্তবায়ন বিবরণ সম্পূর্ণ
  3. সিস্টেমেটিক ডিজাইন অন্বেষণ: চারটি ভেরিয়েন্ট সহজ থেকে জটিল পর্যন্ত ক্রমান্বয়ে বিকশিত, ডিজাইন স্থান স্পষ্টভাবে প্রদর্শন করে
  4. কঠোর পরীক্ষা-নিরীক্ষা:
    • ১০-ফোল্ড ক্রস-ভ্যালিডেশন নির্ভরযোগ্য অনুমান প্রদান করে
    • ১০টি SOTA অ্যালগরিদমের সাথে তুলনা করে
    • অপসারণ পরীক্ষা প্রতিটি উপাদানের অবদান যাচাই করে
    • ক্রস-ধাপ বিশ্লেষণ প্রবণতা স্থিতিশীলতা প্রকাশ করে
  5. শক্তিশালী পুনরুৎপাদনযোগ্যতা: অনামী কোড প্রদান করে, বাস্তবায়ন বিবরণ বিস্তারিত
  6. স্পষ্ট লেখা: যুক্তিসঙ্গত কাঠামো, সমৃদ্ধ চার্ট, সঠিক প্রযুক্তিগত বর্ণনা

অপর্যাপ্ততা

  1. ব্যাখ্যাযোগ্যতা মূল্যায়ন অপর্যাপ্ত:
    • প্রবণতা-বিচ্যুতি বিয়োজন কীভাবে বোঝার সহায়তা করে তার ভিজ্যুয়ালাইজেশন কেস অনুপস্থিত
    • ব্যাখ্যাযোগ্যতা উন্নতি যাচাই করতে ব্যবহারকারী গবেষণা পরিচালিত হয়নি
    • ব্যাখ্যাযোগ্যতা প্রধানত ধারণা স্তরে থাকে
  2. ডেটাসেট সীমাবদ্ধতা:
    • শুধুমাত্র দুটি সম্পর্কিত ক্ষেত্র ডেটাসেট
    • নমুনা আকার তুলনামূলক ছোট (৮৭৮৪ পয়েন্ট)
    • বহু-ভেরিয়েবল সময় সিরিজে যাচাইকরণ অনুপস্থিত
  3. দীর্ঘমেয়াদী পূর্বাভাস যাচাইকরণ অনুপস্থিত:
    • প্রধানত ৬-ধাপ পূর্বাভাসে মূল্যায়ন করা হয়
    • যদিও চিত্র ৫ প্রবণতা স্থিতিশীলতা দেখায়, আরও দীর্ঘ সময় ডোমেইনে প্রকৃত পরীক্ষা করা হয়নি
    • দীর্ঘমেয়াদী পূর্বাভাস ক্ষমতা সম্পর্কে রায় সীমিত করে
  4. গণনা ওভারহেড বিশ্লেষণ অপরিশোধিত:
    • শুধুমাত্র মোট চলমান সময় রিপোর্ট করে
    • বিস্তারিত সময় এবং মেমরি জটিলতা বিশ্লেষণ অনুপস্থিত
    • বিভিন্ন উপাদানের গণনা বটলনেক বিশ্লেষণ করা হয়নি
  5. বেসলাইন ডিজাইন প্রশ্ন:
    • তিনটি ডিজাইন বেসলাইন যথেষ্ট শক্তিশালী নাও হতে পারে
    • অন্যান্য বহু-কাজ শিক্ষা পদ্ধতির সাথে তুলনা অনুপস্থিত
  6. প্রবণতা সংজ্ঞা সরলীকরণ:
    • বাইনারি প্রবণতা (ঊর্ধ্বমুখী/নিম্নমুখী) অত্যন্ত মোটা হতে পারে
    • প্ল্যাটফর্ম অবস্থা বা প্রবণতা শক্তি বিবেচনা করা হয়নি

প্রভাব

  1. একাডেমিক অবদান:
    • আউটপুট-স্তর বিয়োজনের নতুন দৃষ্টিভঙ্গি প্রদান করে
    • সময় সিরিজ পূর্বাভাসে অনিশ্চয়তা-সচেতন বহু-কাজ শিক্ষার প্রয়োগ
    • আরও প্রবণতা-প্রশস্ততা বিচ্ছেদ গবেষণা অনুপ্রাণিত করতে পারে
  2. ব্যবহারিক মূল্য:
    • বিদ্যুৎ পূর্বাভাস ইত্যাদি প্রয়োগে ব্যবহারিকতা প্রদর্শন করে
    • প্রবণতা শ্রেণীবিভাগ সিদ্ধান্ত সহায়তা তথ্য প্রদান করে
    • গণনা ওভারহেড নিয়ন্ত্রণযোগ্য, বাস্তব স্থাপনার জন্য উপযুক্ত
  3. পুনরুৎপাদনযোগ্যতা:
    • কোড প্রদান করে (যদিও অনামী)
    • বাস্তবায়ন বিবরণ সম্পূর্ণ
    • পরবর্তী গবেষণা পুনরুৎপাদন এবং সম্প্রসারণ সুবিধাজনক
  4. সীমাবদ্ধতা প্রভাব:
    • ডেটাসেট এবং দীর্ঘমেয়াদী পূর্বাভাসের সীমাবদ্ধতা প্রভাব সীমিত করতে পারে
    • ব্যাপক প্রয়োগের জন্য আরও ক্রস-ডোমেইন যাচাইকরণ প্রয়োজন

প্রযোজ্য পরিস্থিতি

উপযুক্ত পরিস্থিতি:

  1. স্বল্পমেয়াদী-মধ্যমেয়াদী পূর্বাভাস কাজ (৬-৮ ধাপ): কাঠামো এই পরিসরে সম্পূর্ণভাবে যাচাই করা হয়েছে
  2. প্রবণতা ব্যাখ্যা প্রয়োজন এমন প্রয়োগ: যেমন আর্থিক সিদ্ধান্ত, শক্তি সময়সূচী, প্রবণতা দিক সঠিক মূল্যের চেয়ে বেশি গুরুত্বপূর্ণ
  3. একক-ভেরিয়েবল বা কম-মাত্রা সময় সিরিজ: বর্তমান পরীক্ষা সেটআপ একক-ভেরিয়েবল
  4. মধ্যম ডেটা পরিমাণ পরিস্থিতি: প্রশিক্ষণ নমুনা প্রায় ৬০০০ পয়েন্ট

কম উপযুক্ত পরিস্থিতি:

  1. অতি-দীর্ঘমেয়াদী পূর্বাভাস (>১০ ধাপ): যাচাইকরণ অনুপস্থিত, প্রভাব অজানা
  2. উচ্চ-মাত্রা বহু-ভেরিয়েবল সময় সিরিজ: বহু-ভেরিয়েবল সেটিংয়ে সম্পূর্ণভাবে পরীক্ষা করা হয়নি
  3. রিয়েল-টাইম পূর্বাভাস: ২০০-৪০০ সেকেন্ড গণনা সময় রিয়েল-টাইম প্রয়োজন পূরণ নাও করতে পারে
  4. প্রবণতা অস্পষ্ট প্ল্যাটফর্ম সিরিজ: প্রবণতা শ্রেণীবিভাগ উল্লেখযোগ্য সুবিধা নাও থাকতে পারে

সামগ্রিক মূল্যায়ন: এটি একটি সুচিন্তিত ডিজাইন এবং কঠোর পরীক্ষা-নিরীক্ষা সহ একটি সময় সিরিজ পূর্বাভাস পেপার। মূল উদ্ভাবন—আউটপুট-স্তর প্রবণতা-বিচ্যুতি বিয়োজন—সহজ কিন্তু কার্যকর, মডেলিংয়ের জন্য নতুন দৃষ্টিভঙ্গি প্রদান করে। অনিশ্চয়তা-সচেতন বহু-কাজ শিক্ষা বাস্তবায়ন মার্জিত এবং শক্তিশালী তাত্ত্বিক ভিত্তি রয়েছে। পরীক্ষামূলক ফলাফল পদ্ধতির কার্যকারিতা প্রমাণ করে, নির্ভুলতা এবং ব্যাখ্যাযোগ্যতা উভয়ে উন্নতি প্রদান করে। প্রধান অপর্যাপ্ততা ব্যাখ্যাযোগ্যতা মূল্যায়নে গভীরতার অভাব, ডেটাসেট বৈচিত্র্যের সীমা, দীর্ঘমেয়াদী পূর্বাভাস যাচাইকরণের অনুপস্থিতি। পরবর্তী কাজ আরও ডোমেইন এবং দীর্ঘ সময় ডোমেইনে যাচাই করা, ব্যবহারকারী গবেষণার মাধ্যমে ব্যাখ্যাযোগ্যতা উন্নতি পরিমাণগতভাবে মূল্যায়ন করা সুপারিশ করা হয়। সামগ্রিকভাবে, এটি একটি মূল্যবান অবদান যা সময় সিরিজ পূর্বাভাসের জন্য নতুন মডেলিং প্যারাডাইম প্রদান করে।