Recent advances in deep forecasting models have achieved remarkable performance, yet most approaches still struggle to provide both accurate predictions and interpretable insights into temporal dynamics. This paper proposes CaReTS, a novel multi-task learning framework that combines classification and regression tasks for multi-step time series forecasting problems. The framework adopts a dual-stream architecture, where a classification branch learns the stepwise trend into the future, while a regression branch estimates the corresponding deviations from the latest observation of the target variable. The dual-stream design provides more interpretable predictions by disentangling macro-level trends from micro-level deviations in the target variable. To enable effective learning in output prediction, deviation estimation, and trend classification, we design a multi-task loss with uncertainty-aware weighting to adaptively balance the contribution of each task. Furthermore, four variants (CaReTS1--4) are instantiated under this framework to incorporate mainstream temporal modelling encoders, including convolutional neural networks (CNNs), long short-term memory networks (LSTMs), and Transformers. Experiments on real-world datasets demonstrate that CaReTS outperforms state-of-the-art (SOTA) algorithms in forecasting accuracy, while achieving higher trend classification performance.
- معرّف الورقة: 2511.09789
- العنوان: CaReTS: A Multi-Task Framework Unifying Classification and Regression for Time Series Forecasting
- المؤلفون: Fulong Yao (جامعة كارديف)، Wanqing Zhao (جامعة نيوكاسل)، Chao Zheng (جامعة نيوكاسل)، Xiaofei Han (جامعة ليدز)
- التصنيف: cs.LG (التعلم الآلي)
- تاريخ النشر: 12 نوفمبر 2025 (نسخة arXiv التمهيدية)
- رابط الورقة: https://arxiv.org/abs/2511.09789
حقق التعلم العميق تقدماً ملحوظاً في مجال التنبؤ بالسلاسل الزمنية، لكن الطرق الحالية غالباً ما تواجه صعوبة في توفير رؤى قابلة للتفسير حول الديناميكيات الزمنية بينما توفر تنبؤات دقيقة. تقترح هذه الورقة CaReTS، وهو إطار عمل للتعلم متعدد المهام يجمع بين مهام التصنيف والانحدار للتنبؤ بالسلاسل الزمنية متعددة الخطوات. يستخدم الإطار معمارية ثنائية التدفق: يتعلم فرع التصنيف الاتجاهات المستقبلية خطوة بخطوة، بينما يقدر فرع الانحدار الانحرافات بالنسبة إلى أحدث ملاحظة. يوفر هذا التصميم تنبؤات أكثر قابلية للتفسير من خلال فصل الاتجاهات الكلية والانحرافات الدقيقة. لتحقيق التعلم الفعال، تم تصميم دالة خسارة متعددة المهام قائمة على الوعي بعدم اليقين لموازنة مساهمات المهام بشكل تكيفي. تقدم الورقة أربع متغيرات (CaReTS1-4) تجمع بين محررات النمذجة الزمنية السائدة (CNN و LSTM و Transformer). تظهر التجارب أن CaReTS يتفوق على الخوارزميات الحديثة الأخرى في دقة التنبؤ وأداء تصنيف الاتجاهات.
التنبؤ بالسلاسل الزمنية مشكلة أساسية في مجالات إدارة الطاقة والتحليل المالي والمراقبة الطبية ونمذجة المناخ. التنبؤ متعدد الخطوات حاسم بشكل خاص، لكنه يواجه تحديين رئيسيين:
- انخفاض الدقة: مع زيادة أفق التنبؤ الزمني، تنخفض دقة التنبؤ عادة
- نقص القابلية للتفسير: في السيناريوهات عالية المخاطر، يقلل افتقار النموذج للشفافية من الثقة
التنبؤ متعدد الخطوات حاسم لالتقاط الديناميكيات الزمنية قصيرة وطويلة الأجل للنظام، مما يدعم اتخاذ قرارات مستنيرة. ومع ذلك، على الرغم من تحسن دقة نماذج التعلم العميق الحالية، لا تزال هناك فجوات كبيرة في القابلية للتفسير، مما يحد من موثوقيتها في التطبيقات العملية.
- نموذج الانحدار الفردي: تصمم معظم نماذج التنبؤ العميقة التنبؤ كمهمة انحدار واحدة، مع التركيز فقط على التنبؤ الرقمي
- الاتجاهات والانحرافات المقترنة: يصعب فصل الاتجاهات الكلية (مثل مسارات الصعود/الهبوط) والانحرافات الدقيقة
- نقص نمذجة الاتجاهات الصريحة: بينما تقدم نماذج مثل Autoformer و FEDformer آليات التحلل، فإنها تعمل بشكل أساسي على طبقة الإدخال أو التمثيل، دون فصل صريح للاتجاهات والسعة على طبقة الإخراج
الرؤية الأساسية للورقة هي: تحليل التنبؤ بالسلاسل الزمنية إلى مهمتين متكاملتين - تصنيف الاتجاهات (الاتجاه) وانحدار الانحرافات (السعة) - يمكن أن يحسن في نفس الوقت دقة التنبؤ والقابلية للتفسير. يوفر هذا الفصل على مستوى الإخراج منظوراً جديداً للتعلم متعدد المهام.
- تصميم معمارية ثنائية التدفق: تقترح إطار عمل CaReTS بمعمارية ثنائية التدفق، حيث يتنبأ فرع التصنيف بالاتجاهات الكلية خطوة بخطوة، بينما يقدر فرع الانحدار الانحرافات الدقيقة بالنسبة إلى أحدث ملاحظة
- التعلم متعدد المهام القائم على الوعي بعدم اليقين: تصميم دالة خسارة متعددة المهام قائمة على عدم اليقين، تحسن بشكل تكيفي مهام التصنيف والانحدار المشتركة، مما يتجنب الضبط اليدوي
- عمومية الإطار: تطبيق أربع متغيرات (CaReTS1-4) يمكن استخدامها مع محررات الوقت السائدة (CNN و LSTM و Transformer)، مما يوضح التوافقية الواسعة للإطار
- تحسين الأداء وتعزيز القابلية للتفسير: تحقيق دقة تنبؤ متقدمة على مجموعات البيانات الحقيقية، مع دقة تصنيف اتجاهات تتجاوز 91%، مع تكاليف حسابية يمكن السيطرة عليها
الإدخال: السلسلة الزمنية x={x1,x2,…,xn}، حيث xn هي أحدث ملاحظة للمتغير المستهدف
الإخراج: التنبؤ بـ K خطوة مستقبلية y^={y^1,y^2,…,y^K}
الفكرة الأساسية: تحليل كل خطوة تنبؤ إلى اتجاه d(k) وسعة انحراف δ(k)
المعمارية (أ): التدفق المتوازي
- محرر الوقت (CNN/LSTM/Transformer) يستخرج ميزات زمنية
- الميزات تدخل بالتوازي إلى تدفقي طبقات متصلة بالكامل مستقلة:
- تدفق التصنيف: التنبؤ بالاتجاهات خطوة بخطوة (صعود/هبوط)
- تدفق الانحدار: تقدير الانحرافات بالنسبة إلى xn
- دمج البقايا: y^(k)=xn+دمج(d(k),δ(k))
المعمارية (ب): التدفق المتسلسل
- المرور أولاً عبر تدفق التصنيف للاستدلال على الاتجاه
- دمج إخراج التصنيف مع ميزات الوقت الأصلية
- الإدخال إلى تدفق الانحدار لتقدير الانحراف
- الدمج المباشر: y^(k)=xn+δ^(k)
| النموذج | المعمارية | تمثيل الاتجاه | تمثيل الانحراف | طريقة الدمج |
|---|
| CaReTS1 | (أ) | تسميات ثنائية d^(k)∈{+1,−1} | انحراف موجب واحد δ^(k) | y^(k)=xn+d^(k)⋅δ^(k) |
| CaReTS2 | (أ) | تسميات ثنائية d^(k)∈{+1,−1} | انحرافات خاصة بالاتجاه (δ^up(k),δ^down(k)) | اختيار الانحراف المقابل بناءً على الاتجاه |
| CaReTS3 | (أ) | احتمالية (pup(k),pdown(k)) | انحرافات خاصة بالاتجاه (δ^up(k),δ^down(k)) | y^(k)=xn+pup(k)δ^up(k)−pdown(k)δ^down(k) |
| CaReTS4 | (ب) | احتمالية p(k) | انحراف موقّع δ^(k) | y^(k)=xn+δ^(k) |
L(a)=αcaLca+αdeLde+αopLop
حيث:
- Lca: خسارة تصنيف الاتجاه (الإنتروبيا المتقاطعة الثنائية أو الفئوية)
- Lde: خسارة تقدير الانحراف (MSE)
- Lop: خسارة التنبؤ بالإخراج (MSE)
L(b)=αcaLca+αopLop
الابتكار الأساسي: نمذجة أوزان المهام كمعاملات قابلة للتعلم، تتكيف بناءً على عدم اليقين في التنبؤ:
αi=2σi21,i∈{ca,de,op}
يتم التطبيق من خلال تسجيل التباين logσi2 كمعامل قابل للتعلم، والخسارة النهائية هي:
L(a)=∑i∈{ca,de,op}(21e−logσi2Li+21logσi2)
استراتيجيات التثبيت:
- التنظيم الناعم: إضافة حد عقوبة لمعاملات التباين اللوغاريتمي
- تقييد النطاق: تقييد logσi2 في النطاق [−10,10]
- فصل طبقة الإخراج: بخلاف Autoformer وغيره الذي يحلل على طبقة الإدخال، يفصل CaReTS بشكل صريح الاتجاهات والانحرافات على طبقة الإخراج، مما يوفر قابلية تفسير أكثر مباشرة
- آلية الدمج الناعم (CaReTS3): دمج احتمالي موزون لانحرافات الاتجاهين، يحقق انتقالاً سلساً عندما يكون الاتجاه غير مؤكد
- موازنة المهام التكيفية: يتجنب تعلم الأوزان القائم على عدم اليقين الضبط اليدوي، مما يسمح للنموذج بالتركيز تلقائياً على المهام الأكثر موثوقية
- تصميم التعقيد التدريجي: من CaReTS1 إلى CaReTS4، يزيد تدريجياً من قدرة النمذجة، ويستكشف بشكل منهجي فضاء التصميم
مهمتا تنبؤ بالسلاسل الزمنية من العالم الحقيقي:
- التنبؤ بأسعار الكهرباء: 8,784 ملاحظة بالساعة (سنة واحدة)
- التنبؤ بالطلب على الكهرباء الداخلة والخارجة (الطاقة غير المستوفاة): 8,784 ملاحظة بالساعة
إعداد التنبؤ: مخطط 15-إلى-6
- الإدخال: الشهر والأسبوع والساعة للخطوة الزمنية الحالية + آخر 12 ملاحظة للمتغير المستهدف
- الإخراج: التنبؤ بـ 6 خطوات مستقبلية للمتغير المستهدف
تقسيم البيانات:
- مجموعة التدريب: 6,048 نقطة
- مجموعة الاختبار: 2,736 نقطة
- طريقة التقييم: التحقق المتقاطع بـ 10 طيات
- RMSE (جذر متوسط الخطأ التربيعي): قياس دقة التنبؤ
- دقة تصنيف الاتجاه: قياس صحة التنبؤ باتجاه الاتجاه
طرق الأساس (3 خطوط أساس مصممة):
- Baseline1: معمارية محرر-فك محرر تقليدية
- Baseline2: نسخة مبسطة بدون اتصالات البقايا
- Baseline3: استبدال وحدة الدمج بطبقة FC واحدة
خوارزميات SOTA (10 خوارزميات):
- عائلة Transformer: Autoformer و FEDformer و Non-stationary Transformer و Informer
- نماذج هجينة: TimesNet و TimeXer و D-CNN-LSTM
- نماذج خفيفة الوزن: DLinear و NLinear و TimeMixer
- شبكة عصبية غامضة: SOIT2FNN-MO
- المنصة: Google Colab مع وحدة معالجة رسومات T4
- المحرر: طبقتان، 64 وحدة مخفية
- CNN: حجم نواة التفاف 3، الحشو 1
- Transformer: 4 رؤوس انتباه
- فروع التصنيف/الانحدار: 2 طبقة FC، 64 وحدة مخفية
- المحسّن: Adam، معدل التعلم 0.001
- حجم الدفعة: 64
- عدد الحقب: حد أقصى 600 حقبة، استراتيجية الإيقاف المبكر (50 حقبة بدون تحسن)
- دالة التفعيل: ReLU
- التطبيع: تطبيع Min-Max
التنبؤ بالطاقة غير المستوفاة (RMSE على مجموعة الاختبار):
- الأفضل: CaReTS2-Transformer (0.0691 ± 0.0018)
- الثاني: CaReTS3-CNN (0.0692 ± 0.0010)
- جميع متغيرات CaReTS2-4 تتفوق على خطوط الأساس
التنبؤ بأسعار الكهرباء (RMSE على مجموعة الاختبار):
- الأفضل: CaReTS2-Transformer (0.0465 ± 0.0012)
- CaReTS1-4 تتفوق على خطوط الأساس في جميع تكوينات المحرر (باستثناء CaReTS1-LSTM)
النتائج الرئيسية:
- CaReTS2 يظهر أداء الأكثر استقراراً، الأفضل في 4 من 6 تكوينات، الثاني في تكوينين
- محرر Transformer عادة ما يتفوق على CNN و LSTM
- CaReTS1 يظهر ميزة أقل بسبب تبسيط فرع الانحراف
جميع المتغيرات تحقق دقة أعلى من 90%:
- الطاقة غير المستوفاة: CaReTS2-Transformer الأعلى (0.9192 ± 0.0022)
- أسعار الكهرباء: CaReTS2-Transformer الأعلى (0.9146 ± 0.0019)
تحليل عبر الخطوات (الشكل 5):
- دقة تصنيف الاتجاه تبقى مستقرة عبر 6 خطوات تنبؤ، بل تحسن طفيف
- يتناقض مع زيادة RMSE، مما يوضح متانة الإطار في الحفاظ على اتساق الاتجاه في التنبؤ طويل الأجل
مثال مع محرر Transformer:
الطاقة غير المستوفاة:
- CaReTS2 متعدد المهام: RMSE 0.0691، دقة الاتجاه 0.9192
- CaReTS2 أحادي المهمة: RMSE 0.0704، دقة الاتجاه 0.9060
- التحسن: انخفاض RMSE بنسبة 1.8%، تحسن دقة الاتجاه بنسبة 1.3%
أسعار الكهرباء:
- CaReTS1 متعدد المهام: RMSE 0.0473، دقة الاتجاه 0.9142
- CaReTS1 أحادي المهمة: RMSE 0.0539، دقة الاتجاه 0.8663
- التحسن: انخفاض RMSE بنسبة 12.2%، تحسن دقة الاتجاه بنسبة 5.5%
التكاليف الحسابية:
- معاملات إضافية فقط 3 أوزان مهام عددية
- زيادة وقت التشغيل مهملة (253-401 ثانية مقابل 216-386 ثانية)
الطاقة غير المستوفاة:
- CaReTS2: RMSE 0.0691، دقة الاتجاه 0.9192
- TimeXer (ثاني أفضل SOTA): RMSE 0.0700، دقة الاتجاه 0.9066
- الميزة: انخفاض RMSE بنسبة 1.3%، تحسن دقة الاتجاه بنسبة 1.4%
أسعار الكهرباء:
- CaReTS2: RMSE 0.0465، دقة الاتجاه 0.9146
- TimeXer (أفضل SOTA): RMSE 0.0463، دقة الاتجاه 0.9013
- الميزة: على الرغم من أن RMSE أعلى قليلاً بنسبة 0.4%، إلا أن دقة الاتجاه أعلى بنسبة 1.5%
مقارنة الكفاءة:
- وقت تشغيل CaReTS: 200-400 ثانية
- نماذج خفيفة الوزن (DLinear/NLinear): <70 ثانية
- نماذج ثقيلة (Autoformer/TimeXer): >460 ثانية
- الخلاصة: CaReTS يحقق توازناً جيداً بين الدقة والكفاءة
في إعدادات التنبؤ 15-4 و 15-8:
- CaReTS2 يبقى دائماً في أفضل ثلاثة لـ RMSE ودقة الاتجاه
- يتحقق من استقرار الإطار عبر أفق تنبؤ مختلف
- استقرار الاتجاه: دقة تصنيف الاتجاه لا تنخفض مع زيادة خطوات التنبؤ، مما يوضح متانة نمذجة الاتجاه الكلي
- التعلم المتكامل: التعلم متعدد المهام يعزز التعلم المتكامل بدلاً من تضارب المهام، التحسين المشترك يتفوق على أحادي المهمة
- توافقية المحرر: الإطار متوافق جيداً مع محررات مختلفة، Transformer عادة ما يظهر أداء أفضل
- نمذجة خاصة بالاتجاه: تصميم الانحراف الخاص بالاتجاه في CaReTS2 يلتقط الديناميكيات غير المتماثلة، متفوقاً على الانحراف الفردي (CaReTS1)
- ميزة الدمج الناعم: دمج الاحتمالية الموزون في CaReTS3 يوفر انتقالاً سلساً عندما يكون الاتجاه غير مؤكد
- طرق CNN: استخراج أنماط محلية زمكانية
- طرق RNN: LSTM و GRU لالتقاط التبعيات التسلسلية
- طرق Transformer:
- Informer: انتباه ProbSparse
- Autoformer: تحلل موسمي-اتجاهي + انتباه الارتباط الذاتي
- FEDformer: تصفية المجال الترددي
- PatchTST: تضمين قائم على الرقعة
- iTransformer: نمذجة محورية معكوسة لتركيز تبعيات المتغيرات
- التحلل الخطي: DLinear و NLinear يحققان نتائج تنافسية من خلال تحلل بسيط للاتجاه-الموسم
- تحلل Transformer: ETSformer و Autoformer و FEDformer تنمذج المكونات على طبقة الإدخال/التمثيل
- تمييز هذه الورقة: فصل طبقة الإخراج، فصل مباشر لاتجاه وسعة هدف التنبؤ
- TimeXer: تمييز الإشارات الداخلية والخارجية
- TimesNet: وحدات متعددة الدورات لالتقاط مقاييس زمنية مختلفة
- MLP خفيفة الوزن: TimeMixer و LightTS و TSMixer
- ابتكار هذه الورقة: إطار ثنائي التدفق على مستوى الإخراج، موازنة مهام تكيفية قائمة على عدم اليقين
- يفصل CaReTS بنجاح تصنيف الاتجاه وتقدير الانحراف من خلال معمارية ثنائية التدفق، مما يحسن دقة التنبؤ والقابلية للتفسير في نفس الوقت
- آلية التعلم متعدد المهام القائمة على عدم اليقين توازن بشكل فعال مساهمات ثلاث مهام، مما يتجنب الضبط اليدوي
- أربع متغيرات توضح مرونة الإطار، مع أفضل أداء لمجموعة CaReTS2-Transformer
- تحقيق أداء SOTA أو متفوقة على مجموعات البيانات الحقيقية، مع دقة تصنيف اتجاه تتجاوز 91%، مع تكاليف حسابية يمكن السيطرة عليها
- التحقق من التنبؤ طويل الأجل غير كافٍ: بسبب قيود موارد GPU، التقييم الأساسي على 6 خطوات تنبؤ، لم يتم التحقق الكامل من قدرة التنبؤ فوق الطويل الأجل
- تنوع مجموعة البيانات: الاختبار فقط على مجموعتي بيانات متعلقة بالكهرباء، يفتقد التحقق عبر المجالات (مثل المالية والطبية)
- ابتكار المحرر محدود: استخدام محررات قياسية، لم يتم استكشاف مستخرجات ميزات زمنية مخصصة
- تبسيط الاتجاه الثنائي: نمذجة فقط الصعود/الهبوط، لم يتم النظر في الاتجاهات المستقرة أو تصنيف اتجاه أكثر دقة
- غياب تقييم القابلية للتفسير: على الرغم من الادعاء بتحسن القابلية للتفسير، يفتقد البحث الدراسات الخاصة بالمستخدمين أو مؤشرات القابلية للتفسير الكمية
- توسيع التنبؤ طويل الأجل: التحقق من قدرة التنبؤ فوق الطويل الأجل (مثل 100+ خطوة) مع موارد حسابية أكبر
- التحقق عبر المجالات: اختبار تعميم الإطار عبر مجالات متنوعة مثل المالية والطب والمناخ
- تصنيف اتجاه متعدد المستويات: توسيع إلى فئات اتجاه متعددة (مثل صعود قوي، صعود ضعيف، مستقر)
- محررات مخصصة: استكشاف مستخرجات ميزات محسّنة لتحلل الاتجاه-الانحراف
- بحث القابلية للتفسير: إجراء دراسات المستخدمين، تقييم كمي لتحسن القابلية للتفسير
- تحليل مشكلة مبتكر: تحليل التنبؤ بالسلاسل الزمنية إلى تصنيف اتجاه وانحدار انحراف بديهي وفعال، يوفر منظور نمذجة جديد
- أساس نظري متين: التعلم متعدد المهام القائم على عدم اليقين له دعم نظري قوي (Kendall et al., 2018)، تفاصيل التطبيق شاملة
- استكشاف تصميم منهجي: أربع متغيرات تتطور تدريجياً من البسيط إلى المعقد، توضح بوضوح فضاء التصميم
- تجارب صارمة وشاملة:
- التحقق المتقاطع بـ 10 طيات يوفر تقديرات موثوقة
- مقارنة مع 10 خوارزميات SOTA
- تجارب استئصال تتحقق من مساهمة كل مكون
- تحليل عبر الخطوات يكشف استقرار الاتجاه
- قابلية عالية للتكرار: توفير كود مجهول، تفاصيل التطبيق شاملة
- كتابة واضحة: هيكل منطقي، رسوم بيانية غنية، وصف تقني دقيق
- تقييم القابلية للتفسير غير كافٍ:
- يفتقد حالات توضيحية توضح كيف يساعد فصل الاتجاه-الانحراف على الفهم
- لم يتم إجراء دراسات المستخدمين للتحقق من تحسن القابلية للتفسير
- القابلية للتفسير تبقى في الغالب على المستوى المفاهيمي
- قيود مجموعة البيانات:
- مجموعتا بيانات فقط من مجالات ذات صلة
- حجم عينة نسبي صغير (8784 نقطة)
- يفتقد التحقق من السلاسل الزمنية متعددة المتغيرات
- غياب التحقق من التنبؤ طويل الأجل:
- التقييم الأساسي على 6 خطوات تنبؤ
- على الرغم من أن الشكل 5 يوضح استقرار الاتجاه، لم يتم الاختبار الفعلي لأفق زمني أطول
- يحد من الحكم على قدرة التنبؤ طويل الأجل
- تحليل التكاليف الحسابية خشن:
- يقرر فقط وقت التشغيل الإجمالي
- يفتقد تحليل تعقيد الوقت والذاكرة المفصل
- لم يتم تحليل الاختناقات الحسابية لمكونات مختلفة
- تصميم خط الأساس مشكوك فيه:
- ثلاثة خطوط أساس مصممة قد تكون غير قوية بما يكفي
- يفتقد المقارنة مع طرق التعلم متعدد المهام الأخرى
- تبسيط تعريف الاتجاه:
- الاتجاه الثنائي (صعود/هبوط) قد يكون خشناً جداً
- لم يتم النظر في الحالات المستقرة أو قوة الاتجاه
- المساهمة الأكاديمية:
- توفير منظور جديد لفصل طبقة الإخراج
- تطبيق التعلم متعدد المهام القائم على عدم اليقين في التنبؤ بالسلاسل الزمنية
- قد يلهم المزيد من البحث حول فصل الاتجاه-السعة
- القيمة العملية:
- توضيح الفائدة العملية في التطبيقات مثل التنبؤ بالكهرباء
- تصنيف الاتجاه يوفر معلومات مساعدة للقرار
- التكاليف الحسابية يمكن السيطرة عليها، مناسبة للنشر الفعلي
- قابلية التكرار:
- توفير الكود (على الرغم من أنه مجهول)
- تفاصيل التطبيق كاملة
- يسهل على الأبحاث اللاحقة التكرار والتوسع
- تأثير القيود:
- قد تحد قيود مجموعة البيانات والتنبؤ طويل الأجل من التأثير
- يتطلب المزيد من التحقق عبر المجالات للتطبيق الواسع
السيناريوهات المناسبة:
- مهام التنبؤ قصيرة ومتوسطة الأجل (6-8 خطوات): الإطار تم التحقق منه بشكل كافٍ في هذا النطاق
- التطبيقات التي تتطلب شرح الاتجاه: مثل القرارات المالية وجدولة الطاقة، حيث يكون اتجاه الاتجاه أهم من القيمة الدقيقة
- السلاسل الزمنية أحادية المتغير أو منخفضة الأبعاد: إعداد التجربة الحالي أحادي المتغير
- السيناريوهات ذات حجم البيانات المتوسط: عينات التدريب حوالي 6000 نقطة
السيناريوهات غير المناسبة:
- التنبؤ فوق طويل الأجل (>10 خطوات): يفتقد التحقق، الأداء غير معروفة
- السلاسل الزمنية متعددة المتغيرات عالية الأبعاد: لم يتم الاختبار بشكل كافٍ في إعداد متعدد المتغيرات
- التنبؤ في الوقت الفعلي: وقت الحساب 200-400 ثانية قد لا يلبي متطلبات الوقت الفعلي
- السلاسل الزمنية المستقرة بدون اتجاه واضح: قد لا يكون لتصنيف الاتجاه ميزة واضحة
- Kendall et al. (2018): Multi-task learning using uncertainty to weigh losses for scene geometry and semantics. CVPR. الأساس النظري لترجيح عدم اليقين
- Vaswani et al. (2017): Attention is all you need. NeurIPS. معمارية Transformer
- Zhou et al. (2021): Informer: Beyond efficient transformer for long sequence time-series forecasting. AAAI. انتباه ProbSparse
- Wu et al. (2021): Autoformer: Decomposition transformers with auto-correlation for long-term series forecasting. NeurIPS. تحلل موسمي-اتجاهي
- Zhou et al. (2022): FEDformer: Frequency enhanced decomposed transformer for long-term series forecasting. ICML. تحلل المجال الترددي
- Liu et al. (2023): iTransformer: Inverted transformers are effective for time series forecasting. arXiv. النمذجة المحورية المعكوسة
- Zeng et al. (2023): Are transformers effective for time series forecasting? AAAI. خطوط أساس DLinear/NLinear البسيطة
- Wang et al. (2024c): TimeXer: Empowering transformers for time series forecasting with exogenous variables. NeurIPS. نمذجة المتغيرات الخارجية
التقييم الشامل: هذه ورقة بحثية مصممة بعناية وتجارب صارمة في التنبؤ بالسلاسل الزمنية. الابتكار الأساسي - فصل الاتجاه-الانحراف على مستوى الإخراج - بسيط لكن فعال، يوفر منظور نمذجة جديد. التعلم متعدد المهام القائم على عدم اليقين له تطبيق أنيق. تثبت نتائج التجارب فعالية الطريقة، مع تحسن في الدقة والقابلية للتفسير. أوجه القصور الرئيسية تكمن في تقييم القابلية للتفسير غير الكافي وتنوع مجموعة البيانات المحدود والتحقق من التنبؤ طويل الأجل المفقود. يُنصح بأن تركز الأعمال اللاحقة على التحقق في مجالات أكثر وأفق زمني أطول، وتقييم القابلية للتفسير من خلال دراسات المستخدمين. بشكل عام، هذه مساهمة قيمة توفر نموذج نمذجة جديد للتنبؤ بالسلاسل الزمنية.