Lightweight and Interpretable Transformer via Mixed Graph Algorithm Unrolling for Traffic Forecast
Qi, Do, Liu et al.
Unlike conventional "black-box" transformers with classical self-attention mechanism, we build a lightweight and interpretable transformer-like neural net by unrolling a mixed-graph-based optimization algorithm to forecast traffic with spatial and temporal dimensions. We construct two graphs: an undirected graph $\mathcal{G}^u$ capturing spatial correlations across geography, and a directed graph $\mathcal{G}^d$ capturing sequential relationships over time. We predict future samples of signal $\mathbf{x}$, assuming it is "smooth" with respect to both $\mathcal{G}^u$ and $\mathcal{G}^d$, where we design new $\ell_2$ and $\ell_1$-norm variational terms to quantify and promote signal smoothness (low-frequency reconstruction) on a directed graph. We design an iterative algorithm based on alternating direction method of multipliers (ADMM), and unroll it into a feed-forward network for data-driven parameter learning. We insert graph learning modules for $\mathcal{G}^u$ and $\mathcal{G}^d$ that play the role of self-attention. Experiments show that our unrolled networks achieve competitive traffic forecast performance as state-of-the-art prediction schemes, while reducing parameter counts drastically. Our code is available in https://github.com/SingularityUndefined/Unrolling-GSP-STForecast .
تقترح هذه الورقة نموذج محول خفيف الوزن وقابل للتفسير قائم على فك تشفير خوارزمية الرسم البياني المختلط للتنبؤ بحركة المرور. بخلاف محولات "الصندوق الأسود" التقليدية، يبني هذا النهج شبكة عصبية تشبه المحول قابلة للتفسير من خلال فك تشفير خوارزمية تحسين الرسم البياني المختلط. يبني النموذج رسمين بيانيين: رسم بياني غير موجه Gu يلتقط الارتباطات الجغرافية المكانية، ورسم بياني موجه Gd يلتقط العلاقات الزمنية. من خلال تصميم حدود تباين معايير ℓ2 و ℓ1 جديدة لتحديد وتعزيز سلاسة الإشارة على الرسم البياني الموجه، وتصميم خوارزمية تكرارية بناءً على طريقة الاتجاهات المتناوبة للمضاعفات (ADMM)، يتم فكها كشبكة تغذية أمامية لتعلم المعاملات المدفوع بالبيانات. تُظهر التجارب أن النموذج يحافظ على أداء تنبؤ حركة مرور تنافسية مع تقليل عدد المعاملات بشكل كبير.
بالنظر إلى ملاحظات من N محطة مراقبة على T+1 خطوة زمنية سابقة، التنبؤ بحالة حركة المرور للخطوات S الزمنية القادمة. الإدخال هو إشارة زمكانية مراقبة جزئياً y∈RM، والإخراج هو إشارة زمكانية كاملة x∈RN(T+S+1).
النظرية 3.1 تثبت: بالنسبة للرسم البياني الخطي الموجه غير المرجح، لابلاسيان الرسم البياني الموجه المتماثل Lrd=(Lrd)TLrd يعادل مصفوفة لابلاسيان الرسم البياني الخطي غير الموجه، مما يتحقق من معقولية تعريف التردد.
أساسيات معالجة إشارات الرسم البياني (Ortega et al., 2018)
الأعمال ذات الصلة بالتنبؤ بحركة المرور (Li et al., 2017; Yu et al., 2018)
التقييم الشامل: هذا عمل مبتكر في مجال التنبؤ بحركة المرور، حيث نجح في توسيع فكرة فك تشفير الخوارزمية إلى إعداد الرسم البياني المختلط، مع تحقيق تقليل كبير في المعاملات مع الحفاظ على الأداء. على الرغم من وجود مجال للتحسين في بعض المقاييس، فإن خصائصها خفيفة الوزن وقابلة للتفسير تمنحها قيمة عملية وأكاديمية مهمة.