Lightweight and Interpretable Transformer via Mixed Graph Algorithm Unrolling for Traffic Forecast
Qi, Do, Liu et al.
Unlike conventional "black-box" transformers with classical self-attention mechanism, we build a lightweight and interpretable transformer-like neural net by unrolling a mixed-graph-based optimization algorithm to forecast traffic with spatial and temporal dimensions. We construct two graphs: an undirected graph $\mathcal{G}^u$ capturing spatial correlations across geography, and a directed graph $\mathcal{G}^d$ capturing sequential relationships over time. We predict future samples of signal $\mathbf{x}$, assuming it is "smooth" with respect to both $\mathcal{G}^u$ and $\mathcal{G}^d$, where we design new $\ell_2$ and $\ell_1$-norm variational terms to quantify and promote signal smoothness (low-frequency reconstruction) on a directed graph. We design an iterative algorithm based on alternating direction method of multipliers (ADMM), and unroll it into a feed-forward network for data-driven parameter learning. We insert graph learning modules for $\mathcal{G}^u$ and $\mathcal{G}^d$ that play the role of self-attention. Experiments show that our unrolled networks achieve competitive traffic forecast performance as state-of-the-art prediction schemes, while reducing parameter counts drastically. Our code is available in https://github.com/SingularityUndefined/Unrolling-GSP-STForecast .
academic
मिश्रित ग्राफ एल्गोरिदम अनरोलिंग के माध्यम से हल्का और व्याख्यायोग्य ट्रांसफॉर्मर ट्रैफिक पूर्वानुमान के लिए
यह पेपर ट्रैफिक पूर्वानुमान के लिए मिश्रित ग्राफ एल्गोरिदम अनरोलिंग पर आधारित एक हल्का और व्याख्यायोग्य ट्रांसफॉर्मर मॉडल प्रस्तावित करता है। पारंपरिक "ब्लैक बॉक्स" ट्रांसफॉर्मर के विपरीत, यह विधि मिश्रित ग्राफ अनुकूलन एल्गोरिदम को अनरोल करके एक व्याख्यायोग्य ट्रांसफॉर्मर-जैसा तंत्रिका नेटवर्क बनाती है। मॉडल दो ग्राफ बनाता है: अप्रत्यक्ष ग्राफ Gu भौगोलिक-स्थानिक सहसंबंध को पकड़ता है, और निर्देशित ग्राफ Gd समय-क्रम संबंध को पकड़ता है। नए ℓ2 और ℓ1 मानदंड भिन्नात्मक पदों को डिजाइन करके निर्देशित ग्राफ पर संकेत समरूपता को मापा और बढ़ावा दिया जाता है, और वैकल्पिक दिशा गुणक विधि (ADMM) के आधार पर एक पुनरावृत्ति एल्गोरिदम डिजाइन किया जाता है, जिसे डेटा-संचालित पैरामीटर सीखने के लिए फीडफॉरवर्ड नेटवर्क में अनरोल किया जाता है। प्रयोग दर्शाते हैं कि यह मॉडल प्रतिस्पर्धी ट्रैफिक पूर्वानुमान प्रदर्शन बनाए रखते हुए पैरामीटर की संख्या में काफी कमी करता है।
मिश्रित ग्राफ एल्गोरिदम अनरोलिंग का पहला प्रस्ताव: अप्रत्यक्ष ग्राफ (स्थान) और निर्देशित ग्राफ (समय) को जटिल स्पेस-टाइम संबंधों को मॉडल करने के लिए जोड़ता है
नवीन निर्देशित ग्राफ नियमितकरण पद: निर्देशित ग्राफ लैप्लासियन नियमितकरण (DGLR) और निर्देशित ग्राफ कुल भिन्नता (DGTV) डिजाइन किया
हल्का व्याख्यायोग्य ट्रांसफॉर्मर: ADMM एल्गोरिदम अनरोलिंग के माध्यम से पैरामीटर में भारी कमी (केवल PDFormer का 6.4%)
सैद्धांतिक योगदान: साबित किया कि निर्देशित ग्राफ आवृत्ति परिभाषा अभारित निर्देशित लाइन ग्राफ के मामले में शास्त्रीय फूरियर आवृत्ति में कम हो जाती है
N निगरानी स्टेशनों के पिछले T+1 समय बिंदुओं पर अवलोकन दिए गए हैं, भविष्य के S समय बिंदुओं के लिए ट्रैफिक स्थिति की भविष्यवाणी करें। इनपुट आंशिक रूप से अवलोकित स्पेस-टाइम संकेत y∈RM है, आउटपुट पूर्ण स्पेस-टाइम संकेत x∈RN(T+S+1) है।
प्रमेय 3.1 साबित करता है: अभारित निर्देशित लाइन ग्राफ के लिए, सममित निर्देशित ग्राफ लैप्लासियन Lrd=(Lrd)TLrd अप्रत्यक्ष लाइन ग्राफ के लैप्लासियन मैट्रिक्स के समान है, आवृत्ति परिभाषा की वैधता को सत्यापित करता है।
पेपर कई महत्वपूर्ण कार्यों का हवाला देता है, जिनमें शामिल हैं:
ट्रांसफॉर्मर मूल पेपर (Vaswani et al., 2017)
एल्गोरिदम अनरोलिंग सर्वेक्षण (Monga et al., 2021)
ग्राफ संकेत प्रसंस्करण आधार (Ortega et al., 2018)
ट्रैफिक पूर्वानुमान संबंधित कार्य (Li et al., 2017; Yu et al., 2018)
समग्र मूल्यांकन: यह ट्रैफिक पूर्वानुमान क्षेत्र में नवीन कार्य है, जो एल्गोरिदम अनरोलिंग विचार को मिश्रित ग्राफ सेटिंग तक सफलतापूर्वक विस्तारित करता है, प्रदर्शन बनाए रखते हुए पैरामीटर में भारी कमी करता है। हालांकि कुछ मेट्रिक्स पर सुधार की गुंजाइश है, लेकिन इसकी हल्की और व्याख्यायोग्य विशेषताएं इसे महत्वपूर्ण व्यावहारिक मूल्य और शैक्षणिक महत्व प्रदान करती हैं।