Revisiting Node Affinity Prediction in Temporal Graphs
Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic
समय-श्रृंखला ग्राफ़ में नोड सम्बन्धता पूर्वानुमान का पुनर्विचार
नोड सम्बन्धता पूर्वानुमान समय-श्रृंखला ग्राफ़ शिक्षण में एक महत्वपूर्ण कार्य है, जिसका व्यापक अनुप्रयोग सामाजिक नेटवर्क, वित्तीय नेटवर्क और अनुशंसा प्रणालियों में होता है। हालांकि हाल के शोध ने अत्याधुनिक गतिशील लिंक पूर्वानुमान मॉडल को अनुकूलित करके नोड सम्बन्धता पूर्वानुमान कार्य को संबोधित किया है, सरल अनुमानी विधियां (जैसे निरंतर पूर्वानुमान और गतिशील औसत) इन जटिल मॉडलों से बेहतर प्रदर्शन करती हैं। यह पेपर समय-श्रृंखला ग्राफ़ तंत्रिका नेटवर्क में नोड सम्बन्धता पूर्वानुमान कार्य में प्रशिक्षण चुनौतियों का विश्लेषण करता है और संबंधित समाधान प्रस्तावित करता है। इन समाधानों को संयोजित करके, लेखकों ने NAVIS (वर्चुअल स्टेट का उपयोग करके नोड सम्बन्धता पूर्वानुमान मॉडल) विकसित किया है, जो अनुमानी विधियों और स्थिति-स्पेस मॉडल की समानता का लाभ उठाता है।
नोड सम्बन्धता पूर्वानुमान का लक्ष्य भविष्य के समय में किसी नोड के अन्य सभी नोड्स के साथ परस्पर क्रिया की तीव्रता का पूर्वानुमान लगाना है, जो पारंपरिक लिंक पूर्वानुमान कार्य से भिन्न है। लिंक पूर्वानुमान विशिष्ट किनारे की उपस्थिति पर केंद्रित है, जबकि सम्बन्धता पूर्वानुमान को सभी संभावित पड़ोसियों का पूर्ण क्रमांकन करना आवश्यक है, जो कार्य को अधिक चुनौतीपूर्ण बनाता है लेकिन वास्तविक अनुप्रयोग आवश्यकताओं के अनुरूप भी है।
प्रदर्शन विरोधाभास: जटिल समय-श्रृंखला ग्राफ़ तंत्रिका नेटवर्क (TGNNs) नोड सम्बन्धता पूर्वानुमान कार्य पर सरल अनुमानी विधियों से बेहतर प्रदर्शन नहीं करते
अभिव्यक्ति क्षमता सीमाएं: मौजूदा TGNNs गतिशील औसत जैसी मूलभूत संक्रियाओं का प्रतिनिधित्व नहीं कर सकते
हानि फलन असंगति: क्रॉस-एंट्रॉपी हानि सम्बन्धता कार्य की क्रमांकन प्रकृति के साथ मेल नहीं खाती
अपर्याप्त सूचना उपयोग: TGNNs वैश्विक समय-श्रृंखला गतिशीलता और दीर्घकालीन निर्भरता सूचना का पूरी तरह से उपयोग नहीं करते
लेखकों ने सैद्धांतिक विश्लेषण के माध्यम से पाया कि सरल अनुमानी विधियां वास्तव में रैखिक स्थिति-स्पेस मॉडल (SSMs) के विशेष मामले हैं, जो अधिक शक्तिशाली TGNN आर्किटेक्चर डिजाइन करने के लिए सैद्धांतिक आधार प्रदान करता है।
सैद्धांतिक योगदान: यह सिद्ध किया कि सरल अनुमानी विधियां रैखिक SSMs के विशेष मामले हैं, और इस संबंध के आधार पर अनुमानी विधियों को सामान्यीकृत करने में सक्षम TGNN आर्किटेक्चर डिजाइन किया गया
आर्किटेक्चर नवाचार: NAVIS मॉडल प्रस्तावित किया, जो वर्चुअल वैश्विक स्थिति और रैखिक स्थिति-स्पेस तंत्र को संयोजित करता है, नोड सम्बन्धता पूर्वानुमान समस्या को प्रभावी ढंग से हल करता है
हानि फलन सुधार: क्रॉस-एंट्रॉपी हानि की सम्बन्धता पूर्वानुमान में कमियों का विश्लेषण किया, क्रमांकन-आधारित Lambda हानि विकल्प प्रस्तावित किया
प्रायोगिक सत्यापन: TGB बेंचमार्क और कई डेटासेट पर विधि की प्रभावकारिता सत्यापित की, लगातार मौजूदा विधियों और अनुमानी आधारभूत से बेहतर प्रदर्शन किया
प्रमेय 1 (रैखिक SSMs मूलभूत अनुमानी को सामान्यीकृत करता है):
मान लीजिए H मूलभूत अनुमानी समुच्चय है (PF, SMA, EMA), Flin-SSM रैखिक SSM द्वारा प्राप्त मानचित्रण समुच्चय है, तब:
H⊊Flin-SSM
प्रमेय 2 (RNN/LSTM/GRU की अभिव्यक्ति सीमाएं):
मानक RNN, LSTM या GRU इकाइयां सबसे मूलभूत निरंतर पूर्वानुमान (PF) अनुमानी का प्रतिनिधित्व नहीं कर सकती, अर्थात सभी इनपुट अनुक्रमों के लिए, कोई पैरामीटर नहीं हैं जो hi=xi को संतुष्ट करते हों।
समस्या विश्लेषण:
प्रमेय 3 (क्रमांकन के लिए क्रॉस-एंट्रॉपी की उप-इष्टतमता):
अनंत कई त्रिगुण (y,s1,s2) मौजूद हैं, जहां rank(s1)=rank(y) और rank(s2)=rank(y), लेकिन ℓCE(s1,y)>ℓCE(s2,y)।
समाधान: Lambda हानि का उपयोग करें:
ℓLambda(s,y)=∑yi>yjlog2(1+e−σ(sπi−sπj)1)δij∣Aπi−Aπj∣
और युग्मित सीमांत नियमितकरण के साथ संयोजित करें:
ℓReg(s,y)=∑yi>yjmax(0,−(sπi−sπj)+Δ)
पारंपरिक अनुसंधान WL परीक्षण द्वारा मापी गई संरचनात्मक अभिव्यक्ति क्षमता पर केंद्रित है, यह पेपर कार्यात्मक अभिव्यक्ति क्षमता पर केंद्रित है, अर्थात विशिष्ट गणितीय संक्रियाओं का प्रतिनिधित्व करने की क्षमता।
हाल के शोध से पता चलता है कि सरल अनुमानी विधियां कई बेंचमार्क पर जटिल TGNNs से बेहतर हैं, यह पेपर पहली बार अनुमानी और SSMs की औपचारिक समानता का स्पष्ट रूप से लाभ उठाता है।
मौजूदा विधियों में स्मृति-आधारित (TGN, DyRep) और गैर-स्मृति-आधारित (DyGFormer, GraphMixer) आर्किटेक्चर शामिल हैं, लेकिन सभी नोड सम्बन्धता पूर्वानुमान की विशेष आवश्यकताओं को प्रभावी ढंग से संभाल नहीं सकते।
सामाजिक नेटवर्क: उपयोगकर्ता परस्पर क्रिया तीव्रता पूर्वानुमान
वित्तीय नेटवर्क: लेनदेन संबंध तीव्रता पूर्वानुमान
आपूर्ति श्रृंखला नेटवर्क: सहयोग संबंध पूर्वानुमान
समग्र मूल्यांकन: यह उच्च गुणवत्ता का अनुसंधान पेपर है जो गहन सैद्धांतिक विश्लेषण के माध्यम से मौजूदा विधियों की कमियों को उजागर करता है और प्रभावी समाधान प्रस्तावित करता है। NAVIS मॉडल का डिजाइन तर्कसंगत है, प्रायोगिक परिणाम प्रेरक हैं, और समय-श्रृंखला ग्राफ़ शिक्षण क्षेत्र में सकारात्मक योगदान देता है। पेपर का मुख्य मूल्य नया सैद्धांतिक दृष्टिकोण और व्यावहारिक विधि ढांचा प्रदान करना है।