2025-11-19T13:19:14.210036

Efficient Graph Optimization via Distance-Aware Graph Representation Learning

Liu, Yu

We propose \textbf{DRTR}, a efficient graph optimization framework that integrates distance-aware multi-hop message passing with dynamic topology refinement. Unlike standard GNNs that rely on shallow, fixed-hop aggregation, DRTR leverages both static preprocessing and dynamic resampling to capture deeper structural dependencies. A \emph{Distance Recomputator} prunes semantically weak edges using adaptive attention, while a \emph{Topology Reconstructor} establishes latent connections among distant but relevant nodes. This joint mechanism enables more expressive and robust representation learning across evolving graph structures. Extensive experiments demonstrate that DRTR outperforms baseline GNNs in both accuracy and scalability, especially in complex and noisy graph environments.

academic

दूरी-जागरूक ग्राफ प्रतिनिधित्व शिक्षा के माध्यम से कुशल ग्राफ अनुकूलन

बुनियादी जानकारी

पेपर ID: 2406.17281
शीर्षक: Efficient Graph Optimization via Distance-Aware Graph Representation Learning
लेखक: Dong Liu (Yale University), Yanxuan Yu (Columbia University)
वर्गीकरण: cs.LG
प्रकाशन समय/सम्मेलन: ICOMP 2025
पेपर लिंक: https://arxiv.org/abs/2406.17281

सारांश

यह पेपर DRTR (Distance-aware graph Representation learning with Topology Refinement) प्रस्तावित करता है, जो एक कुशल ग्राफ अनुकूलन ढांचा है जो दूरी-जागरूक बहु-हॉप संदेश पारण और गतिशील टोपोलॉजी परिशोधन तंत्र को एकीकृत करता है। मानक GNN के विपरीत जो उथले निश्चित-हॉप एकत्रीकरण पर निर्भर करते हैं, DRTR स्थिर पूर्व-प्रसंस्करण और गतिशील पुनः-नमूनाकरण के माध्यम से गहरी संरचनात्मक निर्भरताओं को कैप्चर करता है। दूरी पुनर्गणक (Distance Recomputator) स्व-अनुकूली ध्यान तंत्र का उपयोग करके शब्दार्थ रूप से कमजोर किनारों को काटता है, जबकि टोपोलॉजी पुनर्निर्माणकर्ता (Topology Reconstructor) शब्दार्थ रूप से प्रासंगिक लेकिन संरचनात्मक रूप से दूर के नोड्स के बीच संभावित कनेक्शन स्थापित करता है। यह संयुक्त तंत्र विकसित होने वाली ग्राफ संरचनाओं में अधिक अभिव्यक्तिपूर्ण और मजबूत प्रतिनिधित्व शिक्षा को सक्षम करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

मुख्य समस्या: मानक GNN शोर कनेक्शन, असमान संरचनात्मक घनत्व, या गतिशील विकसित होने वाली टोपोलॉजी वाले ग्राफ को संभालने में खराब प्रदर्शन करते हैं
महत्व: ग्राफ तंत्रिका नेटवर्क अर्ध-पर्यवेक्षित नोड वर्गीकरण और ग्राफ प्रतिनिधित्व शिक्षा में महत्वपूर्ण भूमिका निभाते हैं, लेकिन जटिल ग्राफ वातावरण में मौजूदा विधियों की सीमाएं उनके अनुप्रयोग को प्रतिबंधित करती हैं
मौजूदा विधियों की सीमाएं:
- निश्चित-हॉप नमूनाकरण रणनीति पर निर्भरता
- स्थिर पड़ोस विशेषता एकत्रीकरण, गतिशील परिवर्तनों के अनुकूल नहीं
- शोर किनारों और शब्दार्थ दूरी के प्रभावी प्रबंधन की कमी
अनुसंधान प्रेरणा: एक अनुकूली पुनर्निर्माण ढांचा विकसित करना जो गतिशील रूप से नोड दूरी और स्थानीय ग्राफ संरचना को समायोजित कर सके, अधिक प्रभावी और मजबूत संदेश पारण को बढ़ावा देने के लिए

मुख्य योगदान

DRTR ढांचा प्रस्तावित करना: एक नोवल अनुकूली पुनर्निर्माण ढांचा जो बहु-हॉप संदेश पारण को बढ़ाने के लिए नोड दूरी और टोपोलॉजी संरचना को गतिशील रूप से परिशोधित करता है
दो पूरक मॉड्यूल डिजाइन करना:
- दूरी पुनर्गणक (Distance Recomputator)
- टोपोलॉजी पुनर्निर्माणकर्ता (Topology Reconstructor)
सैद्धांतिक और अनुभवजन्य सत्यापन: सैद्धांतिक विश्लेषण और प्रायोगिक साक्ष्य प्रदान करना जो DRTR की सटीकता, स्थिरता और अनुकूलनशीलता में मजबूत आधारभूत विधियों से श्रेष्ठता को प्रदर्शित करता है
क्रॉस-डोमेन सामान्यीकरण क्षमता: नोड वर्गीकरण, लिंक भविष्यवाणी और आणविक गुण भविष्यवाणी जैसे कई कार्यों पर विधि की प्रभावशीलता को सत्यापित करना

विधि विवरण

कार्य परिभाषा

दिया गया अनिर्देशित ग्राफ $G = (V, E)$ , नोड सेट $V$ , किनारा सेट $E$ , प्रत्येक नोड $v \in V$ के पास इनपुट विशेषता $x_v \in \mathbb{R}^d$ है। लक्ष्य चिह्नित नोड उप-सेट $V_L$ का उपयोग करके अचिह्नित नोड्स $V_{unlabeled}$ के लेबल $y_v$ की भविष्यवाणी करना है।

मॉडल आर्किटेक्चर

1. बहु-हॉप प्रसार एकत्रीकरण

DRTR प्रत्येक k-हॉप पड़ोस से सीधे जानकारी एकत्र करता है, ताप-प्रेरित ध्यान तंत्र को अपनाते हुए:

$h_v^{(k)} = \sum_{u \in \mathcal{N}^{(k)}(v)} \alpha_{vu}^{(k)} \cdot W^{(k)}x_u$

जहां ध्यान गुणांक को परिभाषित किया गया है: $\alpha_{vu}^{(k)} = \frac{\exp(\text{LeakyReLU}(a^T[Wx_v \| Wx_u])/\tau_k)}{\sum_{u' \in \mathcal{N}^{(k)}(v)} \exp(\text{LeakyReLU}(a^T[Wx_v \| Wx_{u'}])/\tau_k)}$

तापमान पैरामीटर क्षय अनुसूची का पालन करता है: $\tau_k = \tau_0 \cdot \exp(-\eta k)$

2. दूरी पुनर्गणक (DR)

सीखी गई शब्दार्थ दूरी के माध्यम से कमजोर किनारों को फ़िल्टर करना:

$d_{vu}^{(k)} = \|x_v - x_u\|_2^2 + \lambda_k \cdot \delta_{vu}^{(k)}$

दंड पद संरचनात्मक और शब्दार्थ जानकारी शामिल करता है: $\delta_{vu}^{(k)} = \beta_1 \cdot k^2 + \beta_2 \cdot (1 - \cos(x_v, x_u))$

उच्च दूरी पड़ोसियों को हटाने के लिए नरम थ्रेसहोल्ड तंत्र का उपयोग करना: $\mathcal{N}^{(k)}(v) \leftarrow \{u \in \mathcal{N}^{(k)}(v) | d_{vu}^{(k)} \leq \alpha_k\}$

3. टोपोलॉजी पुनर्निर्माणकर्ता (TR)

बहु-मानदंड समानता फ़ंक्शन के आधार पर शब्दार्थ रूप से समान लेकिन टोपोलॉजिकल रूप से दूर के नोड्स की पहचान करना:

$s_{vu} = \omega_1 \cdot \|x_v - x_u\|_2^2 + \omega_2 \cdot \frac{|\mathcal{N}(v) \cap \mathcal{N}(u)|}{|\mathcal{N}(v) \cup \mathcal{N}(u)|} + \omega_3 \cdot \frac{x_v^T x_u}{\|x_v\|_2\|x_u\|_2}$

किनारा जोड़ना संभाव्य दृष्टिकोण का पालन करता है: $P(\text{add edge }(v,u)) = \sigma\left(\frac{\beta - s_{vu}}{\beta}\right)$

तकनीकी नवाचार बिंदु

गतिशील दूरी पुनर्गणना: निश्चित-हॉप नमूनाकरण के विपरीत, DRTR प्रशिक्षण प्रक्रिया के दौरान नोड दूरी को गतिशील रूप से पुनः-गणना करता है
संयुक्त अनुकूलन तंत्र: नोड दूरी और टोपोलॉजी संरचना को एक साथ अनुकूलित करना, स्थिर प्रसंस्करण के बजाय
ताप प्रसार-प्रेरित ध्यान: विभिन्न हॉप्स के लिए ध्यान वितरण तीक्ष्णता को नियंत्रित करने के लिए तापमान क्षय तंत्र का परिचय
अनुकूली थ्रेसहोल्ड: सांख्यिकीय विशेषताओं के आधार पर किनारों को काटने और जोड़ने के लिए थ्रेसहोल्ड को गतिशील रूप से समायोजित करना

प्रायोगिक सेटअप

डेटासेट

उद्धरण नेटवर्क: Cora, Citeseer, Pubmed (मानक उद्धरण ग्राफ)
बड़े पैमाने के ग्राफ: ogbn-arxiv, ogbn-products (OGB बेंचमार्क से)
अनुशंसा प्रणाली: MovieLens-100K (उपयोगकर्ता-वस्तु द्विपक्षीय ग्राफ)
आणविक ग्राफ: ZINC-12K (आणविक गुण भविष्यवाणी)

मूल्यांकन मेट्रिक्स

नोड वर्गीकरण: सटीकता (Accuracy), विचरण (Variance), प्रशिक्षण समय
लिंक भविष्यवाणी: AUC, औसत परिशुद्धता (AP)
आणविक गुण भविष्यवाणी: माध्य निरपेक्ष त्रुटि (MAE)

तुलनात्मक विधियां

मानक GNN: GCN, SGC, SSGC, GAT, GraphSAGE, APPNP
DRTR वेरिएंट:
- GDRA (केवल दूरी पुनर्गणक)
- GKHDA (केवल K-हॉप प्रसार एकत्रीकरण)
- GKHDDRA (पूर्ण संस्करण)

कार्यान्वयन विवरण

3-परत नेटवर्क कॉन्फ़िगरेशन
सत्यापन सटीकता के आधार पर प्रारंभिक रोक
10 यादृच्छिक बीजों का औसत परिणाम
Adam अनुकूलक, सीखने की दर 0.01

प्रायोगिक परिणाम

मुख्य परिणाम

मॉडल	Cora	Citeseer	Pubmed	ogbn-arxiv	ogbn-products
GCN	81.2±0.021	70.9±0.025	79.3±0.018	70.5	75.4
GCN+GKHDDRA	82.7±0.013	72.3±0.014	80.9±0.014	73.9	77.2
SGC	74.2±0.030	71.5±0.026	78.2±0.024	68.2	74.1
SGC+GKHDDRA	77.4±0.018	74.6±0.017	82.5±0.017	71.2	76.3

मुख्य निष्कर्ष:

सटीकता में सुधार: DRTR सभी डेटासेट और मॉडल पर सुसंगत प्रदर्शन सुधार प्राप्त करता है
स्थिरता में सुधार: सभी DRTR-संवर्धित मॉडल कम प्रदर्शन विचरण प्रदर्शित करते हैं
कम्प्यूटेशनल दक्षता: प्रशिक्षण समय में मामूली वृद्धि, जैसे Pubmed पर GCN 12.7s से 12.3s तक

विलोपन प्रयोग

मॉड्यूल	सटीकता वृद्धि	विचरण में कमी
GDRA	+1.4%	23.8%
GKHDA	+1.2%	19.0%
TR	+0.3%	18.8%
DRTR (पूर्ण)	+1.5%	38.1%

क्रॉस-डोमेन सत्यापन

लिंक भविष्यवाणी (MovieLens-100K):

GraphSAGE: AUC 93.1, AP 91.7
GraphSAGE+GKHDDRA: AUC 95.1, AP 93.6

आणविक गुण भविष्यवाणी (ZINC-12K):

GCN: logP 0.423, QED 0.218, SA 0.387
GCN+GKHDDRA: logP 0.383, QED 0.197, SA 0.366

सैद्धांतिक विश्लेषण

मुख्य सैद्धांतिक परिणाम

प्रमेय 1 (सामान्यीकरण सीमा): मान लीजिए DRTR सही ढंग से ε अनुपात के शोर किनारों को हटाता है और η अनुपात के शब्दार्थ वैध किनारों को जोड़ता है, तो उच्च संभावना के साथ: $L_{true} \leq L_{emp} + O\left(\sqrt{\frac{|E'| \cdot \log|H_{DRTR}|}{|V_L|}}\right)$

प्रमेय 2 (अभिसरण दर): मानक मान्यताओं के तहत, DRTR एल्गोरिथम $O(1/\sqrt{T})$ की दर पर स्थिर बिंदु में अभिसरित होता है।

प्रमेय 3 (स्थिरता गारंटी): अधिकतम Δ किनारों में भिन्न दो ग्राफ के लिए, उनके प्रतिनिधित्व अंतर सीमित है: $\|Z_1 - Z_2\|_F \leq C \cdot \Delta \cdot \sqrt{|V|}$

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

DRTR गतिशील टोपोलॉजी परिशोधन के माध्यम से GNN प्रदर्शन में महत्वपूर्ण सुधार करता है
दूरी पुनर्गणक और टोपोलॉजी पुनर्निर्माणकर्ता का संयुक्त तंत्र प्रतिनिधित्व गुणवत्ता को प्रभावी ढंग से बढ़ाता है
विधि कई डोमेन (उद्धरण नेटवर्क, अनुशंसा प्रणाली, आणविक ग्राफ) में अच्छी सामान्यीकरण क्षमता प्रदर्शित करती है

सीमाएं

कम्प्यूटेशनल जटिलता: टोपोलॉजी पुनर्निर्माण की समय जटिलता $O(|V|^2 \cdot d)$ है, बड़े पैमाने के ग्राफ पर बाधा बन सकती है
हाइपरपैरामीटर संवेदनशीलता: कई हाइपरपैरामीटर (λ, β, ω आदि) को सावधानीपूर्वक ट्यून करने की आवश्यकता है
सैद्धांतिक विश्लेषण: कुछ सैद्धांतिक परिणामों की मान्यताएं मजबूत हैं, व्यावहारिक अनुप्रयोग में पूरी तरह से संतुष्ट नहीं हो सकती हैं

भविष्य की दिशाएं

अधिक कुशल टोपोलॉजी पुनर्निर्माण एल्गोरिथम विकसित करना
स्व-अनुकूली हाइपरपैरामीटर ट्यूनिंग रणनीति का अनुसंधान करना
गतिशील ग्राफ और स्ट्रीमिंग ग्राफ परिदृश्यों तक विस्तार करना

गहन मूल्यांकन

शक्तियां

विधि नवाचार मजबूत: गतिशील दूरी पुनर्गणना और टोपोलॉजी पुनर्निर्माण का संयुक्त अनुकूलन एक नोवल विचार है
सैद्धांतिक आधार ठोस: सामान्यीकरण सीमा, अभिसरण और स्थिरता के सैद्धांतिक गारंटी प्रदान करता है
प्रायोगिक सत्यापन व्यापक: कई डेटासेट, कार्यों और आधारभूत मॉडल पर व्यापक मूल्यांकन
व्यावहारिक अनुप्रयोग मूल्य उच्च: प्लग-एंड-प्ले मॉड्यूल के रूप में मौजूदा GNN आर्किटेक्चर को बढ़ा सकता है

कमियां

कम्प्यूटेशनल ओवरहेड: $O(|V|^2)$ टोपोलॉजी पुनर्निर्माण जटिलता बड़े पैमाने के अनुप्रयोग को सीमित करती है
पैरामीटर ट्यूनिंग जटिलता: कई हाइपरपैरामीटर का संयुक्त अनुकूलन उपयोग की कठिनाई बढ़ाता है
तुलनात्मक प्रयोग: नवीनतम अनुकूली ग्राफ शिक्षा विधियों के साथ सीधी तुलना की कमी
विलोपन विश्लेषण: विभिन्न घटकों के पारस्परिक प्रभाव का विश्लेषण पर्याप्त नहीं है

प्रभाव

शैक्षणिक योगदान: ग्राफ तंत्रिका नेटवर्क की अनुकूली संरचना शिक्षा के लिए नई अनुसंधान दिशा प्रदान करता है
व्यावहारिक मूल्य: मौजूदा GNN ढांचे पर सीधे लागू किया जा सकता है, प्रदर्शन में सुधार करता है
पुनरुत्पादनशीलता: एल्गोरिथम विवरण विस्तृत, सैद्धांतिक विश्लेषण पूर्ण, पुनरुत्पादन और विस्तार में आसान

लागू परिदृश्य

शोर ग्राफ वातावरण: विशेष रूप से शोर किनारों वाले ग्राफ डेटा को संभालने के लिए उपयुक्त
विरल ग्राफ: टोपोलॉजी पुनर्निर्माण के माध्यम से अपर्याप्त कनेक्शन समस्या में सुधार
बहु-हॉप निर्भरता: लंबी दूरी की शब्दार्थ संबंध कैप्चर करने वाले कार्य
गतिशील ग्राफ: विकसित होने वाली ग्राफ संरचना को संभालने के लिए विस्तारित किया जा सकता है

संदर्भ

यह पेपर मुख्य रूप से निम्नलिखित महत्वपूर्ण कार्यों का संदर्भ देता है:

Kipf & Welling (2017): Semi-supervised classification with graph convolutional networks
Hamilton et al. (2017): Inductive representation learning on large graphs
Zhang et al. (2022): Graph attention multi-layer perceptron
Yao et al. (2023): Improving the expressiveness of k-hop message-passing GNNs

समग्र मूल्यांकन: यह ग्राफ तंत्रिका नेटवर्क अनुसंधान का एक उच्च-गुणवत्ता वाला पेपर है, जो प्रस्तावित DRTR ढांचा सैद्धांतिक और व्यावहारिक दोनों दृष्टिकोण से महत्वपूर्ण योगदान देता है। विधि नोवल है, प्रयोग व्यापक हैं, सैद्धांतिक विश्लेषण ठोस है, और ग्राफ प्रतिनिधित्व शिक्षा क्षेत्र के लिए मूल्यवान नई सोच प्रदान करता है। कम्प्यूटेशनल जटिलता और पैरामीटर ट्यूनिंग की चुनौतियों के बावजूद, इसकी प्लग-एंड-प्ले विशेषता और सुसंगत प्रदर्शन सुधार इसे बहुत अच्छी अनुप्रयोग संभावनाएं देते हैं।