2025-11-11T11:58:09.609989

Rademacher Meets Colors: More Expressivity, but at What Cost ?

Carrasco, Netto, Martirosyan et al.

The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.

academic

Rademacher Meets Colors: More Expressivity, but at What Cost?

मूल जानकारी

पेपर ID: 2510.10101
शीर्षक: Rademacher Meets Colors: More Expressivity, but at What Cost?
लेखक: Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani
वर्गीकरण: cs.LG (मशीन लर्निंग)
प्रकाशन समय: 25 अक्टूबर 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.10101

सारांश

ग्राफ न्यूरल नेटवर्क (GNNs) की अभिव्यक्ति क्षमता आमतौर पर ग्राफ समरूपता परीक्षण (जैसे Weisfeiler-Leman पदानुक्रम) के साथ उनके संबंध के माध्यम से समझी जाती है। हालांकि अधिक अभिव्यक्त GNNs ग्राफ के अधिक समृद्ध सेट को अलग कर सकते हैं, लेकिन वे उच्च सामान्यीकरण त्रुटि भी प्रदर्शित करते हैं। यह कार्य रंगीकरण एल्गोरिदम के दृष्टिकोण से अभिव्यक्ति क्षमता को सामान्यीकरण क्षमता से जोड़ता है, इस व्यापार-बंद के लिए सैद्धांतिक व्याख्या प्रदान करता है। विशेष रूप से, लेखकों ने साबित किया कि WL रंगीकरण द्वारा प्रेरित समतुल्य वर्गों की संख्या सीधे GNN की Rademacher जटिलता को सीमित करती है—एक महत्वपूर्ण डेटा-निर्भर सामान्यीकरण माप। विश्लेषण से पता चलता है कि मजबूत अभिव्यक्ति क्षमता उच्च जटिलता की ओर ले जाती है, जिससे कमजोर सामान्यीकरण गारंटी मिलती है। महत्वपूर्ण रूप से, यह ढांचा केवल संदेश-पारित GNNs या 1-WL तक सीमित नहीं है, बल्कि मनमाने GNN आर्किटेक्चर और ग्राफ को समतुल्य वर्गों में विभाजित करने वाले अभिव्यक्ति क्षमता मापों तक विस्तारित है।

अनुसंधान पृष्ठभूमि और प्रेरणा

मूल समस्या

यह अनुसंधान GNN क्षेत्र में एक मौलिक सैद्धांतिक समस्या को हल करने का लक्ष्य रखता है: अभिव्यक्ति क्षमता और सामान्यीकरण क्षमता के बीच व्यापार-बंद। हालांकि अनुभवजन्य अवलोकन से पता चलता है कि अधिक अभिव्यक्त GNNs में अक्सर खराब सामान्यीकरण प्रदर्शन होता है, लेकिन कठोर सैद्धांतिक व्याख्या का अभाव है।

समस्या की महत्ता

सैद्धांतिक आधार की कमी: मौजूदा अनुसंधान मुख्य रूप से GNN की अभिव्यक्ति क्षमता विश्लेषण पर केंद्रित है, लेकिन इसके सामान्यीकरण क्षमता से संबंध के सैद्धांतिक समझ अपर्याप्त है
व्यावहारिक मार्गदर्शन मूल्य: इस व्यापार-बंद को समझना पर्याप्त अभिव्यक्ति क्षमता और अच्छी सामान्यीकरण दोनों के साथ GNN आर्किटेक्चर डिजाइन करने के लिए महत्वपूर्ण है
एकीकृत ढांचे की आवश्यकता: विभिन्न GNN आर्किटेक्चर के सामान्यीकरण व्यवहार की व्याख्या करने के लिए एक एकीकृत सैद्धांतिक ढांचे की आवश्यकता है

मौजूदा विधियों की सीमाएं

Morris et al. का VC आयाम विश्लेषण: केवल विशिष्ट सक्रियण कार्यों और सीमित ग्राफ के लिए लागू होता है, और पैरामीटर संख्या पर निर्भर करता है न कि संरचनात्मक विशेषताओं पर
Garg et al. की Rademacher जटिलता: हालांकि अधिक कसी हुई सीमाएं प्रदान करता है, लेकिन WL रंगीकरण वितरण के साथ संबंध की खोज नहीं करता है
सार्वभौमिकता की कमी: मौजूदा विश्लेषण अक्सर विशिष्ट GNN आर्किटेक्चर या 1-WL परीक्षण तक सीमित होते हैं

मुख्य योगदान

अभिव्यक्ति-सामान्यीकरण सैद्धांतिक संबंध स्थापित करना: पहली बार रंगीकरण एल्गोरिदम के माध्यम से GNN की अभिव्यक्ति क्षमता को Rademacher जटिलता से सीधे जोड़ना
सटीक जटिलता सीमाएं प्रदान करना: साबित किया कि Rademacher जटिलता की ऊपरी सीमा $\sqrt{p/m}$ है, जहां $p$ समतुल्य वर्गों की संख्या है
स्थिरता गारंटी साबित करना: रंग गणना扰动के तहत Rademacher जटिलता की Lipschitz निरंतरता स्थापित करना
सार्वभौमिक ढांचा डिजाइन करना: मनमाने GNN आर्किटेक्चर और संबंधित रंगीकरण एल्गोरिदम तक विस्तार, संदेश-पारित GNN या 1-WL तक सीमित नहीं
Dudley अभिन्न सीमाओं में सुधार: $p$ आयामी संरचना का उपयोग करके अधिक कसी हुई कवरिंग संख्या सीमाएं प्रदान करना

विधि विवरण

कार्य परिभाषा

ग्राफ-स्तरीय द्विआधारी वर्गीकरण कार्य का अध्ययन, जहां:

इनपुट: ग्राफ डेटासेट $S = \{(G_i, y_i)\}_{i=1}^m$ , $G_i \in \mathcal{G}$ , $y_i \in \{-1, +1\}$
आउटपुट: फ़ंक्शन क्लास $\mathcal{F} = \{f: \mathcal{G} \to [-1,1]\}$ की Rademacher जटिलता सीमाएं
उद्देश्य: अभिव्यक्ति क्षमता माप और सामान्यीकरण क्षमता के बीच मात्रात्मक संबंध स्थापित करना

सैद्धांतिक ढांचा

मूल विचार

रंगीकरण एल्गोरिदम नमूने $S$ को $p$ असंयुक्त सेटों $I_1, \ldots, I_p$ में विभाजित करता है, प्रत्येक $I_j$ में समान रंग $c_j$ वाले सभी ग्राफ होते हैं। यह विभाजन फ़ंक्शन क्लास पर संरचनात्मक बाधाएं लागू करता है: आर्किटेक्चर द्वारा लागू किया जा सकने वाला कोई भी फ़ंक्शन समतुल्य वर्गों पर स्थिर रहना चाहिए।

मुख्य सैद्धांतिक परिणाम

प्रस्ताव 3.1 (मूल सीमा): फ़ंक्शन क्लास $\mathcal{F}$ के लिए, यदि प्रत्येक $f \in \mathcal{F}$ के लिए, समान 1-WL रंग वाले ग्राफ में समान आउटपुट होते हैं, तो अनुभवजन्य Rademacher जटिलता सीमा है:

$R_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}}$

जहां $L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2}$ फ़ंक्शन आउटपुट का $\ell_2$ मानदंड है।

अनुमान 3.2 (सीमित आउटपुट स्थिति): जब $f: \mathcal{G} \to [-1,1]$ हो:

$R_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}}$

प्रमाण के मूल विचार

योग पुनर्गठन: Rademacher जटिलता परिभाषा में योग को ग्राफ रंग के अनुसार पुनर्गठित करना
Cauchy-Schwarz असमानता: फ़ंक्शन संबंधित मानदंड और Rademacher चर को अलग करना
Jensen असमानता: वर्गमूल फ़ंक्शन की अवतलता का उपयोग करना
अपेक्षा गणना: Rademacher चर की स्वतंत्रता और शून्य माध्य गुण का उपयोग करना

स्थिरता विश्लेषण

प्रस्ताव 3.4 (स्थिरता गारंटी): आकार $m$ के दो नमूनों $S$ और $S'$ के लिए, यदि प्रत्येक रंग $c_j$ दोनों नमूनों में गणना में अधिकतम $\epsilon_j$ से भिन्न है:

$|R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m}$

यह नमूनाकरण परिवर्तनशीलता के तहत सीमा की मजबूती सुनिश्चित करता है।

सार्वभौमिक विस्तार

ढांचा मनमाने $(A, T)$ जोड़ी तक विस्तारित होता है, जहां $A$ एक GNN आर्किटेक्चर है और $T$ इसकी अभिव्यक्ति क्षमता को सीमित करने वाला रंगीकरण एल्गोरिदम है। यदि $T \sqsubseteq S$ ( $T$ की अभिव्यक्ति क्षमता $S$ से अधिक नहीं है), तो $p_T \leq p_S$ , जिसका अर्थ है कि अधिक अभिव्यक्त आर्किटेक्चर में अधिक Rademacher जटिलता सीमाएं होती हैं।

प्रायोगिक सेटअप

सैद्धांतिक सत्यापन

यह कार्य मुख्य रूप से सैद्धांतिक है, जो गणितीय प्रमाण के माध्यम से प्रस्तावित सीमाओं को सत्यापित करता है। लेखकों ने चित्र 1 में दृश्य उदाहरण प्रदान किए हैं, जो दिखाते हैं कि विभिन्न अभिव्यक्ति क्षमता के फ़ंक्शन क्लास कैसे विभिन्न नमूना विभाजन प्रेरित करते हैं।

लागू क्षेत्र

GNN आर्किटेक्चर: संदेश-पारित GNN, k-GNN, CW नेटवर्क, सबग्राफ GNN, पथ GNN आदि
रंगीकरण एल्गोरिदम: 1-WL, k-WL, सेलुलर WL आदि
हानि फ़ंक्शन: लॉजिस्टिक हानि, क्रॉस-एंट्रॉपी हानि, मार्जिन हानि (Lipschitz शर्त को पूरा करने की आवश्यकता)

प्रायोगिक परिणाम

सैद्धांतिक परिणाम सत्यापन

कठोर गणितीय प्रमाण के माध्यम से सभी सैद्धांतिक परिणामों को सत्यापित किया गया:

मुख्य सीमा: साबित किया कि $R_S(\mathcal{F}) \leq \sqrt{p/m}$ सीमित आउटपुट फ़ंक्शन के लिए सत्य है
सुधारी गई Dudley सीमा: शास्त्रीय $4\alpha/\sqrt{m}$ पद को $4\alpha\sqrt{p}/\sqrt{m}$ में सुधारा गया
स्थिरता: Rademacher जटिलता की रैखिक स्थिरता साबित की गई

मुख्य अंतर्दृष्टि

अभिव्यक्ति की लागत: मजबूत अभिव्यक्ति क्षमता सीधे बड़े $p$ मान की ओर ले जाती है, जिससे सामान्यीकरण त्रुटि की ऊपरी सीमा बढ़ती है
संरचनात्मक बाधा: रंगीकरण द्वारा प्रेरित समतुल्य वर्ग फ़ंक्शन के अतिफिटिंग क्षमता को सीमित करते हैं
आर्किटेक्चर तुलना: विभिन्न GNN आर्किटेक्चर की सामान्यीकरण क्षमता की तुलना के लिए सैद्धांतिक उपकरण प्रदान करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

व्यापार-बंद परिमाणीकरण: पहली बार GNN अभिव्यक्ति क्षमता और सामान्यीकरण क्षमता के व्यापार-बंद संबंध को परिमाणित किया
सैद्धांतिक एकीकरण: रंगीकरण एल्गोरिदम के माध्यम से अभिव्यक्ति क्षमता और सामान्यीकरण अनुसंधान को एकीकृत किया
व्यावहारिक मार्गदर्शन: GNN आर्किटेक्चर डिजाइन के लिए सैद्धांतिक मार्गदर्शन सिद्धांत प्रदान करता है

सीमाएं

कार्य प्रतिबंध: वर्तमान विश्लेषण ग्राफ-स्तरीय द्विआधारी वर्गीकरण कार्य तक सीमित है
असतत विभाजन: असतत समतुल्य वर्गों का उपयोग करता है न कि निरंतर समानता माप
वितरण धारणा: विशिष्ट ग्राफ वितरण के तहत व्यवहार पर विचार नहीं करता है

भविष्य की दिशाएं

कार्य विस्तार: बहु-वर्गीकरण, प्रतिगमन और नोड-स्तरीय कार्यों तक विस्तार
छद्म-मेट्रिक विधि: असतत विभाजन को छद्म-मेट्रिक-आधारित संरचनात्मक समानता से बदलना
संभाव्य मॉडल: यादृच्छिक ग्राफ मॉडल और graphon के तहत स्पर्शोन्मुख व्यवहार का अध्ययन
अनुभवजन्य सत्यापन: सैद्धांतिक सीमाओं की व्यावहारिकता को सत्यापित करने के लिए व्यवस्थित अनुभवजन्य अनुसंधान

गहन मूल्यांकन

शक्तियां

सैद्धांतिक नवाचार: पहली बार अभिव्यक्ति क्षमता और सामान्यीकरण का प्रत्यक्ष सैद्धांतिक संबंध स्थापित, महत्वपूर्ण सैद्धांतिक अंतराल को भरता है
गणितीय कठोरता: प्रमाण पूर्ण और कठोर, परिणाम सामान्य हैं
व्यावहारिक मूल्य: GNN आर्किटेक्चर चयन के लिए मात्रात्मक मार्गदर्शन प्रदान करता है
ढांचे की सार्वभौमिकता: व्यापक GNN आर्किटेक्चर और अभिव्यक्ति क्षमता मापों पर लागू
स्थिरता गारंटी: सीमा की मजबूती साबित की गई

कमियां

अनुभवजन्य सत्यापन की कमी: सैद्धांतिक सीमाओं की कसाई को सत्यापित करने के लिए प्रयोग की कमी
कार्य सीमा: केवल द्विआधारी वर्गीकरण पर विचार, लागू क्षेत्र को सीमित करता है
सीमा कसाई अज्ञात: प्रदान की गई सीमाओं की कसाई का विश्लेषण नहीं किया गया
कम्प्यूटेशनल जटिलता: रंग संख्या गणना की जटिलता पर चर्चा नहीं की गई

प्रभाव

सैद्धांतिक योगदान: GNN सिद्धांत के लिए महत्वपूर्ण आधार प्रदान, बाद के अनुसंधान को प्रेरित करने की अपेक्षा
आर्किटेक्चर डिजाइन: व्यावहारिक GNN आर्किटेक्चर चयन और डिजाइन में मार्गदर्शन
अनुसंधान दिशा: अभिव्यक्ति-सामान्यीकरण व्यापार-बंद के नए अनुसंधान दिशा खोलता है

लागू परिदृश्य

सैद्धांतिक अनुसंधान: GNN अभिव्यक्ति क्षमता और सामान्यीकरण सिद्धांत विश्लेषण
आर्किटेक्चर डिजाइन: अभिव्यक्ति क्षमता और सामान्यीकरण को संतुलित करने की आवश्यकता वाले अनुप्रयोग परिदृश्य
मॉडल चयन: विशिष्ट कार्य के लिए उपयुक्त अभिव्यक्ति क्षमता वाले GNN आर्किटेक्चर का चयन

संदर्भ

यह पेपर 28 संबंधित संदर्भों का हवाला देता है, जो GNN अभिव्यक्ति क्षमता, सामान्यीकरण सिद्धांत, Rademacher जटिलता आदि मूल क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो सैद्धांतिक विश्लेषण के लिए एक मजबूत आधार प्रदान करता है।

सारांश: यह पेपर रंगीकरण एल्गोरिदम के दृष्टिकोण से, पहली बार GNN अभिव्यक्ति क्षमता और सामान्यीकरण क्षमता के बीच मात्रात्मक सैद्धांतिक संबंध स्थापित करता है, GNN को समझने और डिजाइन करने के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है। कुछ सीमाओं के बावजूद, इसका सैद्धांतिक योगदान महत्वपूर्ण है, और यह GNN सैद्धांतिक अनुसंधान के विकास को आगे बढ़ाने की अपेक्षा की जाती है।