Rademacher Meets Colors: More Expressivity, but at What Cost ?
Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic
Rademacher Meets Colors: More Expressivity, but at What Cost?
ग्राफ न्यूरल नेटवर्क (GNNs) की अभिव्यक्ति क्षमता आमतौर पर ग्राफ समरूपता परीक्षण (जैसे Weisfeiler-Leman पदानुक्रम) के साथ उनके संबंध के माध्यम से समझी जाती है। हालांकि अधिक अभिव्यक्त GNNs ग्राफ के अधिक समृद्ध सेट को अलग कर सकते हैं, लेकिन वे उच्च सामान्यीकरण त्रुटि भी प्रदर्शित करते हैं। यह कार्य रंगीकरण एल्गोरिदम के दृष्टिकोण से अभिव्यक्ति क्षमता को सामान्यीकरण क्षमता से जोड़ता है, इस व्यापार-बंद के लिए सैद्धांतिक व्याख्या प्रदान करता है। विशेष रूप से, लेखकों ने साबित किया कि WL रंगीकरण द्वारा प्रेरित समतुल्य वर्गों की संख्या सीधे GNN की Rademacher जटिलता को सीमित करती है—एक महत्वपूर्ण डेटा-निर्भर सामान्यीकरण माप। विश्लेषण से पता चलता है कि मजबूत अभिव्यक्ति क्षमता उच्च जटिलता की ओर ले जाती है, जिससे कमजोर सामान्यीकरण गारंटी मिलती है। महत्वपूर्ण रूप से, यह ढांचा केवल संदेश-पारित GNNs या 1-WL तक सीमित नहीं है, बल्कि मनमाने GNN आर्किटेक्चर और ग्राफ को समतुल्य वर्गों में विभाजित करने वाले अभिव्यक्ति क्षमता मापों तक विस्तारित है।
यह अनुसंधान GNN क्षेत्र में एक मौलिक सैद्धांतिक समस्या को हल करने का लक्ष्य रखता है: अभिव्यक्ति क्षमता और सामान्यीकरण क्षमता के बीच व्यापार-बंद। हालांकि अनुभवजन्य अवलोकन से पता चलता है कि अधिक अभिव्यक्त GNNs में अक्सर खराब सामान्यीकरण प्रदर्शन होता है, लेकिन कठोर सैद्धांतिक व्याख्या का अभाव है।
सैद्धांतिक आधार की कमी: मौजूदा अनुसंधान मुख्य रूप से GNN की अभिव्यक्ति क्षमता विश्लेषण पर केंद्रित है, लेकिन इसके सामान्यीकरण क्षमता से संबंध के सैद्धांतिक समझ अपर्याप्त है
व्यावहारिक मार्गदर्शन मूल्य: इस व्यापार-बंद को समझना पर्याप्त अभिव्यक्ति क्षमता और अच्छी सामान्यीकरण दोनों के साथ GNN आर्किटेक्चर डिजाइन करने के लिए महत्वपूर्ण है
एकीकृत ढांचे की आवश्यकता: विभिन्न GNN आर्किटेक्चर के सामान्यीकरण व्यवहार की व्याख्या करने के लिए एक एकीकृत सैद्धांतिक ढांचे की आवश्यकता है
Morris et al. का VC आयाम विश्लेषण: केवल विशिष्ट सक्रियण कार्यों और सीमित ग्राफ के लिए लागू होता है, और पैरामीटर संख्या पर निर्भर करता है न कि संरचनात्मक विशेषताओं पर
Garg et al. की Rademacher जटिलता: हालांकि अधिक कसी हुई सीमाएं प्रदान करता है, लेकिन WL रंगीकरण वितरण के साथ संबंध की खोज नहीं करता है
सार्वभौमिकता की कमी: मौजूदा विश्लेषण अक्सर विशिष्ट GNN आर्किटेक्चर या 1-WL परीक्षण तक सीमित होते हैं
अभिव्यक्ति-सामान्यीकरण सैद्धांतिक संबंध स्थापित करना: पहली बार रंगीकरण एल्गोरिदम के माध्यम से GNN की अभिव्यक्ति क्षमता को Rademacher जटिलता से सीधे जोड़ना
सटीक जटिलता सीमाएं प्रदान करना: साबित किया कि Rademacher जटिलता की ऊपरी सीमा p/m है, जहां p समतुल्य वर्गों की संख्या है
स्थिरता गारंटी साबित करना: रंग गणना扰动के तहत Rademacher जटिलता की Lipschitz निरंतरता स्थापित करना
सार्वभौमिक ढांचा डिजाइन करना: मनमाने GNN आर्किटेक्चर और संबंधित रंगीकरण एल्गोरिदम तक विस्तार, संदेश-पारित GNN या 1-WL तक सीमित नहीं
Dudley अभिन्न सीमाओं में सुधार: p आयामी संरचना का उपयोग करके अधिक कसी हुई कवरिंग संख्या सीमाएं प्रदान करना
रंगीकरण एल्गोरिदम नमूने S को p असंयुक्त सेटों I1,…,Ip में विभाजित करता है, प्रत्येक Ij में समान रंग cj वाले सभी ग्राफ होते हैं। यह विभाजन फ़ंक्शन क्लास पर संरचनात्मक बाधाएं लागू करता है: आर्किटेक्चर द्वारा लागू किया जा सकने वाला कोई भी फ़ंक्शन समतुल्य वर्गों पर स्थिर रहना चाहिए।
प्रस्ताव 3.1 (मूल सीमा):
फ़ंक्शन क्लास F के लिए, यदि प्रत्येक f∈F के लिए, समान 1-WL रंग वाले ग्राफ में समान आउटपुट होते हैं, तो अनुभवजन्य Rademacher जटिलता सीमा है:
RS(F)≤msupΘL(Θ)p
जहां L(Θ)=∑i=1mf(Gi;Θ)2 फ़ंक्शन आउटपुट का ℓ2 मानदंड है।
अनुमान 3.2 (सीमित आउटपुट स्थिति):
जब f:G→[−1,1] हो:
ढांचा मनमाने (A,T) जोड़ी तक विस्तारित होता है, जहां A एक GNN आर्किटेक्चर है और T इसकी अभिव्यक्ति क्षमता को सीमित करने वाला रंगीकरण एल्गोरिदम है। यदि T⊑S (T की अभिव्यक्ति क्षमता S से अधिक नहीं है), तो pT≤pS, जिसका अर्थ है कि अधिक अभिव्यक्त आर्किटेक्चर में अधिक Rademacher जटिलता सीमाएं होती हैं।
यह कार्य मुख्य रूप से सैद्धांतिक है, जो गणितीय प्रमाण के माध्यम से प्रस्तावित सीमाओं को सत्यापित करता है। लेखकों ने चित्र 1 में दृश्य उदाहरण प्रदान किए हैं, जो दिखाते हैं कि विभिन्न अभिव्यक्ति क्षमता के फ़ंक्शन क्लास कैसे विभिन्न नमूना विभाजन प्रेरित करते हैं।
यह पेपर 28 संबंधित संदर्भों का हवाला देता है, जो GNN अभिव्यक्ति क्षमता, सामान्यीकरण सिद्धांत, Rademacher जटिलता आदि मूल क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो सैद्धांतिक विश्लेषण के लिए एक मजबूत आधार प्रदान करता है।
सारांश: यह पेपर रंगीकरण एल्गोरिदम के दृष्टिकोण से, पहली बार GNN अभिव्यक्ति क्षमता और सामान्यीकरण क्षमता के बीच मात्रात्मक सैद्धांतिक संबंध स्थापित करता है, GNN को समझने और डिजाइन करने के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है। कुछ सीमाओं के बावजूद, इसका सैद्धांतिक योगदान महत्वपूर्ण है, और यह GNN सैद्धांतिक अनुसंधान के विकास को आगे बढ़ाने की अपेक्षा की जाती है।