Rademacher Meets Colors: More Expressivity, but at What Cost ?
Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic
Rademacher يلتقي بالألوان: المزيد من القدرة التعبيرية، لكن بأي ثمن؟
يتم فهم القدرة التعبيرية لشبكات الرسوم البيانية العصبية (GNNs) عادةً من خلال تطابقها مع اختبارات تماثل الرسوم البيانية (مثل التسلسل الهرمي لـ Weisfeiler-Leman). بينما تتمكن شبكات الرسوم البيانية العصبية الأكثر تعبيراً من التمييز بين مجموعات رسوم بيانية أكثر ثراءً، فإنها تظهر أيضاً خطأ تعميم أعلى. تربط هذه الدراسة القدرة التعبيرية بقدرة التعميم من خلال منظور خوارزميات التلوين، مما يوفر تفسيراً نظرياً لهذه المقايضة. على وجه التحديد، يثبت المؤلفون أن عدد الفئات المتكافئة المستحثة من تلوين WL يحد مباشرة من تعقيد Rademacher لـ GNN - وهو مقياس تعميم حاسم يعتمد على البيانات. يكشف التحليل أن القدرة التعبيرية الأقوى تؤدي إلى تعقيد أعلى، مما يؤدي إلى ضمانات تعميم أضعف. علاوة على ذلك، يثبت المؤلفون استقرار تعقيد Rademacher تحت الاضطرابات في عد الألوان عبر العينات المختلفة. والأهم من ذلك، أن الإطار لا يقتصر على شبكات الرسوم البيانية العصبية لنقل الرسائل أو 1-WL، بل يمتد إلى معماريات GNN التعسفية ومقاييس القدرة التعبيرية التي تقسم الرسوم البيانية إلى فئات متكافئة.
تهدف هذه الدراسة إلى حل مشكلة نظرية أساسية في مجال GNN: المقايضة بين القدرة التعبيرية والقدرة على التعميم. بينما تشير الملاحظات التجريبية إلى أن شبكات الرسوم البيانية العصبية الأكثر تعبيراً غالباً ما تتمتع بأداء تعميم أسوأ، إلا أن هناك نقصاً في التفسير النظري الصارم.
تقسم خوارزمية التلوين العينة S إلى p مجموعة منفصلة I1,…,Ip، حيث تحتوي كل Ij على جميع الرسوم البيانية ذات اللون cj. يفرض هذا التقسيم قيوداً هيكلية على فئة الدوال: يجب أن تحافظ أي دالة قابلة للتنفيذ بواسطة المعمارية على ثبات على الفئات المتكافئة.
الاقتراح 3.1 (الحد الأساسي):
بالنسبة لفئة الدوال F، إذا كانت الرسوم البيانية ذات ألوان 1-WL المتطابقة لكل f∈F لها نفس الإخراج، فإن حد تعقيد Rademacher التجريبي هو:
RS(F)≤msupΘL(Θ)p
حيث L(Θ)=∑i=1mf(Gi;Θ)2 هو معيار ℓ2 لمخرجات الدالة.
النتيجة 3.2 (حالة الإخراج المحدود):
عندما يكون f:G→[−1,1]:
يمتد الإطار إلى أي زوج (A,T)، حيث A هي معمارية GNN و T هي خوارزمية التلوين التي تحد من قدرتها التعبيرية. إذا كان T⊑S (القدرة التعبيرية لـ T لا تتجاوز S)، فإن pT≤pS، مما يعني أن المعماريات الأكثر تعبيراً لها حدود تعقيد Rademacher أكبر.
هذه الورقة عمل نظرية بشكل أساسي، يتم التحقق من الحدود المقترحة من خلال الإثبات الرياضي. يقدم المؤلفون في الشكل 1 أمثلة مرئية توضح كيف تستحث فئات الدوال ذات القدرات التعبيرية المختلفة تقسيمات عينات مختلفة.
تستشهد هذه الورقة بـ 28 مرجعاً ذا صلة، تغطي الأعمال المهمة في المجالات الأساسية مثل القدرة التعبيرية لـ GNN ونظرية التعميم وتعقيد Rademacher، مما يوفر أساساً متيناً للتحليل النظري.
الملخص: من خلال منظور خوارزميات التلوين، تنشئ هذه الورقة لأول مرة اتصالاً نظرياً كمياً بين القدرة التعبيرية لـ GNN وقدرة التعميم، مما يوفر أداة نظرية مهمة لفهم وتصميم GNN. على الرغم من وجود بعض القيود، فإن مساهمتها النظرية ذات قيمة مهمة ومن المتوقع أن تعزز تطور أبحاث نظرية GNN.