2025-11-11T11:58:09.609989

Rademacher Meets Colors: More Expressivity, but at What Cost ?

Carrasco, Netto, Martirosyan et al.

The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.

academic

Rademacher يلتقي بالألوان: المزيد من القدرة التعبيرية، لكن بأي ثمن؟

المعلومات الأساسية

معرّف الورقة: 2510.10101
العنوان: Rademacher Meets Colors: More Expressivity, but at What Cost?
المؤلفون: Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani
التصنيف: cs.LG (تعلم الآلة)
تاريخ النشر: 11 أكتوبر 2025 (نسخة أولية من arXiv)
رابط الورقة: https://arxiv.org/abs/2510.10101

الملخص

يتم فهم القدرة التعبيرية لشبكات الرسوم البيانية العصبية (GNNs) عادةً من خلال تطابقها مع اختبارات تماثل الرسوم البيانية (مثل التسلسل الهرمي لـ Weisfeiler-Leman). بينما تتمكن شبكات الرسوم البيانية العصبية الأكثر تعبيراً من التمييز بين مجموعات رسوم بيانية أكثر ثراءً، فإنها تظهر أيضاً خطأ تعميم أعلى. تربط هذه الدراسة القدرة التعبيرية بقدرة التعميم من خلال منظور خوارزميات التلوين، مما يوفر تفسيراً نظرياً لهذه المقايضة. على وجه التحديد، يثبت المؤلفون أن عدد الفئات المتكافئة المستحثة من تلوين WL يحد مباشرة من تعقيد Rademacher لـ GNN - وهو مقياس تعميم حاسم يعتمد على البيانات. يكشف التحليل أن القدرة التعبيرية الأقوى تؤدي إلى تعقيد أعلى، مما يؤدي إلى ضمانات تعميم أضعف. علاوة على ذلك، يثبت المؤلفون استقرار تعقيد Rademacher تحت الاضطرابات في عد الألوان عبر العينات المختلفة. والأهم من ذلك، أن الإطار لا يقتصر على شبكات الرسوم البيانية العصبية لنقل الرسائل أو 1-WL، بل يمتد إلى معماريات GNN التعسفية ومقاييس القدرة التعبيرية التي تقسم الرسوم البيانية إلى فئات متكافئة.

الخلفية البحثية والدافع

المشكلة الأساسية

تهدف هذه الدراسة إلى حل مشكلة نظرية أساسية في مجال GNN: المقايضة بين القدرة التعبيرية والقدرة على التعميم. بينما تشير الملاحظات التجريبية إلى أن شبكات الرسوم البيانية العصبية الأكثر تعبيراً غالباً ما تتمتع بأداء تعميم أسوأ، إلا أن هناك نقصاً في التفسير النظري الصارم.

أهمية المشكلة

غياب الأساس النظري: يركز البحث الحالي بشكل أساسي على تحليل القدرة التعبيرية لـ GNN، لكن الفهم النظري لعلاقتها بقدرة التعميم غير كافٍ
القيمة العملية للتوجيه: يعتبر فهم هذه المقايضة حاسماً لتصميم معماريات GNN التي تتمتع بقدرة تعبيرية كافية وتعميم جيد
الحاجة إلى إطار موحد: يتطلب إطار نظري موحد لشرح السلوك التعميمي لمعماريات GNN المختلفة

قيود الطرق الموجودة

تحليل VC للبعد بواسطة Morris وآخرين: ينطبق فقط على وظائف تفعيل محددة ورسوم بيانية محدودة، ويعتمد على عدد المعاملات بدلاً من الخصائص الهيكلية
تعقيد Rademacher بواسطة Garg وآخرين: بينما يوفر حدوداً أكثر إحكاماً، إلا أنه لم يستكشف الاتصال بتوزيع تلوين WL
غياب العمومية: يقتصر التحليل الحالي في الغالب على معماريات GNN محددة أو اختبار 1-WL

المساهمات الأساسية

إنشاء اتصال نظري بين القدرة التعبيرية والتعميم: ربط مباشر لأول مرة بين القدرة التعبيرية لـ GNN وتعقيد Rademacher من خلال خوارزميات التلوين
توفير حدود تعقيد دقيقة: إثبات أن الحد الأعلى لتعقيد Rademacher هو $\sqrt{p/m}$ ، حيث $p$ هو عدد الفئات المتكافئة
إثبات ضمانات الاستقرار: إنشاء استمرارية Lipschitz لتعقيد Rademacher تحت اضطرابات عد الألوان
تصميم إطار عام: التوسع إلى معماريات GNN التعسفية وخوارزميات التلوين المقابلة، وليس مقتصراً على شبكات نقل الرسائل أو 1-WL
تحسين حدود تكامل Dudley: استخدام البنية ذات البعد $p$ لتوفير حدود تغطية أكثر إحكاماً

شرح الطريقة

تعريف المهمة

دراسة مهام التصنيف الثنائي على مستوى الرسم البياني، حيث:

الإدخال: مجموعة بيانات الرسوم البيانية $S = \{(G_i, y_i)\}_{i=1}^m$ ، $G_i \in \mathcal{G}$ ، $y_i \in \{-1, +1\}$
الإخراج: حدود تعقيد Rademacher لفئة الدوال $\mathcal{F} = \{f: \mathcal{G} \to [-1,1]\}$
الهدف: إنشاء علاقة كمية بين مقياس القدرة التعبيرية وقدرة التعميم

الإطار النظري

الفكرة الأساسية

تقسم خوارزمية التلوين العينة $S$ إلى $p$ مجموعة منفصلة $I_1, \ldots, I_p$ ، حيث تحتوي كل $I_j$ على جميع الرسوم البيانية ذات اللون $c_j$ . يفرض هذا التقسيم قيوداً هيكلية على فئة الدوال: يجب أن تحافظ أي دالة قابلة للتنفيذ بواسطة المعمارية على ثبات على الفئات المتكافئة.

النتائج النظرية الرئيسية

الاقتراح 3.1 (الحد الأساسي): بالنسبة لفئة الدوال $\mathcal{F}$ ، إذا كانت الرسوم البيانية ذات ألوان 1-WL المتطابقة لكل $f \in \mathcal{F}$ لها نفس الإخراج، فإن حد تعقيد Rademacher التجريبي هو:

$R_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}}$

حيث $L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2}$ هو معيار $\ell_2$ لمخرجات الدالة.

النتيجة 3.2 (حالة الإخراج المحدود): عندما يكون $f: \mathcal{G} \to [-1,1]$ :

$R_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}}$

الفكرة الأساسية للإثبات

إعادة تنظيم المجموع: إعادة تنظيم المجموع في تعريف تعقيد Rademacher التجريبي حسب لون الرسم البياني
عدم المساواة Cauchy-Schwarz: فصل معايير الدالة ذات الصلة عن متغيرات Rademacher
عدم المساواة Jensen: استخدام تقعر دالة الجذر التربيعي
حساب التوقع: استخدام الاستقلالية والخاصية الصفرية للمتوسط لمتغيرات Rademacher

تحليل الاستقرار

الاقتراح 3.4 (ضمان الاستقرار): بالنسبة لعينتين بحجم $m$ هما $S$ و $S'$ ، إذا كان الفرق في عد كل لون $c_j$ بين العينتين على الأكثر $\epsilon_j$ :

$|R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m}$

يضمن هذا قوة الحد تحت تباين العينات.

التوسع العام

يمتد الإطار إلى أي زوج $(A, T)$ ، حيث $A$ هي معمارية GNN و $T$ هي خوارزمية التلوين التي تحد من قدرتها التعبيرية. إذا كان $T \sqsubseteq S$ (القدرة التعبيرية لـ $T$ لا تتجاوز $S$ )، فإن $p_T \leq p_S$ ، مما يعني أن المعماريات الأكثر تعبيراً لها حدود تعقيد Rademacher أكبر.

إعداد التجارب

التحقق النظري

هذه الورقة عمل نظرية بشكل أساسي، يتم التحقق من الحدود المقترحة من خلال الإثبات الرياضي. يقدم المؤلفون في الشكل 1 أمثلة مرئية توضح كيف تستحث فئات الدوال ذات القدرات التعبيرية المختلفة تقسيمات عينات مختلفة.

نطاق التطبيق

معماريات GNN: شبكات نقل الرسائل، k-GNN، شبكات CW، شبكات الرسوم البيانية الجزئية، شبكات المسارات، وغيرها
خوارزميات التلوين: 1-WL، k-WL، WL الخلوية، وغيرها
دوال الخسارة: الخسارة اللوجستية، خسارة الإنتروبيا المتقاطعة، خسارة الهامش (يجب أن تستوفي شرط Lipschitz)

نتائج التجارب

التحقق من النتائج النظرية

يتم التحقق من جميع النتائج النظرية من خلال الإثبات الرياضي الصارم:

الحد الرئيسي: إثبات أن $R_S(\mathcal{F}) \leq \sqrt{p/m}$ ينطبق على دوال الإخراج المحدود
حد Dudley المحسّن: تحسين الحد الكلاسيكي $4\alpha/\sqrt{m}$ إلى $4\alpha\sqrt{p}/\sqrt{m}$
الاستقرار: إثبات الاستقرار الخطي لتعقيد Rademacher

الرؤى الرئيسية

تكلفة القدرة التعبيرية: تؤدي القدرة التعبيرية الأقوى مباشرة إلى قيمة $p$ أكبر، مما يزيد من الحد الأعلى لخطأ التعميم
القيود الهيكلية: تقيد الفئات المتكافئة المستحثة من التلوين قدرة الدالة على الإفراط في التدريب
مقارنة المعماريات: توفير أداة نظرية لمقارنة قدرة التعميم لمعماريات GNN المختلفة

الأعمال ذات الصلة

أبحاث القدرة التعبيرية

Xu وآخرون و Morris وآخرون: إنشاء التطابق بين MPGNN و 1-WL
الأعمال اللاحقة: التوسع إلى متغيرات GNN الأكثر تعبيراً (k-GNN، شبكات CW، وغيرها)

نظرية التعميم

Morris وآخرون (بعد VC): أول ربط بين القدرة التعبيرية لـ GNN وبعد VC، لكن محدود بإعدادات محددة
D'Inverno وآخرون: التوسع إلى تحليل بعد VC لوظائف التفعيل Pfaffian
Garg وآخرون: توفير أول حد تعقيد Rademacher لـ MPGNN

مزايا هذه الورقة

اتصال مباشر: أول ربط مباشر بين مقياس القدرة التعبيرية (عدد الألوان) ومقياس التعميم
العمومية: ينطبق على معماريات GNN التعسفية وخوارزميات التلوين
يعتمد على البيانات: توفير حدود أكثر دقة تعتمد على البيانات

الخلاصة والنقاش

الاستنتاجات الرئيسية

تحديد المقايضة: أول تحديد كمي لعلاقة المقايضة بين القدرة التعبيرية لـ GNN وقدرة التعميم
التوحيد النظري: توحيد أبحاث القدرة التعبيرية والتعميم من خلال خوارزميات التلوين
التوجيه العملي: توفير مبادئ توجيهية نظرية لتصميم معمارية GNN

القيود

قيود المهمة: يقتصر التحليل الحالي على مهام التصنيف الثنائي على مستوى الرسم البياني
التقسيم المنفصل: استخدام فئات متكافئة منفصلة بدلاً من مقاييس التشابه المستمرة
افتراضات التوزيع: عدم الأخذ في الاعتبار السلوك تحت توزيعات رسوم بيانية محددة

الاتجاهات المستقبلية

توسع المهام: التوسع إلى التصنيف متعدد الفئات والانحدار والمهام على مستوى العقدة
طريقة شبه المقياس: استبدال الفئات المنفصلة بمقاييس تشابه هيكلي قائمة على شبه المقياس
النماذج الاحتمالية: دراسة السلوك المقارب تحت نماذج الرسوم البيانية العشوائية و graphon
التحقق التجريبي: دراسة تجريبية منهجية للتحقق من عملية حدود النظرية

التقييم المتعمق

المزايا

الابتكار النظري: أول ربط نظري مباشر بين القدرة التعبيرية والتعميم، يملأ فجوة نظرية مهمة
الدقة الرياضية: إثبات كامل وصارم، النتائج ذات عمومية عالية
القيمة العملية: توفير توجيه كمي لاختيار معمارية GNN
عمومية الإطار: ينطبق على نطاق واسع من معماريات GNN ومقاييس القدرة التعبيرية
ضمان الاستقرار: إثبات قوة الحدود

أوجه القصور

غياب التحقق التجريبي: نقص التحقق التجريبي من إحكام حدود النظرية
قيود المهام: يقتصر على التصنيف الثنائي، مما يحد من نطاق التطبيق
عدم معرفة إحكام الحدود: عدم تحليل إحكام الحدود المقدمة
التعقيد الحسابي: عدم مناقشة تعقيد حساب عدد الألوان

التأثير

المساهمة النظرية: توفير أساس مهم لنظرية GNN، من المتوقع أن تثير أبحاثاً لاحقة
تصميم المعمارية: توجيه اختيار وتصميم معمارية GNN في الممارسة العملية
اتجاه البحث: فتح اتجاه بحثي جديد لدراسة مقايضة القدرة التعبيرية والتعميم

السيناريوهات المناسبة

البحث النظري: تحليل نظرية القدرة التعبيرية والتعميم لـ GNN
تصميم المعمارية: سيناريوهات التطبيق التي تتطلب موازنة بين القدرة التعبيرية والتعميم
اختيار النموذج: اختيار معمارية GNN بقدرة تعبيرية مناسبة لمهمة محددة

المراجع

تستشهد هذه الورقة بـ 28 مرجعاً ذا صلة، تغطي الأعمال المهمة في المجالات الأساسية مثل القدرة التعبيرية لـ GNN ونظرية التعميم وتعقيد Rademacher، مما يوفر أساساً متيناً للتحليل النظري.

الملخص: من خلال منظور خوارزميات التلوين، تنشئ هذه الورقة لأول مرة اتصالاً نظرياً كمياً بين القدرة التعبيرية لـ GNN وقدرة التعميم، مما يوفر أداة نظرية مهمة لفهم وتصميم GNN. على الرغم من وجود بعض القيود، فإن مساهمتها النظرية ذات قيمة مهمة ومن المتوقع أن تعزز تطور أبحاث نظرية GNN.