2025-11-11T11:58:09.609989

Rademacher Meets Colors: More Expressivity, but at What Cost ?

Carrasco, Netto, Martirosyan et al.

The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.

academic

Rademacher trifft Farben: Mehr Ausdruckskraft, aber zu welchem Preis?

Grundinformationen

Paper-ID: 2510.10101
Titel: Rademacher Meets Colors: More Expressivity, but at What Cost?
Autoren: Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani
Klassifikation: cs.LG (Maschinelles Lernen)
Veröffentlichungsdatum: 11. Oktober 2025 (arXiv Preprint)
Paper-Link: https://arxiv.org/abs/2510.10101

Zusammenfassung

Die Ausdruckskraft von Graphenneuralen Netzen (GNNs) wird üblicherweise durch ihre Entsprechung zu Graphisomorphismustests (wie der Weisfeiler-Leman-Hierarchie) verstanden. Obwohl ausdrucksstärkere GNNs in der Lage sind, reichhaltigere Graphmengen zu unterscheiden, zeigen sie auch höhere Generalisierungsfehler. Diese Arbeit verbindet Ausdruckskraft mit Generalisierungsfähigkeit durch die Perspektive von Färbungsalgorithmen und bietet eine theoretische Erklärung für diesen Kompromiss. Konkret beweisen die Autoren, dass die Anzahl der durch WL-Färbung induzierten Äquivalenzklassen direkt die Rademacher-Komplexität des GNN begrenzt – ein kritisches datenabhängiges Generalisierungsmaß. Die Analyse zeigt, dass stärkere Ausdruckskraft zu höherer Komplexität führt und somit schwächere Generalisierungsgarantien mit sich bringt. Darüber hinaus beweisen die Autoren die Stabilität der Rademacher-Komplexität unter Farbzählstörungen zwischen verschiedenen Stichproben. Wichtig ist, dass das Framework nicht auf Message-Passing-GNNs oder 1-WL beschränkt ist, sondern sich auf beliebige GNN-Architekturen und Ausdruckskraftmaße erstreckt, die Graphen in Äquivalenzklassen unterteilen.

Forschungshintergrund und Motivation

Kernproblem

Diese Forschung zielt darauf ab, ein grundlegendes theoretisches Problem im GNN-Bereich zu lösen: der Kompromiss zwischen Ausdruckskraft und Generalisierungsfähigkeit. Obwohl empirische Beobachtungen zeigen, dass ausdrucksstärkere GNNs tendenziell schlechtere Generalisierungsleistung aufweisen, fehlt eine strenge theoretische Erklärung.

Bedeutung des Problems

Fehlende theoretische Grundlagen: Bestehende Forschung konzentriert sich hauptsächlich auf die Ausdruckskraftanalyse von GNNs, aber das theoretische Verständnis ihrer Beziehung zur Generalisierungsfähigkeit ist unzureichend
Praktischer Leitwert: Das Verständnis dieses Kompromisses ist entscheidend für die Gestaltung von GNN-Architekturen, die sowohl ausreichende Ausdruckskraft als auch gute Generalisierung aufweisen
Bedarf nach einheitlichem Framework: Ein einheitliches theoretisches Framework ist erforderlich, um das Generalisierungsverhalten verschiedener GNN-Architekturen zu erklären

Einschränkungen bestehender Methoden

VC-Dimensionsanalyse von Morris et al.: Gilt nur für spezifische Aktivierungsfunktionen und begrenzte Graphen, hängt von der Parameteranzahl statt von Struktureigenschaften ab
Rademacher-Komplexität von Garg et al.: Obwohl sie engere Grenzen bietet, erforscht sie die Verbindung zur WL-Färbungsverteilung nicht
Mangel an Allgemeingültigkeit: Bestehende Analysen sind meist auf spezifische GNN-Architekturen oder 1-WL-Tests beschränkt

Kernbeiträge

Etablierung der Ausdruckskraft-Generalisierungs-Verbindung: Erste direkte Verknüpfung der GNN-Ausdruckskraft mit der Rademacher-Komplexität durch Färbungsalgorithmen
Bereitstellung präziser Komplexitätsgrenzen: Beweis, dass die Rademacher-Komplexitätsobergrenze $\sqrt{p/m}$ beträgt, wobei $p$ die Anzahl der Äquivalenzklassen ist
Stabilitätsgarantien: Etablierung der Lipschitz-Stetigkeit der Rademacher-Komplexität unter Farbzählstörungen
Universelles Framework-Design: Erweiterung auf beliebige GNN-Architekturen und entsprechende Färbungsalgorithmen, nicht beschränkt auf Message-Passing-GNNs oder 1-WL
Verbesserte Dudley-Integralschranken: Nutzung der $p$ -dimensionalen Struktur für engere Überdeckungszahlschranken

Methodische Details

Aufgabendefinition

Untersuchung von Graphen-Level-Binärklassifikationsaufgaben, wobei:

Eingabe: Graphdatensatz $S = \{(G_i, y_i)\}_{i=1}^m$ , $G_i \in \mathcal{G}$ , $y_i \in \{-1, +1\}$
Ausgabe: Rademacher-Komplexitätsgrenzen für die Funktionsklasse $\mathcal{F} = \{f: \mathcal{G} \to [-1,1]\}$
Ziel: Etablierung einer quantitativen Beziehung zwischen Ausdruckskraftmaß und Generalisierungsfähigkeit

Theoretisches Framework

Kernidee

Ein Färbungsalgorithmus unterteilt die Stichprobe $S$ in $p$ disjunkte Mengen $I_1, \ldots, I_p$ , wobei jedes $I_j$ alle Graphen mit derselben Farbe $c_j$ enthält. Diese Unterteilung legt Strukturbeschränkungen auf die Funktionsklasse auf: Jede durch die Architektur realisierbare Funktion muss auf Äquivalenzklassen konstant bleiben.

Haupttheoretische Ergebnisse

Proposition 3.1 (Kernschranke): Für die Funktionsklasse $\mathcal{F}$ , wenn für jedes $f \in \mathcal{F}$ Graphen mit derselben 1-WL-Farbe dieselbe Ausgabe haben, ist die empirische Rademacher-Komplexitätsschranke:

$R_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}}$

wobei $L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2}$ die $\ell_2$ -Norm der Funktionsausgaben ist.

Korollar 3.2 (Fall beschränkter Ausgaben): Wenn $f: \mathcal{G} \to [-1,1]$ :

$R_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}}$

Beweisstrategie

Summationsumordnung: Neuorganisation der Summation in der Rademacher-Komplexitätsdefinition nach Graphfarben
Cauchy-Schwarz-Ungleichung: Trennung funktionsbezogener Normen von Rademacher-Variablen
Jensen-Ungleichung: Nutzung der Konkavität der Quadratwurzelfunktion
Erwartungsberechnung: Ausnutzung der Unabhängigkeit und Nullmittelwert-Eigenschaft von Rademacher-Variablen

Stabilitätsanalyse

Proposition 3.4 (Stabilitätsgarantie): Für zwei Stichproben $S$ und $S'$ der Größe $m$ , wenn die Zählungsdifferenz jeder Farbe $c_j$ zwischen den beiden Stichproben höchstens $\epsilon_j$ beträgt:

$|R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m}$

Dies gewährleistet die Robustheit der Schranke unter Stichprobenvariabilität.

Universelle Erweiterung

Das Framework erstreckt sich auf beliebige $(A, T)$ -Paare, wobei $A$ eine GNN-Architektur ist und $T$ ein Färbungsalgorithmus, der ihre Ausdruckskraft begrenzt. Wenn $T \sqsubseteq S$ ( $T$ s Ausdruckskraft nicht größer als $S$ ), dann $p_T \leq p_S$ , was bedeutet, dass ausdrucksstärkere Architekturen größere Rademacher-Komplexitätsgrenzen haben.

Experimentelle Einrichtung

Theoretische Verifikation

Diese Arbeit ist hauptsächlich eine theoretische Arbeit, die die vorgeschlagenen Grenzen durch mathematische Beweise verifiziert. Die Autoren bieten in Abbildung 1 Visualisierungsbeispiele, die zeigen, wie Funktionsklassen unterschiedlicher Ausdruckskraft verschiedene Stichprobenunterteilungen induzieren.

Anwendungsbereich

GNN-Architekturen: Message-Passing-GNNs, k-GNNs, CW-Netzwerke, Subgraph-GNNs, Pfad-GNNs usw.
Färbungsalgorithmen: 1-WL, k-WL, zelluläre WL usw.
Verlustfunktionen: Logistische Verluste, Kreuzentropieverluste, Randverluste (müssen Lipschitz-Bedingungen erfüllen)

Experimentelle Ergebnisse

Verifikation theoretischer Ergebnisse

Alle theoretischen Ergebnisse werden durch strenge mathematische Beweise verifiziert:

Hauptschranke: Beweis, dass $R_S(\mathcal{F}) \leq \sqrt{p/m}$ für Funktionen mit beschränkter Ausgabe gilt
Verbesserte Dudley-Schranke: Verbesserung des klassischen Terms $4\alpha/\sqrt{m}$ zu $4\alpha\sqrt{p}/\sqrt{m}$
Stabilität: Beweis der linearen Stabilität der Rademacher-Komplexität

Wichtige Erkenntnisse

Kosten der Ausdruckskraft: Stärkere Ausdruckskraft führt direkt zu größeren $p$ -Werten und damit zu erhöhten Generalisierungsfehlergrenzen
Strukturbeschränkungen: Färbungsinduzierte Äquivalenzklassen begrenzen die Overfitting-Fähigkeit von Funktionen
Architekturvergleich: Bereitstellung theoretischer Werkzeuge zum Vergleich der Generalisierungsfähigkeit verschiedener GNN-Architekturen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Quantifizierung des Kompromisses: Erste Quantifizierung der Kompromissbeziehung zwischen GNN-Ausdruckskraft und Generalisierungsfähigkeit
Theoretische Vereinigung: Vereinigung von Ausdruckskraft- und Generalisierungsforschung durch Färbungsalgorithmen
Praktische Anleitung: Bereitstellung theoretischer Richtlinien für die GNN-Architekturgestaltung

Einschränkungen

Aufgabenbeschränkung: Aktuelle Analyse beschränkt sich auf Graphen-Level-Binärklassifikationsaufgaben
Diskrete Unterteilung: Verwendung diskreter Äquivalenzklassen statt kontinuierlicher Ähnlichkeitsmaße
Verteilungsannahmen: Berücksichtigung spezifischer Graphverteilungsverhalten nicht erfolgt

Zukünftige Richtungen

Aufgabenerweiterung: Erweiterung auf Mehrklassen-, Regressions- und Knoten-Level-Aufgaben
Pseudometrische Methoden: Ersetzung diskreter Unterteilungen durch strukturelle Ähnlichkeit basierend auf Pseudometriken
Probabilistische Modelle: Untersuchung asymptotischen Verhaltens unter zufälligen Graphmodellen und Graphonen
Empirische Verifikation: Systematische empirische Untersuchung der Praktikabilität theoretischer Schranken

Tiefgreifende Bewertung

Stärken

Theoretische Innovation: Erste Etablierung einer direkten theoretischen Verbindung zwischen Ausdruckskraft und Generalisierung, füllt wichtige theoretische Lücke
Mathematische Strenge: Vollständige und rigorose Beweise mit allgemeinen Ergebnissen
Praktischer Wert: Bereitstellung quantitativer Anleitung für GNN-Architekturauswahl
Framework-Universalität: Anwendbar auf breite Palette von GNN-Architekturen und Ausdruckskraftmaßen
Stabilitätsgarantien: Beweis der Robustheit der Schranken

Mängel

Fehlende empirische Verifikation: Mangel an experimenteller Verifikation der Enge theoretischer Schranken
Aufgabenbeschränkung: Nur Binärklassifikation berücksichtigt, begrenzt Anwendungsbereich
Schrankenenge unbekannt: Analyse der Enge der bereitgestellten Schranken nicht erfolgt
Rechenkomplexität: Diskussion der Komplexität der Farbzahlberechnung nicht erfolgt

Auswirkungen

Theoretischer Beitrag: Bereitstellung wichtiger Grundlagen für GNN-Theorie, erwartet nachfolgende Forschung
Architekturgestaltung: Anleitung praktischer GNN-Architekturauswahl und -gestaltung
Forschungsrichtung: Eröffnung neuer Forschungsrichtung für Ausdruckskraft-Generalisierungs-Kompromisse

Anwendungsszenarien

Theoretische Forschung: GNN-Ausdruckskraft- und Generalisierungstheorieanalyse
Architekturgestaltung: Anwendungsszenarien, die Ausdruckskraft und Generalisierung ausbalancieren müssen
Modellauswahl: Auswahl geeigneter Ausdruckskraft-GNN-Architekturen für spezifische Aufgaben

Literaturverzeichnis

Diese Arbeit zitiert 28 relevante Referenzen, die wichtige Arbeiten in Kernbereichen wie GNN-Ausdruckskraft, Generalisierungstheorie und Rademacher-Komplexität abdecken und eine solide Grundlage für die theoretische Analyse bieten.

Zusammenfassung: Diese Arbeit etabliert durch die Perspektive von Färbungsalgorithmen erstmals eine quantitative theoretische Verbindung zwischen GNN-Ausdruckskraft und Generalisierungsfähigkeit und bietet wichtige theoretische Werkzeuge zum Verständnis und zur Gestaltung von GNNs. Trotz einiger Einschränkungen hat ihr theoretischer Beitrag erheblichen Wert und wird voraussichtlich die Entwicklung der GNN-Theorie vorantreiben.