2025-11-11T11:58:09.609989

Rademacher Meets Colors: More Expressivity, but at What Cost ?

Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic

Rademacher trifft Farben: Mehr Ausdruckskraft, aber zu welchem Preis?

Grundinformationen

  • Paper-ID: 2510.10101
  • Titel: Rademacher Meets Colors: More Expressivity, but at What Cost?
  • Autoren: Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani
  • Klassifikation: cs.LG (Maschinelles Lernen)
  • Veröffentlichungsdatum: 11. Oktober 2025 (arXiv Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.10101

Zusammenfassung

Die Ausdruckskraft von Graphenneuralen Netzen (GNNs) wird üblicherweise durch ihre Entsprechung zu Graphisomorphismustests (wie der Weisfeiler-Leman-Hierarchie) verstanden. Obwohl ausdrucksstärkere GNNs in der Lage sind, reichhaltigere Graphmengen zu unterscheiden, zeigen sie auch höhere Generalisierungsfehler. Diese Arbeit verbindet Ausdruckskraft mit Generalisierungsfähigkeit durch die Perspektive von Färbungsalgorithmen und bietet eine theoretische Erklärung für diesen Kompromiss. Konkret beweisen die Autoren, dass die Anzahl der durch WL-Färbung induzierten Äquivalenzklassen direkt die Rademacher-Komplexität des GNN begrenzt – ein kritisches datenabhängiges Generalisierungsmaß. Die Analyse zeigt, dass stärkere Ausdruckskraft zu höherer Komplexität führt und somit schwächere Generalisierungsgarantien mit sich bringt. Darüber hinaus beweisen die Autoren die Stabilität der Rademacher-Komplexität unter Farbzählstörungen zwischen verschiedenen Stichproben. Wichtig ist, dass das Framework nicht auf Message-Passing-GNNs oder 1-WL beschränkt ist, sondern sich auf beliebige GNN-Architekturen und Ausdruckskraftmaße erstreckt, die Graphen in Äquivalenzklassen unterteilen.

Forschungshintergrund und Motivation

Kernproblem

Diese Forschung zielt darauf ab, ein grundlegendes theoretisches Problem im GNN-Bereich zu lösen: der Kompromiss zwischen Ausdruckskraft und Generalisierungsfähigkeit. Obwohl empirische Beobachtungen zeigen, dass ausdrucksstärkere GNNs tendenziell schlechtere Generalisierungsleistung aufweisen, fehlt eine strenge theoretische Erklärung.

Bedeutung des Problems

  1. Fehlende theoretische Grundlagen: Bestehende Forschung konzentriert sich hauptsächlich auf die Ausdruckskraftanalyse von GNNs, aber das theoretische Verständnis ihrer Beziehung zur Generalisierungsfähigkeit ist unzureichend
  2. Praktischer Leitwert: Das Verständnis dieses Kompromisses ist entscheidend für die Gestaltung von GNN-Architekturen, die sowohl ausreichende Ausdruckskraft als auch gute Generalisierung aufweisen
  3. Bedarf nach einheitlichem Framework: Ein einheitliches theoretisches Framework ist erforderlich, um das Generalisierungsverhalten verschiedener GNN-Architekturen zu erklären

Einschränkungen bestehender Methoden

  1. VC-Dimensionsanalyse von Morris et al.: Gilt nur für spezifische Aktivierungsfunktionen und begrenzte Graphen, hängt von der Parameteranzahl statt von Struktureigenschaften ab
  2. Rademacher-Komplexität von Garg et al.: Obwohl sie engere Grenzen bietet, erforscht sie die Verbindung zur WL-Färbungsverteilung nicht
  3. Mangel an Allgemeingültigkeit: Bestehende Analysen sind meist auf spezifische GNN-Architekturen oder 1-WL-Tests beschränkt

Kernbeiträge

  1. Etablierung der Ausdruckskraft-Generalisierungs-Verbindung: Erste direkte Verknüpfung der GNN-Ausdruckskraft mit der Rademacher-Komplexität durch Färbungsalgorithmen
  2. Bereitstellung präziser Komplexitätsgrenzen: Beweis, dass die Rademacher-Komplexitätsobergrenze p/m\sqrt{p/m} beträgt, wobei pp die Anzahl der Äquivalenzklassen ist
  3. Stabilitätsgarantien: Etablierung der Lipschitz-Stetigkeit der Rademacher-Komplexität unter Farbzählstörungen
  4. Universelles Framework-Design: Erweiterung auf beliebige GNN-Architekturen und entsprechende Färbungsalgorithmen, nicht beschränkt auf Message-Passing-GNNs oder 1-WL
  5. Verbesserte Dudley-Integralschranken: Nutzung der pp-dimensionalen Struktur für engere Überdeckungszahlschranken

Methodische Details

Aufgabendefinition

Untersuchung von Graphen-Level-Binärklassifikationsaufgaben, wobei:

  • Eingabe: Graphdatensatz S={(Gi,yi)}i=1mS = \{(G_i, y_i)\}_{i=1}^m, GiGG_i \in \mathcal{G}, yi{1,+1}y_i \in \{-1, +1\}
  • Ausgabe: Rademacher-Komplexitätsgrenzen für die Funktionsklasse F={f:G[1,1]}\mathcal{F} = \{f: \mathcal{G} \to [-1,1]\}
  • Ziel: Etablierung einer quantitativen Beziehung zwischen Ausdruckskraftmaß und Generalisierungsfähigkeit

Theoretisches Framework

Kernidee

Ein Färbungsalgorithmus unterteilt die Stichprobe SS in pp disjunkte Mengen I1,,IpI_1, \ldots, I_p, wobei jedes IjI_j alle Graphen mit derselben Farbe cjc_j enthält. Diese Unterteilung legt Strukturbeschränkungen auf die Funktionsklasse auf: Jede durch die Architektur realisierbare Funktion muss auf Äquivalenzklassen konstant bleiben.

Haupttheoretische Ergebnisse

Proposition 3.1 (Kernschranke): Für die Funktionsklasse F\mathcal{F}, wenn für jedes fFf \in \mathcal{F} Graphen mit derselben 1-WL-Farbe dieselbe Ausgabe haben, ist die empirische Rademacher-Komplexitätsschranke:

RS(F)supΘL(Θ)pmR_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}}

wobei L(Θ)=i=1mf(Gi;Θ)2L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2} die 2\ell_2-Norm der Funktionsausgaben ist.

Korollar 3.2 (Fall beschränkter Ausgaben): Wenn f:G[1,1]f: \mathcal{G} \to [-1,1]:

RS(F)pmR_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}}

Beweisstrategie

  1. Summationsumordnung: Neuorganisation der Summation in der Rademacher-Komplexitätsdefinition nach Graphfarben
  2. Cauchy-Schwarz-Ungleichung: Trennung funktionsbezogener Normen von Rademacher-Variablen
  3. Jensen-Ungleichung: Nutzung der Konkavität der Quadratwurzelfunktion
  4. Erwartungsberechnung: Ausnutzung der Unabhängigkeit und Nullmittelwert-Eigenschaft von Rademacher-Variablen

Stabilitätsanalyse

Proposition 3.4 (Stabilitätsgarantie): Für zwei Stichproben SS und SS' der Größe mm, wenn die Zählungsdifferenz jeder Farbe cjc_j zwischen den beiden Stichproben höchstens ϵj\epsilon_j beträgt:

RS(F)RS(F)cjGCϵjm|R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m}

Dies gewährleistet die Robustheit der Schranke unter Stichprobenvariabilität.

Universelle Erweiterung

Das Framework erstreckt sich auf beliebige (A,T)(A, T)-Paare, wobei AA eine GNN-Architektur ist und TT ein Färbungsalgorithmus, der ihre Ausdruckskraft begrenzt. Wenn TST \sqsubseteq S (TTs Ausdruckskraft nicht größer als SS), dann pTpSp_T \leq p_S, was bedeutet, dass ausdrucksstärkere Architekturen größere Rademacher-Komplexitätsgrenzen haben.

Experimentelle Einrichtung

Theoretische Verifikation

Diese Arbeit ist hauptsächlich eine theoretische Arbeit, die die vorgeschlagenen Grenzen durch mathematische Beweise verifiziert. Die Autoren bieten in Abbildung 1 Visualisierungsbeispiele, die zeigen, wie Funktionsklassen unterschiedlicher Ausdruckskraft verschiedene Stichprobenunterteilungen induzieren.

Anwendungsbereich

  • GNN-Architekturen: Message-Passing-GNNs, k-GNNs, CW-Netzwerke, Subgraph-GNNs, Pfad-GNNs usw.
  • Färbungsalgorithmen: 1-WL, k-WL, zelluläre WL usw.
  • Verlustfunktionen: Logistische Verluste, Kreuzentropieverluste, Randverluste (müssen Lipschitz-Bedingungen erfüllen)

Experimentelle Ergebnisse

Verifikation theoretischer Ergebnisse

Alle theoretischen Ergebnisse werden durch strenge mathematische Beweise verifiziert:

  1. Hauptschranke: Beweis, dass RS(F)p/mR_S(\mathcal{F}) \leq \sqrt{p/m} für Funktionen mit beschränkter Ausgabe gilt
  2. Verbesserte Dudley-Schranke: Verbesserung des klassischen Terms 4α/m4\alpha/\sqrt{m} zu 4αp/m4\alpha\sqrt{p}/\sqrt{m}
  3. Stabilität: Beweis der linearen Stabilität der Rademacher-Komplexität

Wichtige Erkenntnisse

  1. Kosten der Ausdruckskraft: Stärkere Ausdruckskraft führt direkt zu größeren pp-Werten und damit zu erhöhten Generalisierungsfehlergrenzen
  2. Strukturbeschränkungen: Färbungsinduzierte Äquivalenzklassen begrenzen die Overfitting-Fähigkeit von Funktionen
  3. Architekturvergleich: Bereitstellung theoretischer Werkzeuge zum Vergleich der Generalisierungsfähigkeit verschiedener GNN-Architekturen

Verwandte Arbeiten

Ausdruckskraftforschung

  • Xu et al. und Morris et al.: Etablierung der Entsprechung zwischen MPGNN und 1-WL
  • Nachfolgende Arbeiten: Erweiterung auf ausdrucksstärkere GNN-Varianten (k-GNN, CW-Netzwerke usw.)

Generalisierungstheorie

  • Morris et al. (VC-Dimension): Erste Verbindung von GNN-Ausdruckskraft und VC-Dimension, aber beschränkt auf spezifische Einstellungen
  • D'Inverno et al.: Erweiterung auf VC-Dimensionsanalyse mit Pfaffian-Aktivierungsfunktionen
  • Garg et al.: Erste Rademacher-Komplexitätsschranken für MPGNN

Vorteile dieser Arbeit

  1. Direkte Verbindung: Erste direkte Verknüpfung von Ausdruckskraftmaß (Farbanzahl) mit Generalisierungsmaß
  2. Allgemeingültigkeit: Anwendbar auf beliebige GNN-Architekturen und Färbungsalgorithmen
  3. Datenabhängigkeit: Bereitstellung feiner datenabhängiger Schranken

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Quantifizierung des Kompromisses: Erste Quantifizierung der Kompromissbeziehung zwischen GNN-Ausdruckskraft und Generalisierungsfähigkeit
  2. Theoretische Vereinigung: Vereinigung von Ausdruckskraft- und Generalisierungsforschung durch Färbungsalgorithmen
  3. Praktische Anleitung: Bereitstellung theoretischer Richtlinien für die GNN-Architekturgestaltung

Einschränkungen

  1. Aufgabenbeschränkung: Aktuelle Analyse beschränkt sich auf Graphen-Level-Binärklassifikationsaufgaben
  2. Diskrete Unterteilung: Verwendung diskreter Äquivalenzklassen statt kontinuierlicher Ähnlichkeitsmaße
  3. Verteilungsannahmen: Berücksichtigung spezifischer Graphverteilungsverhalten nicht erfolgt

Zukünftige Richtungen

  1. Aufgabenerweiterung: Erweiterung auf Mehrklassen-, Regressions- und Knoten-Level-Aufgaben
  2. Pseudometrische Methoden: Ersetzung diskreter Unterteilungen durch strukturelle Ähnlichkeit basierend auf Pseudometriken
  3. Probabilistische Modelle: Untersuchung asymptotischen Verhaltens unter zufälligen Graphmodellen und Graphonen
  4. Empirische Verifikation: Systematische empirische Untersuchung der Praktikabilität theoretischer Schranken

Tiefgreifende Bewertung

Stärken

  1. Theoretische Innovation: Erste Etablierung einer direkten theoretischen Verbindung zwischen Ausdruckskraft und Generalisierung, füllt wichtige theoretische Lücke
  2. Mathematische Strenge: Vollständige und rigorose Beweise mit allgemeinen Ergebnissen
  3. Praktischer Wert: Bereitstellung quantitativer Anleitung für GNN-Architekturauswahl
  4. Framework-Universalität: Anwendbar auf breite Palette von GNN-Architekturen und Ausdruckskraftmaßen
  5. Stabilitätsgarantien: Beweis der Robustheit der Schranken

Mängel

  1. Fehlende empirische Verifikation: Mangel an experimenteller Verifikation der Enge theoretischer Schranken
  2. Aufgabenbeschränkung: Nur Binärklassifikation berücksichtigt, begrenzt Anwendungsbereich
  3. Schrankenenge unbekannt: Analyse der Enge der bereitgestellten Schranken nicht erfolgt
  4. Rechenkomplexität: Diskussion der Komplexität der Farbzahlberechnung nicht erfolgt

Auswirkungen

  1. Theoretischer Beitrag: Bereitstellung wichtiger Grundlagen für GNN-Theorie, erwartet nachfolgende Forschung
  2. Architekturgestaltung: Anleitung praktischer GNN-Architekturauswahl und -gestaltung
  3. Forschungsrichtung: Eröffnung neuer Forschungsrichtung für Ausdruckskraft-Generalisierungs-Kompromisse

Anwendungsszenarien

  1. Theoretische Forschung: GNN-Ausdruckskraft- und Generalisierungstheorieanalyse
  2. Architekturgestaltung: Anwendungsszenarien, die Ausdruckskraft und Generalisierung ausbalancieren müssen
  3. Modellauswahl: Auswahl geeigneter Ausdruckskraft-GNN-Architekturen für spezifische Aufgaben

Literaturverzeichnis

Diese Arbeit zitiert 28 relevante Referenzen, die wichtige Arbeiten in Kernbereichen wie GNN-Ausdruckskraft, Generalisierungstheorie und Rademacher-Komplexität abdecken und eine solide Grundlage für die theoretische Analyse bieten.


Zusammenfassung: Diese Arbeit etabliert durch die Perspektive von Färbungsalgorithmen erstmals eine quantitative theoretische Verbindung zwischen GNN-Ausdruckskraft und Generalisierungsfähigkeit und bietet wichtige theoretische Werkzeuge zum Verständnis und zur Gestaltung von GNNs. Trotz einiger Einschränkungen hat ihr theoretischer Beitrag erheblichen Wert und wird voraussichtlich die Entwicklung der GNN-Theorie vorantreiben.