The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
論文ID : 2510.10101タイトル : Rademacher Meets Colors: More Expressivity, but at What Cost?著者 : Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani分類 : cs.LG(機械学習)発表日 : 2025年10月11日(arXiv プレプリント)論文リンク : https://arxiv.org/abs/2510.10101 グラフニューラルネットワーク(GNN)の表現力は、通常、グラフ同型判定テスト(Weisfeiler-Leman階層など)との対応関係を通じて理解されます。より表現力の高いGNNはより豊かなグラフ集合を区別できますが、より高い汎化誤差も示します。本研究は、彩色アルゴリズムの観点から表現力と汎化能力を結びつけることで、このトレードオフに対する理論的説明を提供します。具体的には、著者らはWL彩色によって誘導される等価類の数がGNNのラーデマッハ複雑度(重要なデータ依存汎化尺度)を直接制限することを証明しています。分析により、より強い表現力がより高い複雑度をもたらし、より弱い汎化保証につながることが明らかになります。さらに、著者らはラーデマッハ複雑度が異なるサンプル間の彩色計数摂動に対して安定であることを証明しています。重要なことに、このフレームワークはメッセージパッシングGNNまたは1-WLに限定されず、任意のGNNアーキテクチャと等価類にグラフを分割する表現力尺度に拡張されます。
本研究は、GNN分野における基本的な理論問題に対処することを目指しています:表現力と汎化能力のトレードオフ 。経験的観察により、より表現力の高いGNNはしばしばより悪い汎化性能を示すことが示唆されていますが、厳密な理論的説明が欠けています。
理論的基礎の欠落 :既存研究は主にGNNの表現力分析に焦点を当てていますが、その汎化能力との関係に対する理論的理解が不足しています実践的指導価値 :このトレードオフを理解することは、十分な表現力を持ちながら良好に汎化するGNNアーキテクチャを設計するために重要です統一フレームワークの必要性 :異なるGNNアーキテクチャの汎化動作を説明する統一的な理論フレームワークが必要ですMorris等によるVC次元分析 :特定の活性化関数と有界グラフにのみ適用可能であり、構造特性ではなくパラメータ数に依存していますGarg等によるラーデマッハ複雑度 :より厳密な界を提供していますが、WL彩色分布との関連性を探索していません汎用性の欠落 :既存分析は多くの場合、特定のGNNアーキテクチャまたは1-WLテストに限定されています表現力-汎化理論の接続確立 :彩色アルゴリズムを通じてGNNの表現力とラーデマッハ複雑度を初めて直接結びつけます正確な複雑度界の提供 :ラーデマッハ複雑度の上界が p / m \sqrt{p/m} p / m であることを証明します。ここで p p p は等価類の数です安定性保証の証明 :ラーデマッハ複雑度が彩色計数摂動に対してリプシッツ連続であることを確立します汎用フレームワークの設計 :任意のGNNアーキテクチャと対応する彩色アルゴリズムに拡張され、メッセージパッシングGNNまたは1-WLに限定されません改善されたDudley積分界 :p p p 次元構造を利用してより厳密なカバリング数界を提供しますグラフレベルの二値分類タスクを研究します。ここで:
入力 :グラフデータセット S = { ( G i , y i ) } i = 1 m S = \{(G_i, y_i)\}_{i=1}^m S = {( G i , y i ) } i = 1 m 、G i ∈ G G_i \in \mathcal{G} G i ∈ G 、y i ∈ { − 1 , + 1 } y_i \in \{-1, +1\} y i ∈ { − 1 , + 1 } 出力 :関数クラス F = { f : G → [ − 1 , 1 ] } \mathcal{F} = \{f: \mathcal{G} \to [-1,1]\} F = { f : G → [ − 1 , 1 ]} のラーデマッハ複雑度界目標 :表現力尺度と汎化能力の定量的関係を確立します彩色アルゴリズムはサンプル S S S を p p p 個の互いに素な集合 I 1 , … , I p I_1, \ldots, I_p I 1 , … , I p に分割し、各 I j I_j I j は同じ彩色 c j c_j c j を持つすべてのグラフを含みます。この分割は関数クラスに構造的制約を課します:アーキテクチャで実装可能な任意の関数は等価類上で定数である必要があります。
命題3.1(核心界) :
関数クラス F \mathcal{F} F に対して、各 f ∈ F f \in \mathcal{F} f ∈ F について同じ1-WL彩色を持つグラフが同じ出力を持つ場合、経験的ラーデマッハ複雑度界は:
R S ( F ) ≤ sup Θ L ( Θ ) p m R_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}} R S ( F ) ≤ m s u p Θ L ( Θ ) p
ここで L ( Θ ) = ∑ i = 1 m f ( G i ; Θ ) 2 L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2} L ( Θ ) = ∑ i = 1 m f ( G i ; Θ ) 2 は関数出力の ℓ 2 \ell_2 ℓ 2 ノルムです。
系3.2(有界出力の場合) :
f : G → [ − 1 , 1 ] f: \mathcal{G} \to [-1,1] f : G → [ − 1 , 1 ] のとき:
R S ( F ) ≤ p m R_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}} R S ( F ) ≤ m p
合計の再構成 :ラーデマッハ複雑度定義における合計をグラフ彩色によって再構成しますコーシー・シュワルツ不等式 :関数関連ノルムとラーデマッハ変数を分離しますジェンセン不等式 :平方根関数の凹性を利用します期待値計算 :ラーデマッハ変数の独立性とゼロ平均特性を利用します命題3.4(安定性保証) :
サイズ m m m の2つのサンプル S S S と S ′ S' S ′ に対して、各彩色 c j c_j c j の計数差が両サンプルで最大 ϵ j \epsilon_j ϵ j である場合:
∣ R S ( F ) − R S ′ ( F ) ∣ ≤ ∑ c j ∈ G C ϵ j m |R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m} ∣ R S ( F ) − R S ′ ( F ) ∣ ≤ m ∑ c j ∈ GC ϵ j
これにより、サンプリング変動性下での界の堅牢性が保証されます。
フレームワークは任意の ( A , T ) (A, T) ( A , T ) ペアに拡張されます。ここで A A A はGNNアーキテクチャ、T T T はその表現力を制限する彩色アルゴリズムです。T ⊑ S T \sqsubseteq S T ⊑ S (T T T の表現力が S S S を超えない)の場合、p T ≤ p S p_T \leq p_S p T ≤ p S であり、より表現力の高いアーキテクチャはより大きなラーデマッハ複雑度界を持つことを意味します。
本論文は主に理論的研究であり、数学的証明を通じて提案された界を検証しています。著者らは図1で視覚化例を提供し、異なる表現力の関数クラスがどのようにサンプル分割を誘導するかを示しています。
GNNアーキテクチャ :メッセージパッシングGNN、k-GNN、CW網、部分グラフGNN、パスGNNなど彩色アルゴリズム :1-WL、k-WL、セルラーWLなど損失関数 :ロジスティック損失、交差エントロピー損失、マージン損失(リプシッツ条件を満たす必要があります)厳密な数学的証明を通じてすべての理論的結果を検証しました:
主要界 :有界出力関数に対して R S ( F ) ≤ p / m R_S(\mathcal{F}) \leq \sqrt{p/m} R S ( F ) ≤ p / m が成立することを証明しました改善されたDudley界 :古典的な 4 α / m 4\alpha/\sqrt{m} 4 α / m 項を 4 α p / m 4\alpha\sqrt{p}/\sqrt{m} 4 α p / m に改善しました安定性 :ラーデマッハ複雑度の線形安定性を証明しました表現力の代償 :より強い表現力は直接的により大きな p p p 値をもたらし、汎化誤差上界を増加させます構造的制約 :彩色によって誘導される等価類は関数の過学習能力を制限しますアーキテクチャ比較 :異なるGNNアーキテクチャの汎化能力を比較するための理論的ツールを提供しますXu等およびMorris等 :MPGNNと1-WLの対応関係を確立しました後続研究 :より表現力の高いGNN変体(k-GNN、CW網など)に拡張しましたMorris等(VC次元) :GNN表現力とVC次元を初めて結びつけましたが、特定の設定に限定されていますD'Inverno等 :Pfaffian活性化関数のVC次元分析に拡張しましたGarg等 :MPGNNの最初のラーデマッハ複雑度界を提供しました直接的接続 :表現力尺度(彩色数)と汎化尺度を初めて直接結びつけます汎用性 :任意のGNNアーキテクチャと彩色アルゴリズムに適用可能ですデータ依存 :より細かいデータ依存界を提供しますトレードオフの定量化 :GNN表現力と汎化能力のトレードオフを初めて定量化しました理論的統一 :彩色アルゴリズムを通じて表現力と汎化研究を統一しました実践的指導 :GNNアーキテクチャ設計に理論的指導原則を提供しますタスク制限 :現在の分析はグラフレベルの二値分類タスクに限定されています離散分割 :離散等価類を使用し、連続相似性尺度ではありません分布仮定 :特定のグラフ分布下での動作を考慮していませんタスク拡張 :多値分類、回帰、ノードレベルタスクに拡張します疑似距離法 :離散分割を構造的相似性に基づく疑似距離で置き換えます確率モデル :ランダムグラフモデルとgraphonの下での漸近動作を研究します経験的検証 :理論界の実用性を検証するための体系的な実証研究理論的革新 :表現力と汎化の直接的な理論的接続を初めて確立し、重要な理論的空白を埋めます数学的厳密性 :証明は完全で厳密であり、結果は一般的です実践的価値 :GNNアーキテクチャ選択に定量的指導を提供しますフレームワークの汎用性 :広範なGNNアーキテクチャと表現力尺度に適用可能です安定性保証 :界の堅牢性を証明しています経験的検証の欠落 :理論界の厳密性を検証する実験が欠けていますタスク制限 :二値分類のみを考慮し、適用範囲を制限しています界の厳密性が不明 :提供される界の厳密性程度を分析していません計算複雑度 :彩色数計算の複雑度について議論していません理論的貢献 :GNN理論に重要な基礎を提供し、後続研究を促発することが予想されますアーキテクチャ設計 :実践におけるGNNアーキテクチャ選択と設計を指導します研究方向 :表現力-汎化トレードオフの新しい研究方向を開きます理論研究 :GNN表現力と汎化理論分析アーキテクチャ設計 :表現力と汎化のバランスが必要なアプリケーションシーンモデル選択 :特定のタスクに適切な表現力のGNNアーキテクチャを選択する本論文は28の関連文献を引用しており、GNN表現力、汎化理論、ラーデマッハ複雑度などの核心分野の重要な研究をカバーしており、理論分析に堅実な基礎を提供しています。
要約 :本論文は彩色アルゴリズムの観点から、GNN表現力と汎化能力の間の定量的理論的接続を初めて確立し、GNNの理解と設計のための重要な理論的ツールを提供しています。いくつかの限界がありますが、その理論的貢献は重要な価値を持ち、GNN理論研究の発展を推進することが予想されます。