Rademacher Meets Colors: More Expressivity, but at What Cost ?
Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic
Rademacher Meets Colors: More Expressivity, but at What Cost?
그래프 신경망(GNN)의 표현력은 일반적으로 그래프 동형성 테스트(예: Weisfeiler-Leman 계층 구조)와의 대응 관계를 통해 이해됩니다. 더 표현력이 뛰어난 GNN이 더 풍부한 그래프 집합을 구별할 수 있지만, 더 높은 일반화 오류도 나타냅니다. 본 연구는 색칠 알고리즘의 관점에서 표현력과 일반화 능력을 연결하여 이러한 트레이드오프에 대한 이론적 설명을 제공합니다. 구체적으로, 저자들은 WL 색칠로 유도된 동치류의 개수가 GNN의 Rademacher 복잡도(핵심 데이터 의존 일반화 척도)를 직접 제한함을 증명했습니다. 분석은 더 강한 표현력이 더 높은 복잡도로 이어지며, 따라서 더 약한 일반화 보장을 초래함을 보여줍니다. 더욱이, 저자들은 Rademacher 복잡도가 샘플 간 색상 계수 섭동에 대해 안정적임을 증명했습니다. 중요한 점은, 이 프레임워크가 메시지 전달 GNN이나 1-WL에만 국한되지 않으며, 임의의 GNN 아키텍처와 그래프를 동치류로 분할하는 표현력 척도로 확장된다는 것입니다.
프레임워크는 임의의 (A,T) 쌍으로 확장되며, 여기서 A는 GNN 아키텍처, T는 표현력을 제한하는 색칠 알고리즘입니다. T⊑S이면 (즉, T의 표현력이 S를 초과하지 않음), pT≤pS이며, 이는 더 표현력이 뛰어난 아키텍처가 더 큰 Rademacher 복잡도 경계를 가짐을 의미합니다.
본 논문은 GNN 표현력, 일반화 이론, Rademacher 복잡도 등 핵심 분야의 중요 연구 28편을 인용하여 이론 분석의 견고한 기초를 제공합니다.
요약: 본 논문은 색칠 알고리즘의 관점에서 GNN의 표현력과 일반화 능력 간의 정량적 이론 연결을 처음으로 수립하여 GNN의 이해와 설계를 위한 중요한 이론적 도구를 제공합니다. 일부 한계에도 불구하고, 그 이론적 기여는 중요한 가치를 가지며 GNN 이론 연구의 발전을 촉진할 것으로 예상됩니다.