Rademacher Meets Colors: More Expressivity, but at What Cost ?
Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic
Rademacher Meets Colors: More Expressivity, but at What Cost?
La capacidad expresiva de las redes neuronales de grafos (GNNs) se comprende típicamente a través de su correspondencia con pruebas de isomorfismo de grafos (como la jerarquía de Weisfeiler-Leman). Aunque las GNNs más expresivas pueden distinguir conjuntos de grafos más ricos, también exhiben errores de generalización más altos. Este trabajo vincula la expresividad con la capacidad de generalización a través de la perspectiva de algoritmos de coloración, proporcionando una explicación teórica para este compromiso. Específicamente, los autores demuestran que el número de clases de equivalencia inducidas por la coloración WL delimita directamente la complejidad de Rademacher de la GNN, una medida crítica de generalización dependiente de los datos. El análisis revela que una expresividad más fuerte conduce a una complejidad mayor, resultando en garantías de generalización más débiles. Además, los autores demuestran la estabilidad de la complejidad de Rademacher bajo perturbaciones de conteo de colores entre muestras. Importantemente, el marco no se limita a GNNs de paso de mensajes o 1-WL, sino que se extiende a arquitecturas GNN arbitrarias y medidas de expresividad que particionan grafos en clases de equivalencia.
Esta investigación aborda una cuestión teórica fundamental en el campo de GNNs: el compromiso entre expresividad y capacidad de generalización. Aunque las observaciones empíricas sugieren que las GNNs más expresivas tienden a tener un desempeño de generalización deficiente, existe una falta de explicación teórica rigurosa.
Ausencia de Fundamentos Teóricos: La investigación existente se enfoca principalmente en el análisis de expresividad de GNNs, pero carece de comprensión teórica suficiente sobre su relación con la capacidad de generalización
Valor de Orientación Práctica: Comprender este compromiso es crucial para diseñar arquitecturas GNN que posean tanto expresividad adecuada como buen desempeño de generalización
Necesidad de Marco Unificado: Se requiere un marco teórico unificado para explicar el comportamiento de generalización de diferentes arquitecturas GNN
Análisis de Dimensión VC de Morris et al.: Solo aplicable a funciones de activación específicas y grafos acotados, dependiendo de la cantidad de parámetros en lugar de características estructurales
Complejidad de Rademacher de Garg et al.: Aunque proporciona límites más ajustados, no explora la conexión con la distribución de coloración WL
Falta de Generalidad: Los análisis existentes se limitan principalmente a arquitecturas GNN específicas o pruebas 1-WL
Establecer Conexión Teórica Expresividad-Generalización: Primera conexión directa entre la expresividad de GNN y la complejidad de Rademacher a través de algoritmos de coloración
Proporcionar Límites de Complejidad Precisos: Demostrar que el límite superior de complejidad de Rademacher es p/m, donde p es el número de clases de equivalencia
Probar Garantías de Estabilidad: Establecer continuidad de Lipschitz de la complejidad de Rademacher bajo perturbaciones de conteo de colores
Diseño de Marco Genérico: Extensión a arquitecturas GNN arbitrarias y algoritmos de coloración correspondientes, sin limitarse a GNNs de paso de mensajes o 1-WL
Mejorar Límites de Integral de Dudley: Utilizar la estructura p-dimensional para proporcionar límites de número de cobertura más ajustados
El algoritmo de coloración particiona la muestra S en p conjuntos disjuntos I1,…,Ip, donde cada Ij contiene todos los grafos con el mismo color cj. Esta partición impone restricciones estructurales en la clase de funciones: cualquier función implementable por la arquitectura debe mantener constancia en clases de equivalencia.
Proposición 3.1 (Límite Central):
Para la clase de funciones F, si para cada f∈F, los grafos con el mismo color 1-WL tienen la misma salida, entonces el límite de complejidad de Rademacher empírica es:
RS(F)≤msupΘL(Θ)p
donde L(Θ)=∑i=1mf(Gi;Θ)2 es la norma ℓ2 de las salidas de función.
Corolario 3.2 (Caso de Salida Acotada):
Cuando f:G→[−1,1]:
Proposición 3.4 (Garantía de Estabilidad):
Para dos muestras S y S′ de tamaño m, si la diferencia de conteo para cada color cj en ambas muestras es como máximo ϵj:
∣RS(F)−RS′(F)∣≤m∑cj∈GCϵj
Esto asegura robustez del límite bajo variabilidad de muestreo.
El marco se extiende a pares arbitrarios (A,T), donde A es una arquitectura GNN y T es un algoritmo de coloración que delimita su expresividad. Si T⊑S (la expresividad de T no excede la de S), entonces pT≤pS, lo que significa que arquitecturas más expresivas tienen límites de complejidad de Rademacher más grandes.
Este trabajo es principalmente teórico, verificando los límites propuestos a través de pruebas matemáticas. Los autores proporcionan ejemplos visualizados en la Figura 1, mostrando cómo clases de funciones de diferente expresividad inducen diferentes particiones de muestras.
Este artículo cita 28 referencias relacionadas, cubriendo trabajos importantes en expresividad de GNN, teoría de generalización, complejidad de Rademacher y otros campos centrales, proporcionando una base sólida para el análisis teórico.
Resumen: Este trabajo establece por primera vez una conexión teórica cuantitativa entre la expresividad de GNN y la capacidad de generalización a través de la perspectiva de algoritmos de coloración, proporcionando herramientas teóricas importantes para comprender y diseñar GNNs. Aunque existen algunas limitaciones, su contribución teórica posee valor importante y se espera que impulse el desarrollo de la investigación teórica de GNNs.