2025-11-11T11:58:09.609989

Rademacher Meets Colors: More Expressivity, but at What Cost ?

Carrasco, Netto, Martirosyan et al.
The expressive power of graph neural networks (GNNs) is typically understood through their correspondence with graph isomorphism tests such as the Weisfeiler-Leman (WL) hierarchy. While more expressive GNNs can distinguish a richer set of graphs, they are also observed to suffer from higher generalization error. This work provides a theoretical explanation for this trade-off by linking expressivity and generalization through the lens of coloring algorithms. Specifically, we show that the number of equivalence classes induced by WL colorings directly bounds the GNNs Rademacher complexity -- a key data-dependent measure of generalization. Our analysis reveals that greater expressivity leads to higher complexity and thus weaker generalization guarantees. Furthermore, we prove that the Rademacher complexity is stable under perturbations in the color counts across different samples, ensuring robustness to sampling variability across datasets. Importantly, our framework is not restricted to message-passing GNNs or 1-WL, but extends to arbitrary GNN architectures and expressivity measures that partition graphs into equivalence classes. These results unify the study of expressivity and generalization in GNNs, providing a principled understanding of why increasing expressive power often comes at the cost of generalization.
academic

Rademacher Incontra i Colori: Maggiore Espressività, ma a Quale Costo?

Informazioni Fondamentali

  • ID Articolo: 2510.10101
  • Titolo: Rademacher Meets Colors: More Expressivity, but at What Cost?
  • Autori: Martin Carrasco, Caio Deberaldini Netto, Vahan A. Martirosyan, Aneeqa Mehrab, Ehimare Okoyomon, Caterina Graziani
  • Classificazione: cs.LG (Machine Learning)
  • Data di Pubblicazione: 11 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.10101

Riassunto

La capacità espressiva delle reti neurali su grafi (GNN) è comunemente compresa attraverso la sua corrispondenza con test di isomorfismo di grafi, come la gerarchia di Weisfeiler-Leman. Sebbene le GNN più espressive riescano a distinguere insiemi di grafi più ricchi, mostrano anche errori di generalizzazione più elevati. Questo lavoro collega l'espressività alla capacità di generalizzazione attraverso la prospettiva degli algoritmi di colorazione, fornendo una spiegazione teorica di questo compromesso. In particolare, gli autori dimostrano che il numero di classi di equivalenza indotte dalla colorazione WL delimita direttamente la complessità di Rademacher della GNN—una misura di generalizzazione critica e dipendente dai dati. L'analisi rivela che una maggiore espressività porta a una complessità più elevata, determinando garanzie di generalizzazione più deboli. Inoltre, gli autori provano la stabilità della complessità di Rademacher rispetto alle perturbazioni del conteggio dei colori tra campioni. È importante sottolineare che il framework non si limita alle GNN con passaggio di messaggi o 1-WL, ma si estende a architetture GNN arbitrarie e a misure di espressività che partizionano i grafi in classi di equivalenza.

Contesto di Ricerca e Motivazione

Problema Centrale

Questo studio affronta una questione teorica fondamentale nel campo delle GNN: il compromesso tra espressività e capacità di generalizzazione. Sebbene le osservazioni empiriche indichino che le GNN più espressive tendono ad avere prestazioni di generalizzazione peggiori, manca una spiegazione teorica rigorosa.

Importanza del Problema

  1. Mancanza di Fondamenti Teorici: La ricerca esistente si concentra principalmente sull'analisi dell'espressività delle GNN, ma la comprensione teorica della sua relazione con la capacità di generalizzazione è insufficiente
  2. Valore Pratico Guida: Comprendere questo compromesso è cruciale per progettare architetture GNN che posseggono sia sufficiente espressività che buona generalizzazione
  3. Necessità di un Framework Unificato: È necessario un framework teorico unificato per spiegare il comportamento di generalizzazione di diverse architetture GNN

Limitazioni dei Metodi Esistenti

  1. Analisi della Dimensione VC di Morris et al.: Applicabile solo a funzioni di attivazione specifiche e grafi limitati, dipendente dal numero di parametri piuttosto che dalle caratteristiche strutturali
  2. Complessità di Rademacher di Garg et al.: Sebbene fornisca limiti più stretti, non esplora la connessione con la distribuzione della colorazione WL
  3. Mancanza di Universalità: Le analisi esistenti sono per lo più limitate a architetture GNN specifiche o al test 1-WL

Contributi Principali

  1. Stabilire la Connessione Teorica Espressività-Generalizzazione: Prima connessione diretta tra l'espressività della GNN e la complessità di Rademacher attraverso algoritmi di colorazione
  2. Fornire Limiti di Complessità Precisi: Dimostrazione che il limite superiore della complessità di Rademacher è p/m\sqrt{p/m}, dove pp è il numero di classi di equivalenza
  3. Provare Garanzie di Stabilità: Stabilimento della continuità di Lipschitz della complessità di Rademacher rispetto alle perturbazioni del conteggio dei colori
  4. Progettazione di un Framework Universale: Estensione a architetture GNN arbitrarie e algoritmi di colorazione corrispondenti, non limitato alle GNN con passaggio di messaggi o 1-WL
  5. Miglioramento dei Limiti dell'Integrale di Dudley: Utilizzo della struttura pp-dimensionale per fornire limiti di copertura più stretti

Dettagli del Metodo

Definizione del Compito

Studio di compiti di classificazione binaria a livello di grafo, dove:

  • Input: Dataset di grafi S={(Gi,yi)}i=1mS = \{(G_i, y_i)\}_{i=1}^m, GiGG_i \in \mathcal{G}, yi{1,+1}y_i \in \{-1, +1\}
  • Output: Limiti della complessità di Rademacher per la classe di funzioni F={f:G[1,1]}\mathcal{F} = \{f: \mathcal{G} \to [-1,1]\}
  • Obiettivo: Stabilire una relazione quantitativa tra la misura di espressività e la capacità di generalizzazione

Framework Teorico

Idea Centrale

Un algoritmo di colorazione partiziona il campione SS in pp insiemi disgiunti I1,,IpI_1, \ldots, I_p, dove ogni IjI_j contiene tutti i grafi con lo stesso colore cjc_j. Questo partizionamento impone vincoli strutturali sulla classe di funzioni: qualsiasi funzione realizzabile dall'architettura deve rimanere costante sulle classi di equivalenza.

Risultati Teorici Principali

Proposizione 3.1 (Limite Centrale): Per la classe di funzioni F\mathcal{F}, se per ogni fFf \in \mathcal{F} i grafi con lo stesso colore 1-WL hanno lo stesso output, allora il limite della complessità empirica di Rademacher è:

RS(F)supΘL(Θ)pmR_S(\mathcal{F}) \leq \frac{\sup_\Theta L(\Theta)\sqrt{p}}{\sqrt{m}}

dove L(Θ)=i=1mf(Gi;Θ)2L(\Theta) = \sqrt{\sum_{i=1}^m f(G_i;\Theta)^2} è la norma 2\ell_2 degli output della funzione.

Corollario 3.2 (Caso di Output Limitato): Quando f:G[1,1]f: \mathcal{G} \to [-1,1]:

RS(F)pmR_S(\mathcal{F}) \leq \sqrt{\frac{p}{m}}

Logica Centrale della Dimostrazione

  1. Riorganizzazione della Sommatoria: Riorganizzazione della sommatoria nella definizione della complessità di Rademacher secondo il colore del grafo
  2. Disuguaglianza di Cauchy-Schwarz: Separazione della norma correlata alla funzione dalle variabili di Rademacher
  3. Disuguaglianza di Jensen: Utilizzo della concavità della funzione radice quadrata
  4. Calcolo dell'Aspettativa: Utilizzo dell'indipendenza e della proprietà di media zero delle variabili di Rademacher

Analisi di Stabilità

Proposizione 3.4 (Garanzia di Stabilità): Per due campioni SS e SS' di dimensione mm, se la differenza nel conteggio di ogni colore cjc_j tra i due campioni è al massimo ϵj\epsilon_j:

RS(F)RS(F)cjGCϵjm|R_S(\mathcal{F}) - R_{S'}(\mathcal{F})| \leq \frac{\sum_{c_j \in GC} \epsilon_j}{m}

Questo assicura la robustezza del limite rispetto alla variabilità del campionamento.

Estensione Universale

Il framework si estende a coppie arbitrarie (A,T)(A, T), dove AA è un'architettura GNN e TT è un algoritmo di colorazione che delimita la sua espressività. Se TST \sqsubseteq S (l'espressività di TT non supera quella di SS), allora pTpSp_T \leq p_S, il che significa che le architetture più espressive hanno limiti di complessità di Rademacher più grandi.

Configurazione Sperimentale

Verifica Teorica

Questo lavoro è principalmente teorico, con verifica attraverso prove matematiche dei limiti proposti. Gli autori forniscono esempi visualizzati nella Figura 1, mostrando come classi di funzioni di diversa espressività inducono diversi partizionamenti del campione.

Ambito di Applicabilità

  • Architetture GNN: GNN con passaggio di messaggi, k-GNN, reti CW, GNN su sottografi, GNN su percorsi, ecc.
  • Algoritmi di Colorazione: 1-WL, k-WL, WL cellulare, ecc.
  • Funzioni di Perdita: Perdita logistica, perdita di entropia incrociata, perdita di margine (devono soddisfare condizioni di Lipschitz)

Risultati Sperimentali

Verifica dei Risultati Teorici

Verifica di tutti i risultati teorici attraverso prove matematiche rigorose:

  1. Limite Principale: Dimostrazione che RS(F)p/mR_S(\mathcal{F}) \leq \sqrt{p/m} vale per funzioni con output limitato
  2. Limite di Dudley Migliorato: Miglioramento del termine classico 4α/m4\alpha/\sqrt{m} a 4αp/m4\alpha\sqrt{p}/\sqrt{m}
  3. Stabilità: Dimostrazione della stabilità lineare della complessità di Rademacher

Intuizioni Chiave

  1. Costo dell'Espressività: Una maggiore espressività porta direttamente a valori pp più grandi, aumentando il limite superiore dell'errore di generalizzazione
  2. Vincoli Strutturali: Le classi di equivalenza indotte dalla colorazione limitano la capacità di overfitting della funzione
  3. Confronto tra Architetture: Fornisce strumenti teorici per confrontare la capacità di generalizzazione di diverse architetture GNN

Lavori Correlati

Ricerca sull'Espressività

  • Xu et al. e Morris et al.: Stabilimento della corrispondenza tra MPGNN e 1-WL
  • Lavori Successivi: Estensione a varianti GNN più espressive (k-GNN, reti CW, ecc.)

Teoria della Generalizzazione

  • Morris et al. (Dimensione VC): Prima connessione tra espressività GNN e dimensione VC, ma limitata a impostazioni specifiche
  • D'Inverno et al.: Estensione all'analisi della dimensione VC per funzioni di attivazione Pfaffiane
  • Garg et al.: Primo limite di complessità di Rademacher per MPGNN

Vantaggi di Questo Lavoro

  1. Connessione Diretta: Prima connessione diretta tra misura di espressività (numero di colori) e misura di generalizzazione
  2. Universalità: Applicabile a qualsiasi architettura GNN e algoritmo di colorazione
  3. Dipendenza dai Dati: Fornisce limiti più raffinati e dipendenti dai dati

Conclusioni e Discussione

Conclusioni Principali

  1. Quantificazione del Compromesso: Prima quantificazione della relazione di compromesso tra espressività e capacità di generalizzazione delle GNN
  2. Unificazione Teorica: Unificazione della ricerca sull'espressività e sulla generalizzazione attraverso algoritmi di colorazione
  3. Guida Pratica: Fornisce principi guida teorici per la progettazione di architetture GNN

Limitazioni

  1. Restrizione del Compito: L'analisi attuale è limitata a compiti di classificazione binaria a livello di grafo
  2. Partizionamento Discreto: Utilizzo di classi di equivalenza discrete piuttosto che misure di similarità continue
  3. Ipotesi di Distribuzione: Non considera il comportamento sotto distribuzioni di grafi specifiche

Direzioni Future

  1. Estensione del Compito: Estensione a classificazione multiclasse, regressione e compiti a livello di nodo
  2. Approccio Pseudometrico: Sostituzione del partizionamento discreto con similarità strutturale basata su pseudometriche
  3. Modelli Probabilistici: Studio del comportamento asintotico sotto modelli di grafi casuali e graphon
  4. Verifica Empirica: Studio empirico sistematico della stretta dei limiti teorici nella pratica

Valutazione Approfondita

Punti di Forza

  1. Innovazione Teorica: Prima connessione teorica diretta tra espressività e generalizzazione, colmando un importante vuoto teorico
  2. Rigore Matematico: Prove complete e rigorose con risultati di carattere generale
  3. Valore Pratico: Fornisce guida quantitativa per la selezione dell'architettura GNN
  4. Framework Universale: Applicabile a un'ampia gamma di architetture GNN e misure di espressività
  5. Garanzie di Stabilità: Dimostrazione della robustezza del limite

Insufficienze

  1. Mancanza di Verifica Empirica: Assenza di esperimenti che verifichino la stretta dei limiti teorici
  2. Limitazione del Compito: Considerazione solo della classificazione binaria, limitando l'ambito di applicabilità
  3. Stretta del Limite Sconosciuta: Nessuna analisi del grado di stretta dei limiti forniti
  4. Complessità Computazionale: Nessuna discussione sulla complessità del calcolo del numero di colori

Impatto

  1. Contributo Teorico: Fornisce fondamenti teorici importanti per la ricerca sulle GNN, con previsione di stimolare ricerche successive
  2. Progettazione di Architetture: Guida la selezione e la progettazione dell'architettura GNN nella pratica
  3. Direzione di Ricerca: Apre una nuova direzione di ricerca sul compromesso espressività-generalizzazione

Scenari di Applicabilità

  1. Ricerca Teorica: Analisi teorica dell'espressività e della generalizzazione delle GNN
  2. Progettazione di Architetture: Scenari applicativi che richiedono il bilanciamento tra espressività e generalizzazione
  3. Selezione del Modello: Selezione di un'architettura GNN con espressività appropriata per compiti specifici

Bibliografia

Questo articolo cita 28 riferimenti correlati, coprendo lavori importanti nei campi centrali dell'espressività delle GNN, della teoria della generalizzazione e della complessità di Rademacher, fornendo una base solida per l'analisi teorica.


Sintesi: Questo articolo, attraverso la prospettiva degli algoritmi di colorazione, stabilisce per la prima volta una connessione teorica quantitativa tra l'espressività e la capacità di generalizzazione delle GNN, fornendo strumenti teorici importanti per la comprensione e la progettazione delle GNN. Nonostante alcune limitazioni, i suoi contributi teorici hanno valore significativo e si prevede che promuoveranno lo sviluppo della ricerca teorica sulle GNN.