2025-11-14T01:22:11.048448

Symmetry-Aware GFlowNets

Kim, Lee, Oh

Generative Flow Networks (GFlowNets) offer a powerful framework for sampling graphs in proportion to their rewards. However, existing approaches suffer from systematic biases due to inaccuracies in state transition probability computations. These biases, rooted in the inherent symmetries of graphs, impact both atom-based and fragment-based generation schemes. To address this challenge, we introduce Symmetry-Aware GFlowNets (SA-GFN), a method that incorporates symmetry corrections into the learning process through reward scaling. By integrating bias correction directly into the reward structure, SA-GFN eliminates the need for explicit state transition computations. Empirical results show that SA-GFN enables unbiased sampling while enhancing diversity and consistently generating high-reward graphs that closely match the target distribution.

academic

GFlowNets Consapevoli della Simmetria

Informazioni Fondamentali

ID Articolo: 2506.02685
Titolo: Symmetry-Aware GFlowNets
Autori: Hohyun Kim, Seunggeun Lee, Min-hwan Oh (Seoul National University)
Classificazione: stat.ML cs.LG
Conferenza di Pubblicazione: ICML 2025 (42nd International Conference on Machine Learning)
Link Articolo: https://arxiv.org/abs/2506.02685

Riassunto

Le reti di flusso generativo (GFlowNets) forniscono un framework robusto per il campionamento di grafi proporzionale alla ricompensa. Tuttavia, i metodi esistenti presentano distorsioni sistematiche dovute all'imprecisione nel calcolo delle probabilità di transizione di stato. Queste distorsioni sono radicate nella simmetria intrinseca dei grafi e influenzano sia gli schemi di generazione basati su atomi che quelli basati su frammenti. Per affrontare questa sfida, il presente articolo introduce GFlowNets Consapevoli della Simmetria (SA-GFN), che incorpora la correzione della simmetria nel processo di apprendimento attraverso il riscalamento della ricompensa. Integrando direttamente la correzione della distorsione nella struttura della ricompensa, SA-GFN elimina la necessità di calcoli espliciti delle transizioni di stato. I risultati sperimentali dimostrano che SA-GFN raggiunge un campionamento imparziale, aumenta la diversità e genera continuamente grafi ad alta ricompensa che corrispondono strettamente alla distribuzione target.

Contesto di Ricerca e Motivazione

Problema Centrale

GFlowNets affronta il problema delle azioni equivalenti nei compiti di generazione di grafi: azioni diverse possono portare a grafi strutturalmente identici. Ad esempio, quando si aggiunge un nuovo nodo a un grafo, le azioni di connessione a due nodi simmetrici, sebbene diverse, producono grafi isomorfi. In questo caso, la probabilità di transizione di stato deve considerare tutte le azioni equivalenti, ma il calcolo è computazionalmente costoso.

Importanza del Problema

Distorsione nella generazione molecolare: Nella scoperta molecolare, oltre il 50% delle molecole possiede molteplici simmetrie, e il 18% contiene quattro o più simmetrie. Ignorare la simmetria porta a modellazione scorretta e ridotta precisione nella generazione di strutture molecolari.
Distorsione sistematica: La distorsione è sistematica, favorendo grafi con minore simmetria nella generazione di nodi e componenti simmetrici nella generazione di frammenti.
Complessità computazionale: Il calcolo accurato delle probabilità di transizione di stato richiede costosi test di isomorfismo di grafi.

Limitazioni dei Metodi Esistenti

Ma et al. (2024) propone l'uso di codifiche posizionali per approssimare il rilevamento di azioni equivalenti, ma richiede applicazione ad ogni transizione, con elevato sovraccarico computazionale e solo soluzioni approssimate.
Le funzioni obiettivo tradizionali di GFlowNet (TB, DB, ecc.) non possono evitare il problema delle azioni equivalenti, poiché si basano sulla formalizzazione delle transizioni di stato.

Contributi Principali

Contributo Teorico: Fornisce una formalizzazione rigorosa della generazione autogressiva di grafi nel framework GFlowNet, affrontando esplicitamente il problema delle azioni equivalenti
Soluzione Semplice ed Efficace: Propone un metodo di riscalamento della ricompensa basato sulla dimensione del gruppo di automorfismo, richiedendo solo modifiche minime agli algoritmi di addestramento esistenti
Stimatore Imparziale: Deriva uno stimatore imparziale della verosimiglianza del modello
Verifica Sperimentale: Verifica i risultati teorici attraverso esperimenti, dimostrando l'efficacia del metodo nel generare campioni diversi ad alta ricompensa

Dettagli del Metodo

Definizione del Compito

Dato una funzione di ricompensa R(x), l'obiettivo di GFlowNets è addestrare una politica pA tale che la probabilità di campionamento dello stato terminale sia proporzionale alla sua ricompensa: p̄A(x) = R(x)/Z, dove Z è la costante di normalizzazione.

Framework Teorico Centrale

1. Isomorfismo di Grafi e Relazioni di Equivalenza

Isomorfismo di grafi: Due grafi G e G' sono isomorfi (G ≅ G') se esiste una permutazione π tale che π(E) = E'
Gruppo di automorfismo: Il gruppo di automorfismo di un grafo G, Aut(G), è l'insieme di tutte le permutazioni che preservano la struttura del grafo
Orbita: L'orbita del nodo u è Orb(G,u) = {v ∈ V : ∃π ∈ Aut(G), π(u) = v}

2. Formalizzazione delle Azioni Equivalenti

Definizione 4.1 (Equivalenza di Transizione): Se G₁ ≅ G₂ e G'₁ ≅ G'₂, allora le transizioni di grafo (G₁,G'₁) e (G₂,G'₂) sono equivalenti in transizione.

Definizione 4.2 (Equivalenza di Orbita): Se il tipo di azione è identico e esiste una permutazione π tale che π(G₁) = G₂ e π(u₁) = u₂, allora le azioni di grafo (G₁,t₁,u₁) e (G₂,t₂,u₂) sono equivalenti in orbita.

Teorema 4.3: Le azioni equivalenti in orbita portano a transizioni equivalenti in transizione.

3. Risultati Teorici Chiave

Lemma 4.5: Per l'azione AddEdge, vale $\frac{|\text{Orb}(G,u,v)|}{|\text{Orb}(G',u,v)|} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|}$

Teorema 4.6 (Correzione di Automorfismo): Se si utilizza una funzione equivariante rispetto alle permutazioni, allora $\frac{p_{\bar{A}}(a|s)}{q_{\bar{A}}(a|s')} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|} \cdot \frac{p_E(G'|G)}{q_E(G|G')}$

Metodo di Correzione Consapevole della Simmetria

1. Riscalamento della Ricompensa per la Generazione di Nodi

Corollario 5.1 (Correzione TB): La perdita di equilibrio della traiettoria dovrebbe essere $L_{TB}(\tau) = \left(\log \frac{Z\prod_{t=0}^{n-1} p_E(G_{t+1}|G_t)}{|\text{Aut}(G_n)|R(G_n)\prod_{t=0}^{n-1} q_E(G_t|G_{t+1})}\right)^2$

Soluzione: Riscalare la ricompensa come $\tilde{R}(G) = |\text{Aut}(G)|R(G)$

2. Correzione per la Generazione di Frammenti

Teorema 5.3 (Correzione di Frammenti): Per uno stato terminale G generato dalla connessione di k frammenti {C₁,...,Cₖ}: $\tilde{R}(G) = \frac{|\text{Aut}(G)|R(G)}{\prod_{i=1}^k |\text{Aut}(C_i)|}$

3. Stimatore Imparziale della Verosimiglianza del Modello

$\bar{p}_A(x) = \mathbb{E}_{\tau \sim q_E(\tau|G_n)}\left[\frac{p_E(\tau)}{|\text{Aut}(G_n)|q_E(\tau|G_n)}\right]$

Punti di Innovazione Tecnica

Eleganza Teorica: Semplifica la complessa correzione a livello di transizione in un riscalamento della ricompensa dello stato terminale
Efficienza Computazionale: Evita costosi test di isomorfismo di grafi online, richiedendo solo un calcolo singolo della dimensione del gruppo di automorfismo
Universalità: Applicabile a molteplici funzioni obiettivo di GFlowNet come TB, DB, FM
Precisione: Fornisce soluzioni esatte piuttosto che approssimate

Configurazione Sperimentale

Dataset

Esempi Illustrativi: Stato iniziale con 6 nodi disconnessi, 112 stati terminali
Grafi Sintetici: Grafi eterogenei con al massimo 7 nodi, 72.296 stati terminali
Generazione Molecolare:
- A livello atomico: Compito di predizione del gap HOMO-LUMO
- A livello di frammenti: Compito di predizione dell'energia di legame del bersaglio sEH

Metriche di Valutazione

Errore L1: Errore L1 tra la probabilità target e la probabilità dello stato terminale del modello
Diversità: Distanza media di Tanimoto tra molecole
Indicatori Top K: Diversità e ricompensa delle prime K molecole ad alta ricompensa
Unicità: Proporzione di molecole uniche nei campioni generati

Metodi di Confronto

GFlowNets Vanilla: Non considera la simmetria dei grafi
Transition Correction: Identifica azioni di transizione equivalenti attraverso molteplici test di isomorfismo
PE (Ma et al., 2024): Utilizza codifiche posizionali per approssimare l'identificazione di azioni equivalenti in orbita
Reward Scaling (presente articolo): Implementa la correzione modificando il segnale di ricompensa
Flow Scaling (presente articolo): Moltiplica per il rapporto di simmetria ad ogni transizione

Risultati Sperimentali

Risultati Principali

1. Esperimenti Illustrativi

Il modello Vanilla mostra probabilità terminali raggruppate per |x|, con evidente distorsione
Reward Scaling raggiunge le stesse prestazioni di Transition Correction
Costante di normalizzazione stimata Z: Reward Scaling 112 (valore vero), Vanilla 26.706

2. Esperimenti su Grafi Sintetici

Obiettivo TB: Reward Scaling riduce significativamente l'errore L1, con prestazioni comparabili a Transition Correction
Obiettivo DB: Reward Scaling converge più lentamente, ma raggiunge infine la stessa precisione
Il metodo PE, come soluzione approssimata, mostra prestazioni intermedie tra Vanilla e i metodi esatti

3. Esperimenti di Generazione Molecolare

Risultati della Generazione a Livello Atomico:

Diversità: 0,929→0,959 (Vanilla→Reward Scaling)
Unicità: 0,93→1,0

Risultati della Generazione a Livello di Frammenti:

Ricompensa Top K: 0,941→0,952 (Vanilla→Reward Scaling Esatto)
Utilizzo di frammenti cicloesano: 5.220→1.042 (riduzione significativa dell'uso eccessivo di frammenti simmetrici)

Esperimenti di Ablazione

Correzione Approssimata vs Esatta: Il metodo approssimato già migliora significativamente le prestazioni
Diverse Funzioni Obiettivo: Sia TB che DB possono essere corretti efficacemente attraverso il riscalamento della ricompensa

Analisi dell'Efficienza Computazionale

Tempo di calcolo dell'automorfismo: 0,010 ms per il dataset QM9, 0,022 ms per ZINC250k
Rispetto alla propagazione in avanti della rete neurale nel campionamento di traiettorie, il sovraccarico computazionale è trascurabile
Confronto del tempo di addestramento: Reward Scaling è circa il 15% più veloce di Transition Correction

Lavori Correlati

Generazione Autogressiva di Grafi

Metodi basati su matrice di adiacenza: Preservano informazioni sull'ordine dei nodi, meno soggetti al problema delle azioni equivalenti
Metodi basati su sequenza di grafi: Facilmente generano azioni equivalenti, con il problema delle probabilità di transizione di stato che diventa critico

GFlowNets

Le funzioni obiettivo esistenti (flow matching, detailed balance, trajectory balance, ecc.) non possono evitare il problema delle azioni equivalenti
Ma et al. (2024) identifica per primo il problema ma fornisce solo soluzioni approssimate

Capacità Espressiva delle Reti Neurali su Grafi

L'equivarianza rispetto alle permutazioni porta a rappresentazioni identiche per nodi nella stessa orbita
La capacità espressiva limitata può portare a sovrapposizione nella rappresentazione di azioni in orbite diverse

Conclusioni e Discussione

Conclusioni Principali

Contributo Teorico: Prima analisi rigorosa del problema delle azioni equivalenti in GFlowNets, provando che causa distorsioni sistematiche
Soluzione Pratica: Il riscalamento della ricompensa fornisce un metodo di correzione semplice, esatto ed efficiente
Ampia Applicabilità: Il metodo è applicabile sia alla generazione a livello atomico che a livello di frammenti, e a molteplici obiettivi di addestramento

Limitazioni

Dipendenza dalla Progettazione di Azioni: Le garanzie teoriche dipendono da un insieme specifico di azioni di grafo predefinite
Specificità del Compito: Principalmente verificato su dataset correlati alla scoperta molecolare
Capacità Espressiva di GNN: La capacità espressiva limitata di GNN può introdurre distorsioni aggiuntive

Direzioni Future

Esplorare compiti con diversi pattern di simmetria e strutture di ricompensa
Progettare architetture GNN con maggiore capacità espressiva
Estendere a scenari di generazione di grafi più complessi

Valutazione Approfondita

Punti di Forza

Rigore Teorico: Fornisce un framework matematico completo e analisi teorica rigorosa
Semplicità del Metodo: La soluzione è estremamente semplice, facile da implementare e integrare
Valore Pratico: Dimostra effetti reali in importanti applicazioni come la generazione molecolare
Efficienza Computazionale: Evita costosi test di isomorfismo di grafi online
Forte Universalità: Applicabile a molteplici obiettivi di addestramento di GFlowNet

Punti Deboli

Ambito Sperimentale: Principalmente concentrato su compiti di generazione molecolare, con verifica limitata su altri compiti di generazione di grafi
Assunzioni Teoriche: Dipende da specifiche progettazioni di azioni e assunzioni su architetture GNN
Metodi Approssimati: La correzione approssimata per la generazione di frammenti manca di garanzie teoriche
Scalabilità: Per grafi molto grandi, il calcolo dell'automorfismo potrebbe diventare un collo di bottiglia

Impatto

Valore Accademico: Fornisce un importante supplemento alla teoria di GFlowNets, risolvendo un problema fondamentale
Valore Pratico: Contribuisce direttamente a campi applicativi come la scoperta di farmaci
Riproducibilità: Il metodo è semplice, facile da riprodurre e applicare
Ispirazione: Fornisce spunti per il trattamento della simmetria in altri modelli generativi

Scenari Applicabili

Progettazione Molecolare: Scoperta di farmaci, progettazione di materiali e altre applicazioni di chemioinformatica
Generazione di Grafi: Compiti di generazione di grafi che richiedono considerazione della simmetria strutturale
Ottimizzazione Combinatoria: Problemi di ottimizzazione combinatoria con vincoli di simmetria
Apprendimento per Rinforzo: Compiti di RL con spazi di stato simmetrici

Bibliografia

Bengio et al. (2021) - Fondamenti di GFlowNet
Ma et al. (2024) - Primo riconoscimento del problema delle azioni equivalenti
Malkin et al. (2022) - Obiettivo di equilibrio della traiettoria
Jain et al. (2023) - Applicazioni multi-obiettivo di GFlowNets

Valutazione Complessiva: Questo è un articolo eccellente che combina teoria e pratica, risolvendo un importante problema fondamentale in GFlowNets che era stato precedentemente trascurato. Il metodo è elegante e semplice, l'analisi teorica è rigorosa e la verifica sperimentale è completa. Fornisce importanti contributi sia allo sviluppo teorico di GFlowNets che alle applicazioni pratiche, e si prevede che avrà un impatto duraturo nel campo correlato.