2025-11-14T01:22:11.048448

Symmetry-Aware GFlowNets

Kim, Lee, Oh
Generative Flow Networks (GFlowNets) offer a powerful framework for sampling graphs in proportion to their rewards. However, existing approaches suffer from systematic biases due to inaccuracies in state transition probability computations. These biases, rooted in the inherent symmetries of graphs, impact both atom-based and fragment-based generation schemes. To address this challenge, we introduce Symmetry-Aware GFlowNets (SA-GFN), a method that incorporates symmetry corrections into the learning process through reward scaling. By integrating bias correction directly into the reward structure, SA-GFN eliminates the need for explicit state transition computations. Empirical results show that SA-GFN enables unbiased sampling while enhancing diversity and consistently generating high-reward graphs that closely match the target distribution.
academic

GFlowNets Consapevoli della Simmetria

Informazioni Fondamentali

  • ID Articolo: 2506.02685
  • Titolo: Symmetry-Aware GFlowNets
  • Autori: Hohyun Kim, Seunggeun Lee, Min-hwan Oh (Seoul National University)
  • Classificazione: stat.ML cs.LG
  • Conferenza di Pubblicazione: ICML 2025 (42nd International Conference on Machine Learning)
  • Link Articolo: https://arxiv.org/abs/2506.02685

Riassunto

Le reti di flusso generativo (GFlowNets) forniscono un framework robusto per il campionamento di grafi proporzionale alla ricompensa. Tuttavia, i metodi esistenti presentano distorsioni sistematiche dovute all'imprecisione nel calcolo delle probabilità di transizione di stato. Queste distorsioni sono radicate nella simmetria intrinseca dei grafi e influenzano sia gli schemi di generazione basati su atomi che quelli basati su frammenti. Per affrontare questa sfida, il presente articolo introduce GFlowNets Consapevoli della Simmetria (SA-GFN), che incorpora la correzione della simmetria nel processo di apprendimento attraverso il riscalamento della ricompensa. Integrando direttamente la correzione della distorsione nella struttura della ricompensa, SA-GFN elimina la necessità di calcoli espliciti delle transizioni di stato. I risultati sperimentali dimostrano che SA-GFN raggiunge un campionamento imparziale, aumenta la diversità e genera continuamente grafi ad alta ricompensa che corrispondono strettamente alla distribuzione target.

Contesto di Ricerca e Motivazione

Problema Centrale

GFlowNets affronta il problema delle azioni equivalenti nei compiti di generazione di grafi: azioni diverse possono portare a grafi strutturalmente identici. Ad esempio, quando si aggiunge un nuovo nodo a un grafo, le azioni di connessione a due nodi simmetrici, sebbene diverse, producono grafi isomorfi. In questo caso, la probabilità di transizione di stato deve considerare tutte le azioni equivalenti, ma il calcolo è computazionalmente costoso.

Importanza del Problema

  1. Distorsione nella generazione molecolare: Nella scoperta molecolare, oltre il 50% delle molecole possiede molteplici simmetrie, e il 18% contiene quattro o più simmetrie. Ignorare la simmetria porta a modellazione scorretta e ridotta precisione nella generazione di strutture molecolari.
  2. Distorsione sistematica: La distorsione è sistematica, favorendo grafi con minore simmetria nella generazione di nodi e componenti simmetrici nella generazione di frammenti.
  3. Complessità computazionale: Il calcolo accurato delle probabilità di transizione di stato richiede costosi test di isomorfismo di grafi.

Limitazioni dei Metodi Esistenti

  • Ma et al. (2024) propone l'uso di codifiche posizionali per approssimare il rilevamento di azioni equivalenti, ma richiede applicazione ad ogni transizione, con elevato sovraccarico computazionale e solo soluzioni approssimate.
  • Le funzioni obiettivo tradizionali di GFlowNet (TB, DB, ecc.) non possono evitare il problema delle azioni equivalenti, poiché si basano sulla formalizzazione delle transizioni di stato.

Contributi Principali

  1. Contributo Teorico: Fornisce una formalizzazione rigorosa della generazione autogressiva di grafi nel framework GFlowNet, affrontando esplicitamente il problema delle azioni equivalenti
  2. Soluzione Semplice ed Efficace: Propone un metodo di riscalamento della ricompensa basato sulla dimensione del gruppo di automorfismo, richiedendo solo modifiche minime agli algoritmi di addestramento esistenti
  3. Stimatore Imparziale: Deriva uno stimatore imparziale della verosimiglianza del modello
  4. Verifica Sperimentale: Verifica i risultati teorici attraverso esperimenti, dimostrando l'efficacia del metodo nel generare campioni diversi ad alta ricompensa

Dettagli del Metodo

Definizione del Compito

Dato una funzione di ricompensa R(x), l'obiettivo di GFlowNets è addestrare una politica pA tale che la probabilità di campionamento dello stato terminale sia proporzionale alla sua ricompensa: p̄A(x) = R(x)/Z, dove Z è la costante di normalizzazione.

Framework Teorico Centrale

1. Isomorfismo di Grafi e Relazioni di Equivalenza

  • Isomorfismo di grafi: Due grafi G e G' sono isomorfi (G ≅ G') se esiste una permutazione π tale che π(E) = E'
  • Gruppo di automorfismo: Il gruppo di automorfismo di un grafo G, Aut(G), è l'insieme di tutte le permutazioni che preservano la struttura del grafo
  • Orbita: L'orbita del nodo u è Orb(G,u) = {v ∈ V : ∃π ∈ Aut(G), π(u) = v}

2. Formalizzazione delle Azioni Equivalenti

Definizione 4.1 (Equivalenza di Transizione): Se G₁ ≅ G₂ e G'₁ ≅ G'₂, allora le transizioni di grafo (G₁,G'₁) e (G₂,G'₂) sono equivalenti in transizione.

Definizione 4.2 (Equivalenza di Orbita): Se il tipo di azione è identico e esiste una permutazione π tale che π(G₁) = G₂ e π(u₁) = u₂, allora le azioni di grafo (G₁,t₁,u₁) e (G₂,t₂,u₂) sono equivalenti in orbita.

Teorema 4.3: Le azioni equivalenti in orbita portano a transizioni equivalenti in transizione.

3. Risultati Teorici Chiave

Lemma 4.5: Per l'azione AddEdge, vale Orb(G,u,v)Orb(G,u,v)=Aut(G)Aut(G)\frac{|\text{Orb}(G,u,v)|}{|\text{Orb}(G',u,v)|} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|}

Teorema 4.6 (Correzione di Automorfismo): Se si utilizza una funzione equivariante rispetto alle permutazioni, allora pAˉ(as)qAˉ(as)=Aut(G)Aut(G)pE(GG)qE(GG)\frac{p_{\bar{A}}(a|s)}{q_{\bar{A}}(a|s')} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|} \cdot \frac{p_E(G'|G)}{q_E(G|G')}

Metodo di Correzione Consapevole della Simmetria

1. Riscalamento della Ricompensa per la Generazione di Nodi

Corollario 5.1 (Correzione TB): La perdita di equilibrio della traiettoria dovrebbe essere LTB(τ)=(logZt=0n1pE(Gt+1Gt)Aut(Gn)R(Gn)t=0n1qE(GtGt+1))2L_{TB}(\tau) = \left(\log \frac{Z\prod_{t=0}^{n-1} p_E(G_{t+1}|G_t)}{|\text{Aut}(G_n)|R(G_n)\prod_{t=0}^{n-1} q_E(G_t|G_{t+1})}\right)^2

Soluzione: Riscalare la ricompensa come R~(G)=Aut(G)R(G)\tilde{R}(G) = |\text{Aut}(G)|R(G)

2. Correzione per la Generazione di Frammenti

Teorema 5.3 (Correzione di Frammenti): Per uno stato terminale G generato dalla connessione di k frammenti {C₁,...,Cₖ}: R~(G)=Aut(G)R(G)i=1kAut(Ci)\tilde{R}(G) = \frac{|\text{Aut}(G)|R(G)}{\prod_{i=1}^k |\text{Aut}(C_i)|}

3. Stimatore Imparziale della Verosimiglianza del Modello

pˉA(x)=EτqE(τGn)[pE(τ)Aut(Gn)qE(τGn)]\bar{p}_A(x) = \mathbb{E}_{\tau \sim q_E(\tau|G_n)}\left[\frac{p_E(\tau)}{|\text{Aut}(G_n)|q_E(\tau|G_n)}\right]

Punti di Innovazione Tecnica

  1. Eleganza Teorica: Semplifica la complessa correzione a livello di transizione in un riscalamento della ricompensa dello stato terminale
  2. Efficienza Computazionale: Evita costosi test di isomorfismo di grafi online, richiedendo solo un calcolo singolo della dimensione del gruppo di automorfismo
  3. Universalità: Applicabile a molteplici funzioni obiettivo di GFlowNet come TB, DB, FM
  4. Precisione: Fornisce soluzioni esatte piuttosto che approssimate

Configurazione Sperimentale

Dataset

  1. Esempi Illustrativi: Stato iniziale con 6 nodi disconnessi, 112 stati terminali
  2. Grafi Sintetici: Grafi eterogenei con al massimo 7 nodi, 72.296 stati terminali
  3. Generazione Molecolare:
    • A livello atomico: Compito di predizione del gap HOMO-LUMO
    • A livello di frammenti: Compito di predizione dell'energia di legame del bersaglio sEH

Metriche di Valutazione

  • Errore L1: Errore L1 tra la probabilità target e la probabilità dello stato terminale del modello
  • Diversità: Distanza media di Tanimoto tra molecole
  • Indicatori Top K: Diversità e ricompensa delle prime K molecole ad alta ricompensa
  • Unicità: Proporzione di molecole uniche nei campioni generati

Metodi di Confronto

  1. GFlowNets Vanilla: Non considera la simmetria dei grafi
  2. Transition Correction: Identifica azioni di transizione equivalenti attraverso molteplici test di isomorfismo
  3. PE (Ma et al., 2024): Utilizza codifiche posizionali per approssimare l'identificazione di azioni equivalenti in orbita
  4. Reward Scaling (presente articolo): Implementa la correzione modificando il segnale di ricompensa
  5. Flow Scaling (presente articolo): Moltiplica per il rapporto di simmetria ad ogni transizione

Risultati Sperimentali

Risultati Principali

1. Esperimenti Illustrativi

  • Il modello Vanilla mostra probabilità terminali raggruppate per |x|, con evidente distorsione
  • Reward Scaling raggiunge le stesse prestazioni di Transition Correction
  • Costante di normalizzazione stimata Z: Reward Scaling 112 (valore vero), Vanilla 26.706

2. Esperimenti su Grafi Sintetici

  • Obiettivo TB: Reward Scaling riduce significativamente l'errore L1, con prestazioni comparabili a Transition Correction
  • Obiettivo DB: Reward Scaling converge più lentamente, ma raggiunge infine la stessa precisione
  • Il metodo PE, come soluzione approssimata, mostra prestazioni intermedie tra Vanilla e i metodi esatti

3. Esperimenti di Generazione Molecolare

Risultati della Generazione a Livello Atomico:

  • Diversità: 0,929→0,959 (Vanilla→Reward Scaling)
  • Unicità: 0,93→1,0

Risultati della Generazione a Livello di Frammenti:

  • Ricompensa Top K: 0,941→0,952 (Vanilla→Reward Scaling Esatto)
  • Utilizzo di frammenti cicloesano: 5.220→1.042 (riduzione significativa dell'uso eccessivo di frammenti simmetrici)

Esperimenti di Ablazione

  • Correzione Approssimata vs Esatta: Il metodo approssimato già migliora significativamente le prestazioni
  • Diverse Funzioni Obiettivo: Sia TB che DB possono essere corretti efficacemente attraverso il riscalamento della ricompensa

Analisi dell'Efficienza Computazionale

  • Tempo di calcolo dell'automorfismo: 0,010 ms per il dataset QM9, 0,022 ms per ZINC250k
  • Rispetto alla propagazione in avanti della rete neurale nel campionamento di traiettorie, il sovraccarico computazionale è trascurabile
  • Confronto del tempo di addestramento: Reward Scaling è circa il 15% più veloce di Transition Correction

Lavori Correlati

Generazione Autogressiva di Grafi

  • Metodi basati su matrice di adiacenza: Preservano informazioni sull'ordine dei nodi, meno soggetti al problema delle azioni equivalenti
  • Metodi basati su sequenza di grafi: Facilmente generano azioni equivalenti, con il problema delle probabilità di transizione di stato che diventa critico

GFlowNets

  • Le funzioni obiettivo esistenti (flow matching, detailed balance, trajectory balance, ecc.) non possono evitare il problema delle azioni equivalenti
  • Ma et al. (2024) identifica per primo il problema ma fornisce solo soluzioni approssimate

Capacità Espressiva delle Reti Neurali su Grafi

  • L'equivarianza rispetto alle permutazioni porta a rappresentazioni identiche per nodi nella stessa orbita
  • La capacità espressiva limitata può portare a sovrapposizione nella rappresentazione di azioni in orbite diverse

Conclusioni e Discussione

Conclusioni Principali

  1. Contributo Teorico: Prima analisi rigorosa del problema delle azioni equivalenti in GFlowNets, provando che causa distorsioni sistematiche
  2. Soluzione Pratica: Il riscalamento della ricompensa fornisce un metodo di correzione semplice, esatto ed efficiente
  3. Ampia Applicabilità: Il metodo è applicabile sia alla generazione a livello atomico che a livello di frammenti, e a molteplici obiettivi di addestramento

Limitazioni

  1. Dipendenza dalla Progettazione di Azioni: Le garanzie teoriche dipendono da un insieme specifico di azioni di grafo predefinite
  2. Specificità del Compito: Principalmente verificato su dataset correlati alla scoperta molecolare
  3. Capacità Espressiva di GNN: La capacità espressiva limitata di GNN può introdurre distorsioni aggiuntive

Direzioni Future

  1. Esplorare compiti con diversi pattern di simmetria e strutture di ricompensa
  2. Progettare architetture GNN con maggiore capacità espressiva
  3. Estendere a scenari di generazione di grafi più complessi

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: Fornisce un framework matematico completo e analisi teorica rigorosa
  2. Semplicità del Metodo: La soluzione è estremamente semplice, facile da implementare e integrare
  3. Valore Pratico: Dimostra effetti reali in importanti applicazioni come la generazione molecolare
  4. Efficienza Computazionale: Evita costosi test di isomorfismo di grafi online
  5. Forte Universalità: Applicabile a molteplici obiettivi di addestramento di GFlowNet

Punti Deboli

  1. Ambito Sperimentale: Principalmente concentrato su compiti di generazione molecolare, con verifica limitata su altri compiti di generazione di grafi
  2. Assunzioni Teoriche: Dipende da specifiche progettazioni di azioni e assunzioni su architetture GNN
  3. Metodi Approssimati: La correzione approssimata per la generazione di frammenti manca di garanzie teoriche
  4. Scalabilità: Per grafi molto grandi, il calcolo dell'automorfismo potrebbe diventare un collo di bottiglia

Impatto

  1. Valore Accademico: Fornisce un importante supplemento alla teoria di GFlowNets, risolvendo un problema fondamentale
  2. Valore Pratico: Contribuisce direttamente a campi applicativi come la scoperta di farmaci
  3. Riproducibilità: Il metodo è semplice, facile da riprodurre e applicare
  4. Ispirazione: Fornisce spunti per il trattamento della simmetria in altri modelli generativi

Scenari Applicabili

  1. Progettazione Molecolare: Scoperta di farmaci, progettazione di materiali e altre applicazioni di chemioinformatica
  2. Generazione di Grafi: Compiti di generazione di grafi che richiedono considerazione della simmetria strutturale
  3. Ottimizzazione Combinatoria: Problemi di ottimizzazione combinatoria con vincoli di simmetria
  4. Apprendimento per Rinforzo: Compiti di RL con spazi di stato simmetrici

Bibliografia

  1. Bengio et al. (2021) - Fondamenti di GFlowNet
  2. Ma et al. (2024) - Primo riconoscimento del problema delle azioni equivalenti
  3. Malkin et al. (2022) - Obiettivo di equilibrio della traiettoria
  4. Jain et al. (2023) - Applicazioni multi-obiettivo di GFlowNets

Valutazione Complessiva: Questo è un articolo eccellente che combina teoria e pratica, risolvendo un importante problema fondamentale in GFlowNets che era stato precedentemente trascurato. Il metodo è elegante e semplice, l'analisi teorica è rigorosa e la verifica sperimentale è completa. Fornisce importanti contributi sia allo sviluppo teorico di GFlowNets che alle applicazioni pratiche, e si prevede che avrà un impatto duraturo nel campo correlato.