2025-11-14T01:22:11.048448

Symmetry-Aware GFlowNets

Kim, Lee, Oh
Generative Flow Networks (GFlowNets) offer a powerful framework for sampling graphs in proportion to their rewards. However, existing approaches suffer from systematic biases due to inaccuracies in state transition probability computations. These biases, rooted in the inherent symmetries of graphs, impact both atom-based and fragment-based generation schemes. To address this challenge, we introduce Symmetry-Aware GFlowNets (SA-GFN), a method that incorporates symmetry corrections into the learning process through reward scaling. By integrating bias correction directly into the reward structure, SA-GFN eliminates the need for explicit state transition computations. Empirical results show that SA-GFN enables unbiased sampling while enhancing diversity and consistently generating high-reward graphs that closely match the target distribution.
academic

対称性を考慮したGFlowNets

基本情報

  • 論文ID: 2506.02685
  • タイトル: Symmetry-Aware GFlowNets
  • 著者: Hohyun Kim, Seunggeun Lee, Min-hwan Oh (ソウル国立大学)
  • 分類: stat.ML cs.LG
  • 発表会議: ICML 2025 (第42回国際機械学習会議)
  • 論文リンク: https://arxiv.org/abs/2506.02685

要約

生成フローネットワーク(GFlowNets)は、報酬に比例してグラフをサンプリングするための強力なフレームワークを提供します。しかし、既存の方法は状態遷移確率計算の不正確性により系統的バイアスに悩まされています。これらのバイアスはグラフの固有の対称性に根ざしており、原子ベースおよびフラグメントベースの生成スキームに影響を与えます。この課題に対処するため、本論文は対称性を考慮したGFlowNets(SA-GFN)を導入し、報酬スケーリングを通じて対称性補正を学習プロセスに組み込みます。バイアス補正を報酬構造に直接統合することで、SA-GFNは明示的な状態遷移計算の必要性を排除します。実験結果は、SA-GFNが不偏サンプリングを実現しながら多様性を向上させ、目標分布と密接に一致する高報酬グラフを継続的に生成することを示しています。

研究背景と動機

核心問題

GFlowNetsはグラフ生成タスクにおいて**等価動作問題(equivalent action problem)**に直面しています。異なる動作が構造的に同じグラフをもたらす可能性があります。例えば、グラフに新しいノードを追加する際、2つの対称ノードに接続する動作は異なりますが、同型グラフを生成します。この場合、状態遷移確率はすべての等価動作を考慮する必要がありますが、計算コストが高くなります。

問題の重要性

  1. 分子生成のバイアス:分子発見において、50%以上の分子が複数の対称性を持ち、18%が4つ以上の対称性を含みます。対称性を無視すると、不正確なモデリングと分子構造生成精度の低下につながります。
  2. 系統的バイアス:バイアスは系統的であり、ノード生成では対称性が少ないグラフに偏り、フラグメント生成では対称成分に偏ります。
  3. 計算複雑性:状態遷移確率の正確な計算には、高コストなグラフ同型性テストが必要です。

既存手法の限界

  • **Ma et al. (2024)**は位置エンコーディングを使用して等価動作の検出を近似することを提案していますが、各遷移時に適用する必要があり、計算オーバーヘッドが大きく、近似解に過ぎません。
  • 従来のGFlowNetの目的関数(TB、DBなど)はすべて、状態遷移の形式化に基づいているため、等価動作問題を回避できません。

核心貢献

  1. 理論的貢献:GFlowNetフレームワーク下での自回帰グラフ生成の厳密な形式化を提供し、等価動作問題を明確に解決します
  2. シンプルで効果的なソリューション:自己同型群のサイズに基づく報酬スケーリング方法を提案し、既存の訓練アルゴリズムへの最小限の修正のみが必要です
  3. 不偏推定量:モデル尤度の不偏推定量を導出します
  4. 実験的検証:理論的結果を実験で検証し、多様で高報酬なサンプル生成における方法の有効性を証明します

方法の詳細

タスク定義

報酬関数R(x)が与えられたとき、GFlowNetsの目標は、終端状態のサンプリング確率が報酬に比例するようにポリシーpAを訓練することです:p̄A(x) = R(x)/Z、ここでZは正規化定数です。

核心理論フレームワーク

1. グラフ同型性と等価関係

  • グラフ同型性:2つのグラフGとG'が同型(G ≅ G')である場合、置換πが存在してπ(E) = E'となります
  • 自己同型群:グラフGの自己同型群Aut(G)は、グラフ構造を保持するすべての置換の集合です
  • 軌道:ノードuの軌道Orb(G,u) = {v ∈ V : ∃π ∈ Aut(G), π(u) = v}

2. 等価動作の形式化

定義4.1 (遷移等価性):G₁ ≅ G₂かつG'₁ ≅ G'₂である場合、グラフ遷移(G₁,G'₁)と(G₂,G'₂)は遷移等価です。

定義4.2 (軌道等価性):動作タイプが同じで、置換πが存在してπ(G₁) = G₂かつπ(u₁) = u₂である場合、グラフ動作(G₁,t₁,u₁)と(G₂,t₂,u₂)は軌道等価です。

定理4.3:軌道等価な動作は遷移等価な遷移をもたらします。

3. 主要な理論的結果

補題4.5:AddEdge動作に対して、 Orb(G,u,v)Orb(G,u,v)=Aut(G)Aut(G)\frac{|\text{Orb}(G,u,v)|}{|\text{Orb}(G',u,v)|} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|}

定理4.6 (自己同型補正):置換等変関数を使用する場合、 pAˉ(as)qAˉ(as)=Aut(G)Aut(G)pE(GG)qE(GG)\frac{p_{\bar{A}}(a|s)}{q_{\bar{A}}(a|s')} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|} \cdot \frac{p_E(G'|G)}{q_E(G|G')}

対称性を考慮した補正方法

1. ノード生成の報酬スケーリング

系5.1 (TB補正):軌跡バランス損失は以下のようにすべきです: LTB(τ)=(logZt=0n1pE(Gt+1Gt)Aut(Gn)R(Gn)t=0n1qE(GtGt+1))2L_{TB}(\tau) = \left(\log \frac{Z\prod_{t=0}^{n-1} p_E(G_{t+1}|G_t)}{|\text{Aut}(G_n)|R(G_n)\prod_{t=0}^{n-1} q_E(G_t|G_{t+1})}\right)^2

ソリューション:報酬を R~(G)=Aut(G)R(G)\tilde{R}(G) = |\text{Aut}(G)|R(G) にスケーリングします

2. フラグメント生成の補正

定理5.3 (フラグメント補正):k個のフラグメント{C₁,...,Cₖ}を接続して生成された終端状態Gに対して: R~(G)=Aut(G)R(G)i=1kAut(Ci)\tilde{R}(G) = \frac{|\text{Aut}(G)|R(G)}{\prod_{i=1}^k |\text{Aut}(C_i)|}

3. モデル尤度の不偏推定

pˉA(x)=EτqE(τGn)[pE(τ)Aut(Gn)qE(τGn)]\bar{p}_A(x) = \mathbb{E}_{\tau \sim q_E(\tau|G_n)}\left[\frac{p_E(\tau)}{|\text{Aut}(G_n)|q_E(\tau|G_n)}\right]

技術的革新点

  1. 理論の優雅性:複雑な遷移レベルの補正を終端状態の報酬スケーリングに簡素化
  2. 計算効率:各ステップでの高コストなグラフ同型性テストを回避し、自己同型群のサイズを1回のみ計算
  3. 汎用性:TB、DB、FMなど複数のGFlowNet目的関数に適用可能
  4. 正確性:近似解ではなく正確な解を提供

実験設定

データセット

  1. 説明的例:6つの切断されたノードの初期状態、112個の終端状態
  2. 合成グラフ:最大7ノードの異質グラフ、72,296個の終端状態
  3. 分子生成
    • 原子レベル:HOMO-LUMO ギャップ予測タスク
    • フラグメントレベル:sEH標的結合親和性予測タスク

評価指標

  • L1誤差:目標確率とモデル終端確率間のL1誤差
  • 多様性:分子間の平均Tanimoto距離
  • Top K指標:上位K個の高報酬分子の多様性と報酬
  • 一意性:生成されたサンプル中の一意な分子の割合

比較手法

  1. Vanilla GFlowNets:グラフ対称性を考慮しない
  2. Transition Correction:複数の同型性テストを通じて遷移等価動作を識別
  3. PE (Ma et al., 2024):位置エンコーディングを使用して軌道等価動作を近似的に識別
  4. Reward Scaling (本論文):修正された報酬信号を通じて補正を実装
  5. Flow Scaling (本論文):各遷移時に対称比率を乗算

実験結果

主要な結果

1. 説明的実験

  • Vanillaモデルの終端確率は|x|でクラスタリングされ、明らかなバイアスが存在
  • Reward ScalingはTransition Correctionと同じ効果を達成
  • 推定された正規化定数Z:Reward Scalingで112(真値)、Vanillaで26,706

2. 合成グラフ実験

  • TB目的:Reward ScalingはL1誤差を大幅に削減し、Transition Correctionと同等のパフォーマンス
  • DB目的:Reward Scalingの収束は遅いですが、最終的に同じ精度に達します
  • PE方法は近似解として、VanillaとPrecise方法の間のパフォーマンスを示します

3. 分子生成実験

原子レベル生成結果

  • 多様性:0.929→0.959 (Vanilla→Reward Scaling)
  • 一意性:0.93→1.0

フラグメントレベル生成結果

  • Top K報酬:0.941→0.952 (Vanilla→Reward Scaling Exact)
  • シクロヘキサンフラグメント使用回数:5220→1042 (対称フラグメントの過度な使用が大幅に削減)

アブレーション実験

  • 近似補正対正確補正:近似方法でもすでにパフォーマンスが大幅に改善
  • 異なる目的関数:TBとDBの両方が報酬スケーリングを通じて効果的に補正可能

計算効率分析

  • 自己同型計算時間:QM9データセット0.010ms、ZINC250kデータセット0.022ms
  • 軌跡サンプリングのニューラルネットワーク順伝播と比較して、計算オーバーヘッドは無視できます
  • 訓練時間比較:Reward ScalingはTransition Correctionより約15%高速

関連研究

自回帰グラフ生成

  • 隣接行列方法:ノード順序情報を保持し、等価動作問題が発生しやすくない
  • グラフシーケンス方法:等価動作を生成しやすく、状態遷移確率が必要な場合に問題が顕著

GFlowNets

  • 既存の目的関数(フロー一致、詳細バランス、軌跡バランスなど)はすべて等価動作問題を回避できません
  • Ma et al. (2024)が初めて問題を識別しましたが、近似解のみを提供

グラフニューラルネットワークの表現能力

  • 置換等変性により、同じ軌道のノードは同じ表現を持ちます
  • 限定された表現能力により、異なる軌道の動作表現が重複する可能性があります

結論と議論

主要な結論

  1. 理論的貢献:GFlowNetsの等価動作問題を初めて厳密に分析し、系統的バイアスをもたらすことを証明
  2. 実用的ソリューション:報酬スケーリングはシンプル、正確、効率的な補正方法を提供
  3. 広範な適用性:方法は原子レベルおよびフラグメントレベルの生成、および複数の訓練目的に適用可能

限界

  1. 動作設計への依存:理論的保証は特定の事前定義グラフ動作セットに依存
  2. タスク特異性:主に分子発見関連データセットで検証
  3. GNNの表現能力:限定されたGNN表現能力により、追加のバイアスが導入される可能性

今後の方向性

  1. 異なる対称パターンと報酬構造を持つタスクの探索
  2. より強い表現能力を持つGNNアーキテクチャの設計
  3. より複雑なグラフ生成シナリオへの拡張

深い評価

利点

  1. 理論的厳密性:完全な数学フレームワークと厳密な理論分析を提供
  2. 方法の簡潔性:ソリューションは極めてシンプルで、実装と統合が容易
  3. 実用的価値:分子生成などの重要な応用で実際の効果を示す
  4. 計算効率:高コストなオンライングラフ同型性テストを回避
  5. 強い汎用性:複数のGFlowNet訓練目的に適用可能

不足

  1. 実験範囲:主に分子生成タスクに集中し、他のグラフ生成タスクの検証が限定的
  2. 理論的仮定:特定の動作設計とGNNアーキテクチャの仮定に依存
  3. 近似方法:フラグメント生成の近似補正に理論的保証がない
  4. スケーラビリティ:非常に大きなグラフの場合、自己同型計算がボトルネックになる可能性

影響力

  1. 学術的価値:GFlowNets理論に重要な補足を提供し、基本的な問題を解決
  2. 実用的価値:医薬品発見などの応用分野に直接貢献
  3. 再現性:方法がシンプルで再現と応用が容易
  4. 啓発性:他の生成モデルの対称性処理に思考を提供

適用シーン

  1. 分子設計:医薬品発見、材料設計などの化学情報学応用
  2. グラフ生成:構造対称性を考慮する必要があるグラフ生成タスク
  3. 組合せ最適化:対称性制約を持つ組合せ最適化問題
  4. 強化学習:状態空間が対称性を持つRL タスク

参考文献

  1. Bengio et al. (2021) - GFlowNetの基礎
  2. Ma et al. (2024) - 等価動作問題の初期識別
  3. Malkin et al. (2022) - 軌跡バランス目的
  4. Jain et al. (2023) - 多目的GFlowNetsの応用

総合評価:これは理論と実践を兼ね備えた優れた論文であり、GFlowNetsの重要だが見落とされていた基本的な問題を解決しています。方法はシンプルで優雅であり、理論分析は厳密で、実験検証は十分です。GFlowNets理論の発展と実際の応用の両方に重要な貢献をしており、関連分野に継続的な影響を与えることが予想されます。