2025-11-14T19:19:11.421355

GO-Diff: Data-free and amortized global structure optimization

Rønne, Vegge, Bhowmik
We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
academic

GO-Diff: データフリーで償却された大域構造最適化

基本情報

  • 論文ID: 2510.13448
  • タイトル: GO-Diff: Data-free and amortized global structure optimization
  • 著者: Nikolaj Rønne、Tejs Vegge、Arghya Bhowmik(デンマーク工科大学)
  • 分類: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
  • 発表日時: 2025年10月15日(プレプリント)
  • 論文リンク: https://arxiv.org/abs/2510.13448

要旨

本論文では、拡散モデルに基づいた大域構造最適化手法であるGO-Diffを紹介する。本手法は、事前データや明示的な緩和なしに、低エネルギー原子配置を直接サンプリングすることができる。GO-Diffはボルツマン加重スコアマッチング損失を用いてゼロから訓練され、既知のエネルギー関数のみを利用して生成プロセスを熱力学的に有利な領域へ導く。本手法は自己サンプリングとモデル精緻化の二段階循環を採用し、段階的に低エネルギー構造を目標とする能力を向上させる。従来の最適化パイプラインと比較して、GO-Diffは著しく少ないエネルギー評価で競争力のある結果を達成する。さらに、関連システム間で事前訓練モデルを再利用することにより、GO-Diffは償却最適化をサポートする——新しいタスクでゼロから再訓練することなく、より高速に収束することができる。

研究背景と動機

解決すべき問題

本研究は、原子系の大域構造最適化問題、すなわちポテンシャルエネルギー面(PES)上で低エネルギーの安定した原子配置を探索することを目指している。ポテンシャルエネルギー面は高次元の非凸関数であり、原子位置を対応するポテンシャルエネルギーにマッピングする。この表面を探索して低エネルギー構造を特定することは、計算材料科学、化学、触媒分野における基本的な課題である。

問題の重要性

大域構造最適化は、触媒表面発見から機能材料設計に至るまでの応用の基礎であり、以下の点で重要である:

  1. 新規触媒表面の発見
  2. 機能材料の設計
  3. 安定原子配置の予測
  4. 材料特性の理解

既存手法の限界

従来の大域最適化手法には以下の問題がある:

  1. 計算コストが高い: ランダム構造探索(RSS)、盆跳び、遺伝的アルゴリズム、シミュレーテッドアニーリングなどの手法は、局所緩和と勾配ベースの最適化器に依存し、大量のエネルギーと力の評価が必要である
  2. 局所最適化に限定される: 局所最適解に陥りやすく、複雑なエネルギーランドスケープの探索が制限される
  3. データ依存性: 機械学習原子間ポテンシャルは、関連する最小値を捉えるために慎重に選択された訓練データが必要であり、そうでなければ自己強化的な局所最小値に陥る可能性がある
  4. 転移可能性の欠如: 既存手法は関連システム間で学習した知識を再利用することが困難である

研究動機

拡散モデルは分子および材料科学の構造生成において有望性を示しているが、大域最適化タスクへの応用は困難である。なぜなら、目標はPESの大域最小値に対応する稀な低エネルギー配置をサンプリングすることであるが、このような構造のデータ分布は通常未知または入手不可能だからである。

核心的貢献

  1. データフリーの生成最適化手法を提案: 事前データや明示的な緩和なしにポテンシャルエネルギー面の最小値を直接サンプリング
  2. ボルツマン加重損失関数を開発: アニーリング戦略と組み合わせてサンプリングを低エネルギー領域へ導きながら探索性を維持
  3. 償却最適化を実現: 関連システム間で事前訓練モデルを転移させることで知識の再利用を実現
  4. 優れたサンプル効率を検証: 古典的探索手法と比較してより高いサンプル効率を実現

手法の詳細

タスク定義

入力: 原子系のエネルギー関数E(x)。ここでxは原子配置を表す 出力: 低エネルギーの安定した原子配置 目標: ボルツマン分布からサンプリング: πT(x)=exp(E(x)/T)ZT\pi_T(x) = \frac{\exp(-E(x)/T)}{Z_T}

モデルアーキテクチャ

訓練ループ

GO-Diffは自己サンプリングループ操作を採用する:

  1. モデルが逆拡散を通じて原子構造を生成
  2. 生成された構造のエネルギーを評価
  3. 結果のサンプルを使用してモデルを精緻化

リプレイバッファ B={(x0(i),E(i))}B = \{(x_0^{(i)}, E^{(i)})\} を維持し、生成された配置とそのエネルギーを保存する。

ボルツマン加重スコアマッチング

核心的な革新はボルツマン加重スコアマッチング損失である:

LθBoltzmann=EtU(0,1)[λ(t)Ex0q,xtpt0(xtx0)w(E)sθ(xt,t)xtlogpt0(xtx0)22]L_{\theta}^{Boltzmann} = E_{t\sim U(0,1)}\left[\lambda(t)E_{x_0\sim q, x_t\sim p_{t|0}(x_t|x_0)} w(E) \|s_\theta(x_t,t) - \nabla_{x_t}\log p_{t|0}(x_t|x_0)\|_2^2\right]

ここでボルツマン重みは: w(E)=exp(E/T)E(i)Bexp(E(i)/T)w(E) = \frac{\exp(-E/T)}{\sum_{E^{(i)}\in B} \exp(-E^{(i)}/T)}

この設計は重要度サンプリングを通じて、真のボルツマン分布から直接サンプリングする必要性を回避する。

アニーリング戦略

温度Tを高い初期値から低い最終値へアニーリングし、探索と開発のバランスを取る:

  • 初期段階: 高温が広範な探索を促進
  • 後期段階: 低温が深い最小値への収束を促進

力場ガイダンス(FFG)

通常エネルギーと共に利用可能な原子力を活用する:

  1. スコアネットワークの共有表現バックボーン上に力予測ヘッドを付加
  2. 予測-修正サンプリング方式で予測力を使用: Δx=α(1t)ζFθ(x)\Delta x = \alpha(1-t)\zeta F_\theta(x)
  3. 拡散時間t→0に従い、修正項がより大きなガイダンス役割を果たす

技術的革新点

  1. 直接ボルツマン加重: 力評価とモンテカルロ推定を回避し、直接的なボルツマン加重スコアマッチング損失を使用
  2. 自己教師あり学習: 外部データなしに自身の生成から学習
  3. モデル転移: 関連システム間で事前訓練モデルを転移させる能力を実証
  4. 物理ガイダンス: 力場情報を組み込んで収束を加速

実験設定

データセット

MACE-MP0汎用ポテンシャルを使用した2つの原子最適化タスク:

  1. Pt段差表面上のPt付加原子最適化: 3Dシステム。表面法線に沿った投影により2Dとして可視化可能
  2. 6×6 Pt(111)表面上のPt七量体発見: より複雑なシステム。ベンチマークテストと償却最適化検証に使用

評価指標

  • 目標構造発見の成功率
  • 目標構造を発見するのに必要な平均エネルギー評価回数
  • 時間経過に伴う最良エネルギー

比較手法

  • ランダム構造探索(RSS): AGOXソフトウェアパッケージで実装された従来手法
  • GO-Diff変種: FFGなし、FFGあり、モデル転移あり

実装詳細

汎用ハイパーパラメータ:

  • 拡散サンプリングステップ数: 500
  • ノイズスケジュール: 線形(VE-SDE)
  • スコアモデルアーキテクチャ: PaiNN GNN(4ブロック)、6Åカットオフ
  • 最終温度: 0.02
  • 学習率: 10^-4
  • オプティマイザ: AdamW

タスク固有パラメータ:

  • Pt付加原子: バッファサイズ16、反復あたり32サンプル、10反復指数アニーリング
  • Pt七量体: バッファサイズ64、反復あたり128サンプル、20反復指数アニーリング

実験結果

主要結果

Pt付加原子最適化

  • サンプリングが段階的に低エネルギー盆地に集中することを実証
  • ボルツマン加重損失とアニーリングスケジュールの有効性を検証

Pt七量体発見

手法評価回数成功率平均成功反復
RSS10,0001/87,816
GO-Diff2,5605/81,667
GO-Diff + FFG2,5608/81,994
GO-Diff + Transfer1,2807/8591

主要な知見

  1. サンプル効率: GO-Diffは著しく少ないエネルギー評価でより高い成功率を達成
  2. 力場ガイダンスの効果: FFGは成功率を向上させ(5/8から8/8へ)、性能を改善
  3. 転移学習の利点: モデル転移は必要な評価回数を2倍以上削減(1,667から591へ)
  4. 堅牢性: 拡散プロセスの確率性により、GO-Diffは局所最小値から堅牢に脱出可能

償却最適化分析

転移学習による加速は予想通りである。転移されたモデルは既に結合嗜好性(例えば段差エッジ下の中空位置の安定性)を捉えているため、最適化タスクは結合から学習するのではなく、原子間幾何学の調整に削減される。

関連研究

従来の大域最適化手法

  • ランダム構造探索、盆跳び、遺伝的アルゴリズム、シミュレーテッドアニーリング
  • 機械学習原子間ポテンシャル(事前訓練またはオンライン学習)

拡散モデルの応用

  • 分子および材料科学における構造生成
  • ブラックボックス最適化のための拡散モデル(DDOM)
  • ボルツマンサンプラー(iDEM、BNEM、随伴サンプリング)

本論文の関連研究に対する利点

  • モンテカルロ推定と力ラベルを回避
  • より単純でサンプル効率の高い訓練ループ
  • システム間の転移学習能力を初めて実証

結論と考察

主要な結論

  1. GO-Diffはデータフリーの大域構造最適化の効果的なフレームワークである
  2. ボルツマン加重スコアマッチング損失は低エネルギー配置生成を効果的に導く
  3. 償却最適化はモデル転移を通じて効率を大幅に向上させる
  4. サンプル効率と成功率の点で従来手法を上回る

限界

  1. ハイパーパラメータ感度: サンプル数、温度曲線、訓練ステップ数は重要なハイパーパラメータであり、慎重な調整が必要
  2. スケーラビリティの制限: 現在の原子拡散モデルは主に<20原子のシステムで検証されている
  3. システムサイズ: GO-Diffを非常に大きな現実的サイズのシステムに適用するための進一步の研究が必要

今後の方向性

  1. 多目的または組成設計最適化への拡張
  2. 動的温度調整と適応的サンプリング
  3. 大規模システムへのスケーラビリティの向上
  4. サロゲート加速と多目的最適化

深層評価

利点

  1. 手法の革新性: 拡散モデルをデータフリーの大域構造最適化に初めて成功裏に適用
  2. 技術的先進性: ボルツマン加重スコアマッチング損失の設計は巧妙で、既存手法の複雑性を回避
  3. 実用的価値: 償却最適化は実際の応用における顕著な利点を実証
  4. 実験の充実: 異なる複雑度のシステムで包括的なテストを実施
  5. 理論的基礎: 重要度サンプリングに基づく理論的導出は厳密

不足

  1. システムサイズの制限: 相対的に小さい原子系(≤20原子)でのみ検証
  2. ハイパーパラメータ調整: 手法は複数のハイパーパラメータに敏感で、汎用性を制限する可能性がある
  3. ベンチマークテストの限定: RSSとの比較のみで、他の最新手法との比較が不足
  4. 理論的分析の不足: 収束性とサンプル複雑度の理論的保証がない

影響力

  1. 学術的貢献: 大域最適化分野に新しい生成モデリングパラダイムをもたらす
  2. 実用的価値: 材料発見と触媒設計への潜在的応用
  3. 再現性: 完全なコードと実装詳細を提供
  4. 啓発的意義: 拡散モデルの最適化問題への応用に新しい方向を開く

適用シーン

  1. 材料発見: 新規触媒および機能材料の構造予測
  2. 表面科学: 吸着位置と表面再構成の研究
  3. 小分子最適化: 分子配置探索と医薬品設計
  4. 関連システムの存在: 特に類似システム間で複数の最適化が必要なシーンに適している

参考文献

本論文は38篇の関連文献を引用しており、大域最適化、拡散モデル、機械学習ポテンシャルなどの主要分野における重要な研究をカバーし、手法開発のための堅実な理論的基礎を提供している。