2025-11-14T19:19:11.421355

GO-Diff: Data-free and amortized global structure optimization

RÃ¸nne, Vegge, Bhowmik

We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.

academic

GO-Diff: データフリーで償却された大域構造最適化

基本情報

論文ID: 2510.13448
タイトル: GO-Diff: Data-free and amortized global structure optimization
著者: Nikolaj Rønne、Tejs Vegge、Arghya Bhowmik(デンマーク工科大学)
分類: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
発表日時: 2025年10月15日(プレプリント)
論文リンク: https://arxiv.org/abs/2510.13448

要旨

本論文では、拡散モデルに基づいた大域構造最適化手法であるGO-Diffを紹介する。本手法は、事前データや明示的な緩和なしに、低エネルギー原子配置を直接サンプリングすることができる。GO-Diffはボルツマン加重スコアマッチング損失を用いてゼロから訓練され、既知のエネルギー関数のみを利用して生成プロセスを熱力学的に有利な領域へ導く。本手法は自己サンプリングとモデル精緻化の二段階循環を採用し、段階的に低エネルギー構造を目標とする能力を向上させる。従来の最適化パイプラインと比較して、GO-Diffは著しく少ないエネルギー評価で競争力のある結果を達成する。さらに、関連システム間で事前訓練モデルを再利用することにより、GO-Diffは償却最適化をサポートする——新しいタスクでゼロから再訓練することなく、より高速に収束することができる。

研究背景と動機

解決すべき問題

本研究は、原子系の大域構造最適化問題、すなわちポテンシャルエネルギー面(PES)上で低エネルギーの安定した原子配置を探索することを目指している。ポテンシャルエネルギー面は高次元の非凸関数であり、原子位置を対応するポテンシャルエネルギーにマッピングする。この表面を探索して低エネルギー構造を特定することは、計算材料科学、化学、触媒分野における基本的な課題である。

問題の重要性

大域構造最適化は、触媒表面発見から機能材料設計に至るまでの応用の基礎であり、以下の点で重要である:

新規触媒表面の発見
機能材料の設計
安定原子配置の予測
材料特性の理解

既存手法の限界

従来の大域最適化手法には以下の問題がある:

計算コストが高い: ランダム構造探索(RSS)、盆跳び、遺伝的アルゴリズム、シミュレーテッドアニーリングなどの手法は、局所緩和と勾配ベースの最適化器に依存し、大量のエネルギーと力の評価が必要である
局所最適化に限定される: 局所最適解に陥りやすく、複雑なエネルギーランドスケープの探索が制限される
データ依存性: 機械学習原子間ポテンシャルは、関連する最小値を捉えるために慎重に選択された訓練データが必要であり、そうでなければ自己強化的な局所最小値に陥る可能性がある
転移可能性の欠如: 既存手法は関連システム間で学習した知識を再利用することが困難である

研究動機

拡散モデルは分子および材料科学の構造生成において有望性を示しているが、大域最適化タスクへの応用は困難である。なぜなら、目標はPESの大域最小値に対応する稀な低エネルギー配置をサンプリングすることであるが、このような構造のデータ分布は通常未知または入手不可能だからである。

核心的貢献

データフリーの生成最適化手法を提案: 事前データや明示的な緩和なしにポテンシャルエネルギー面の最小値を直接サンプリング
ボルツマン加重損失関数を開発: アニーリング戦略と組み合わせてサンプリングを低エネルギー領域へ導きながら探索性を維持
償却最適化を実現: 関連システム間で事前訓練モデルを転移させることで知識の再利用を実現
優れたサンプル効率を検証: 古典的探索手法と比較してより高いサンプル効率を実現

手法の詳細

タスク定義

入力: 原子系のエネルギー関数E(x)。ここでxは原子配置を表す出力: 低エネルギーの安定した原子配置目標: ボルツマン分布からサンプリング: $\pi_T(x) = \frac{\exp(-E(x)/T)}{Z_T}$

モデルアーキテクチャ

訓練ループ

GO-Diffは自己サンプリングループ操作を採用する:

モデルが逆拡散を通じて原子構造を生成
生成された構造のエネルギーを評価
結果のサンプルを使用してモデルを精緻化

リプレイバッファ $B = \{(x_0^{(i)}, E^{(i)})\}$ を維持し、生成された配置とそのエネルギーを保存する。

ボルツマン加重スコアマッチング

核心的な革新はボルツマン加重スコアマッチング損失である:

$L_{\theta}^{Boltzmann} = E_{t\sim U(0,1)}\left[\lambda(t)E_{x_0\sim q, x_t\sim p_{t|0}(x_t|x_0)} w(E) \|s_\theta(x_t,t) - \nabla_{x_t}\log p_{t|0}(x_t|x_0)\|_2^2\right]$