2025-11-14T19:19:11.421355

GO-Diff: Data-free and amortized global structure optimization

Rønne, Vegge, Bhowmik
We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
academic

GO-Diff: Data-free and amortized global structure optimization

基本信息

  • 论文ID: 2510.13448
  • 标题: GO-Diff: Data-free and amortized global structure optimization
  • 作者: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (Technical University of Denmark)
  • 分类: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
  • 发表时间: 2025年10月15日 (Preprint)
  • 论文链接: https://arxiv.org/abs/2510.13448

摘要

本文介绍了GO-Diff,这是一种基于扩散模型的全局结构优化方法,能够直接采样低能原子构型而无需先验数据或显式弛豫。GO-Diff使用玻尔兹曼加权的分数匹配损失从头训练,仅利用已知的能量函数引导生成过程朝向热力学有利区域。该方法采用自采样和模型精化的两阶段循环,逐步提高其目标低能结构的能力。与传统优化流程相比,GO-Diff用显著更少的能量评估实现了竞争性结果。此外,通过在相关系统间重用预训练模型,GO-Diff支持摊销优化——能够在新任务上更快收敛而无需从头重新训练。

研究背景与动机

要解决的问题

本研究旨在解决原子系统的全局结构优化问题,即在势能面(PES)上寻找低能量的稳定原子构型。势能面是一个高维、非凸函数,将原子位置映射到相应的势能,探索这个表面以识别低能结构是计算材料科学、化学和催化领域的基本挑战。

问题的重要性

全局结构优化是从催化表面发现到功能材料设计等应用的基础,对于:

  1. 新催化表面的发现
  2. 功能材料的设计
  3. 稳定原子构型的预测
  4. 材料性质的理解

现有方法的局限性

传统的全局优化方法存在以下问题:

  1. 计算成本高:随机结构搜索(RSS)、盆跳跃、遗传算法、模拟退火等方法依赖局部弛豫和基于梯度的优化器,需要大量能量和力的评估
  2. 局限于局部优化:容易陷入局部最优解,限制了对复杂能量景观的探索
  3. 数据依赖性:机器学习原子间势需要精心选择的训练数据来捕获相关最小值,否则可能陷入自强化的局部最小值
  4. 缺乏可转移性:现有方法难以在相关系统间重用已学习的知识

研究动机

扩散模型在分子和材料科学的结构生成中显示出前景,但将其应用于全局优化任务具有挑战性,因为目标是采样对应于PES全局最小值的稀有低能构型,但这种结构的数据分布通常是未知或不可获得的。

核心贡献

  1. 提出了无数据的生成优化方法:直接采样势能面的最小值,无需先验数据或显式弛豫
  2. 开发了玻尔兹曼加权损失函数:结合退火策略引导采样朝向低能区域同时保持探索性
  3. 实现了摊销优化:通过在相关系统间转移预训练模型实现知识重用
  4. 验证了优越的样本效率:相比经典搜索方法具有更高的样本效率

方法详解

任务定义

输入:原子系统的能量函数E(x),其中x表示原子构型 输出:低能量的稳定原子构型 目标:从玻尔兹曼分布中采样:πT(x)=exp(E(x)/T)ZT\pi_T(x) = \frac{\exp(-E(x)/T)}{Z_T}

模型架构

训练循环

GO-Diff采用自采样循环操作:

  1. 模型通过反向扩散生成原子结构
  2. 评估生成结构的能量
  3. 使用结果样本来精化模型

维护一个重放缓冲区 B={(x0(i),E(i))}B = \{(x_0^{(i)}, E^{(i)})\} 存储生成的构型及其能量。

玻尔兹曼加权分数匹配

核心创新是玻尔兹曼加权的分数匹配损失:

LθBoltzmann=EtU(0,1)[λ(t)Ex0q,xtpt0(xtx0)w(E)sθ(xt,t)xtlogpt0(xtx0)22]L_{\theta}^{Boltzmann} = E_{t\sim U(0,1)}\left[\lambda(t)E_{x_0\sim q, x_t\sim p_{t|0}(x_t|x_0)} w(E) \|s_\theta(x_t,t) - \nabla_{x_t}\log p_{t|0}(x_t|x_0)\|_2^2\right]

其中玻尔兹曼权重为: w(E)=exp(E/T)E(i)Bexp(E(i)/T)w(E) = \frac{\exp(-E/T)}{\sum_{E^{(i)}\in B} \exp(-E^{(i)}/T)}

这种设计通过重要性采样避免了直接从真实玻尔兹曼分布采样的需求。

退火策略

温度T从高初始值退火到低最终值,平衡探索和开发:

  • 早期:高温鼓励广泛探索
  • 后期:低温收敛到深层最小值

力场引导(FFG)

利用通常与能量一起可获得的原子力:

  1. 在分数网络的共享表示主干上附加力预测头
  2. 在预测-校正采样方案中使用预测力: Δx=α(1t)ζFθ(x)\Delta x = \alpha(1-t)\zeta F_\theta(x)
  3. 随着扩散时间t→0,校正项发挥更大的引导作用

技术创新点

  1. 直接玻尔兹曼加权:避免了力评估和蒙特卡罗估计,使用直接的玻尔兹曼加权分数匹配损失
  2. 自监督学习:从自己的生成中学习,无需外部数据
  3. 模型转移:展示了在相关系统间转移预训练模型的能力
  4. 物理引导:结合力场信息加速收敛

实验设置

数据集

使用MACE-MP0通用势能进行两个原子优化任务:

  1. Pt台阶表面上的Pt加原子优化:3D系统,可通过沿表面法向投影可视化为2D
  2. 6×6 Pt(111)表面上的Pt七聚体发现:更复杂的系统,用于基准测试和摊销优化验证

评价指标

  • 发现目标结构的成功率
  • 找到目标结构所需的平均能量评估次数
  • 随时间变化的最佳能量

对比方法

  • 随机结构搜索(RSS):使用AGOX软件包实现的传统方法
  • GO-Diff变体:不使用FFG、使用FFG、使用模型转移

实现细节

通用超参数

  • 扩散采样步数:500
  • 噪声调度:线性(VE-SDE)
  • 分数模型架构:PaiNN GNN(4个块),6Å截断
  • 最终温度:0.02
  • 学习率:10^-4
  • 优化器:AdamW

具体任务参数

  • Pt加原子:缓冲区大小16,每次迭代32个样本,10次迭代指数退火
  • Pt七聚体:缓冲区大小64,每次迭代128个样本,20次迭代指数退火

实验结果

主要结果

Pt加原子优化

  • 成功展示了采样逐渐集中在低能盆地
  • 验证了玻尔兹曼加权损失和退火调度的有效性

Pt七聚体发现

方法评估次数成功率平均成功迭代
RSS10,0001/87,816
GO-Diff2,5605/81,667
GO-Diff + FFG2,5608/81,994
GO-Diff + Transfer1,2807/8591

关键发现

  1. 样本效率:GO-Diff用显著更少的能量评估实现了更好的成功率
  2. 力场引导效果:FFG提高了成功率(从5/8到8/8)和性能
  3. 转移学习优势:模型转移将所需评估次数减少了2倍以上(从1,667到591)
  4. 鲁棒性:扩散过程的随机性使GO-Diff能够鲁棒地逃脱局部最小值

摊销优化分析

转移学习的加速是预期的,因为转移的模型已经捕获了键合偏好(如台阶边缘下方空心位点的稳定性),优化任务减少为调整原子间几何结构,而不是从头学习键合。

相关工作

传统全局优化方法

  • 随机结构搜索、盆跳跃、遗传算法、模拟退火
  • 机器学习原子间势能(预训练或在线学习)

扩散模型应用

  • 分子和材料科学中的结构生成
  • 黑盒优化的扩散模型(DDOM)
  • 玻尔兹曼采样器(iDEM、BNEM、Adjoint Sampling)

本文相比相关工作的优势

  • 避免了蒙特卡罗估计和力标签
  • 更简单和样本高效的训练循环
  • 首次展示了跨系统的转移学习能力

结论与讨论

主要结论

  1. GO-Diff是一个有效的无数据全局结构优化框架
  2. 玻尔兹曼加权分数匹配损失能够有效引导低能构型生成
  3. 摊销优化通过模型转移显著提高效率
  4. 在样本效率和成功率方面优于传统方法

局限性

  1. 超参数敏感性:样本数量、温度曲线和训练步数是关键超参数,需要仔细调优
  2. 可扩展性限制:目前的原子扩散模型主要在<20个原子的系统上得到验证
  3. 系统规模:需要进一步研究使GO-Diff适用于非常大的现实尺寸系统

未来方向

  1. 扩展到多目标或组分设计优化
  2. 动态温度调整和自适应采样
  3. 提高对大型系统的可扩展性
  4. 代理加速和多目标优化

深度评价

优点

  1. 方法创新性:首次将扩散模型成功应用于无数据的全局结构优化
  2. 技术先进性:玻尔兹曼加权分数匹配损失设计巧妙,避免了现有方法的复杂性
  3. 实用价值:摊销优化展示了实际应用中的显著优势
  4. 实验充分:在不同复杂度的系统上进行了全面测试
  5. 理论基础:基于重要性采样的理论推导严谨

不足

  1. 系统规模限制:仅在相对小的原子系统(≤20原子)上验证
  2. 超参数调优:方法对多个超参数敏感,可能限制其通用性
  3. 基准测试有限:仅与RSS进行比较,缺乏与其他现代方法的对比
  4. 理论分析不足:缺乏收敛性和样本复杂度的理论保证

影响力

  1. 学术贡献:为全局优化领域引入了新的生成建模范式
  2. 实用价值:在材料发现和催化剂设计中有潜在应用
  3. 可复现性:提供了完整的代码和实现细节
  4. 启发意义:为扩散模型在优化问题中的应用开辟了新方向

适用场景

  1. 材料发现:新催化剂和功能材料的结构预测
  2. 表面科学:吸附位点和表面重构的研究
  3. 小分子优化:分子构象搜索和药物设计
  4. 已有相关系统:特别适合需要在相似系统间进行多次优化的场景

参考文献

本文引用了38篇相关文献,涵盖了全局优化、扩散模型、机器学习势能等关键领域的重要工作,为方法的发展提供了坚实的理论基础。