We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
- ID статьи: 2510.13448
- Название: GO-Diff: Data-free and amortized global structure optimization
- Авторы: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (Технический университет Дании)
- Классификация: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
- Дата публикации: 15 октября 2025 г. (Препринт)
- Ссылка на статью: https://arxiv.org/abs/2510.13448
В данной работе представлен GO-Diff — метод глобальной оптимизации структуры на основе диффузионных моделей, способный напрямую выбирать низкоэнергетические атомные конфигурации без предварительных данных или явной релаксации. GO-Diff обучается с нуля, используя взвешенную по Больцману функцию потерь сопоставления оценок, руководствуясь только известной функцией энергии для направления процесса генерации в термодинамически благоприятные области. Метод использует двухэтапный циклический процесс с самовыборкой и уточнением модели для постепенного повышения способности находить целевые низкоэнергетические структуры. По сравнению с традиционными процедурами оптимизации GO-Diff достигает конкурентных результатов со значительно меньшим количеством оценок энергии. Кроме того, путём переиспользования предварительно обученной модели между связанными системами GO-Diff поддерживает амортизированную оптимизацию — способность быстрее сходиться на новых задачах без переобучения с нуля.
Данное исследование направлено на решение проблемы глобальной оптимизации структуры атомных систем, то есть поиск низкоэнергетических стабильных атомных конфигураций на поверхности потенциальной энергии (ППЭ). Поверхность потенциальной энергии представляет собой высокомерную невыпуклую функцию, отображающую положения атомов на соответствующую потенциальную энергию. Исследование этой поверхности для выявления низкоэнергетических структур является фундаментальной задачей в вычислительной материаловедении, химии и катализе.
Глобальная оптимизация структуры является основой для приложений, начиная от открытия каталитических поверхностей и заканчивая проектированием функциональных материалов:
- Открытие новых каталитических поверхностей
- Проектирование функциональных материалов
- Предсказание стабильных атомных конфигураций
- Понимание свойств материалов
Традиционные методы глобальной оптимизации имеют следующие недостатки:
- Высокая вычислительная стоимость: методы случайного поиска структур (RSS), прыжки между бассейнами, генетические алгоритмы, имитация отжига и другие методы зависят от локальной релаксации и оптимизаторов на основе градиентов, требующих большого количества оценок энергии и сил
- Ограничение локальной оптимизацией: легко застревают в локальных оптимумах, что ограничивает исследование сложного энергетического ландшафта
- Зависимость от данных: машинные межатомные потенциалы требуют тщательно отобранных обучающих данных для захвата релевантных минимумов, иначе могут застрять в самоусиливающихся локальных минимумах
- Отсутствие переносимости: существующие методы с трудом переиспользуют полученные знания между связанными системами
Диффузионные модели показали перспективность в генерации структур молекул и материалов, однако их применение к задачам глобальной оптимизации является сложным, поскольку целью является выборка редких низкоэнергетических конфигураций, соответствующих глобальному минимуму ППЭ, но распределение данных таких структур обычно неизвестно или недоступно.
- Предложен метод генеративной оптимизации без данных: прямой выбор минимумов поверхности потенциальной энергии без предварительных данных или явной релаксации
- Разработана функция потерь с взвешиванием по Больцману: объединяет стратегию отжига для направления выборки в низкоэнергетические области при сохранении исследовательского характера
- Реализована амортизированная оптимизация: переиспользование знаний путём передачи предварительно обученной модели между связанными системами
- Подтверждена превосходная эффективность выборки: более высокая эффективность выборки по сравнению с классическими методами поиска
Входные данные: функция энергии E(x) атомной системы, где x обозначает атомную конфигурацию
Выходные данные: низкоэнергетические стабильные атомные конфигурации
Цель: выборка из распределения Больцмана: πT(x)=ZTexp(−E(x)/T)
GO-Diff использует циклический процесс с самовыборкой:
- Модель генерирует атомные структуры посредством обратной диффузии
- Оценивается энергия сгенерированных структур
- Полученные образцы используются для уточнения модели
Поддерживается буфер воспроизведения B={(x0(i),E(i))} для хранения сгенерированных конфигураций и их энергий.
Ключевое инновационное решение — функция потерь сопоставления оценок с взвешиванием по Больцману:
LθBoltzmann=Et∼U(0,1)[λ(t)Ex0∼q,xt∼pt∣0(xt∣x0)w(E)∥sθ(xt,t)−∇xtlogpt∣0(xt∣x0)∥22]
где вес Больцмана определяется как:
w(E)=∑E(i)∈Bexp(−E(i)/T)exp(−E/T)
Такая конструкция избегает необходимости прямой выборки из истинного распределения Больцмана посредством выборки по важности.
Температура T отжигается от высокого начального значения к низкому конечному значению, балансируя исследование и использование:
- На ранних этапах: высокая температура способствует широкому исследованию
- На поздних этапах: низкая температура сходится к глубоким минимумам
Использует атомные силы, которые обычно доступны вместе с энергией:
- Присоединяет головку предсказания силы к общему представлению основного ствола сетевой архитектуры оценок
- Использует предсказанные силы в схеме предсказания-коррекции выборки:
Δx=α(1−t)ζFθ(x)
- По мере приближения времени диффузии t→0 член коррекции оказывает большее направляющее воздействие
- Прямое взвешивание по Больцману: избегает оценок сил и оценок Монте-Карло, используя прямую функцию потерь сопоставления оценок с взвешиванием по Больцману
- Самообучение: обучение на собственных генерациях без внешних данных
- Передача модели: демонстрирует способность передачи предварительно обученной модели между связанными системами
- Физическое направление: интеграция информации о силовом поле для ускорения сходимости
Используется универсальный потенциал MACE-MP0 для двух задач оптимизации атомов:
- Оптимизация адатома Pt на ступени Pt: 3D система, визуализируемая как 2D путём проецирования вдоль нормали к поверхности
- Обнаружение гептамера Pt на поверхности Pt(111) 6×6: более сложная система для тестирования и проверки амортизированной оптимизации
- Вероятность успеха обнаружения целевой структуры
- Среднее количество оценок энергии, необходимых для обнаружения целевой структуры
- Лучшая энергия в зависимости от времени
- Случайный поиск структур (RSS): традиционный метод, реализованный с использованием пакета AGOX
- Варианты GO-Diff: без FFG, с FFG, с передачей модели
Универсальные гиперпараметры:
- Количество шагов выборки диффузии: 500
- График шума: линейный (VE-SDE)
- Архитектура модели оценок: PaiNN GNN (4 блока), радиус отсечки 6Å
- Финальная температура: 0,02
- Скорость обучения: 10^-4
- Оптимизатор: AdamW
Параметры конкретных задач:
- Адатом Pt: размер буфера 16, 32 образца за итерацию, 10 итераций с экспоненциальным отжигом
- Гептамер Pt: размер буфера 64, 128 образцов за итерацию, 20 итераций с экспоненциальным отжигом
- Успешно продемонстрирована постепенная концентрация выборки в низкоэнергетических бассейнах
- Подтверждена эффективность функции потерь с взвешиванием по Больцману и графика отжига
| Метод | Количество оценок | Вероятность успеха | Средняя успешная итерация |
|---|
| RSS | 10 000 | 1/8 | 7 816 |
| GO-Diff | 2 560 | 5/8 | 1 667 |
| GO-Diff + FFG | 2 560 | 8/8 | 1 994 |
| GO-Diff + Transfer | 1 280 | 7/8 | 591 |
- Эффективность выборки: GO-Diff достигает лучшей вероятности успеха со значительно меньшим количеством оценок энергии
- Эффект направления силовым полем: FFG повышает вероятность успеха (с 5/8 до 8/8) и производительность
- Преимущества трансферного обучения: передача модели сокращает требуемое количество оценок более чем в 2 раза (с 1 667 до 591)
- Робастность: стохастичность процесса диффузии позволяет GO-Diff робастно выходить из локальных минимумов
Ускорение при трансферном обучении ожидаемо, поскольку передаваемая модель уже захватила предпочтения связей (например, стабильность полых позиций под краем ступени), и задача оптимизации сводится к настройке межатомной геометрии, а не к обучению с нуля.
- Случайный поиск структур, прыжки между бассейнами, генетические алгоритмы, имитация отжига
- Машинные межатомные потенциалы (предварительно обученные или обучаемые в режиме реального времени)
- Генерация структур молекул и материалов
- Диффузионные модели для чёрного ящика оптимизации (DDOM)
- Пробоотборщики Больцмана (iDEM, BNEM, Adjoint Sampling)
- Избегает оценок Монте-Карло и меток сил
- Более простой и эффективный по выборке цикл обучения
- Впервые демонстрирует способность трансферного обучения между системами
- GO-Diff является эффективной структурой глобальной оптимизации структуры без данных
- Функция потерь сопоставления оценок с взвешиванием по Больцману эффективно направляет генерацию низкоэнергетических конфигураций
- Амортизированная оптимизация посредством передачи модели значительно повышает эффективность
- Превосходит традиционные методы по эффективности выборки и вероятности успеха
- Чувствительность к гиперпараметрам: количество образцов, кривая температуры и количество шагов обучения являются критическими гиперпараметрами, требующими тщательной настройки
- Ограничения масштабируемости: текущие модели атомной диффузии в основном проверены на системах с <20 атомами
- Размер системы: требуется дальнейшее исследование для адаптации GO-Diff к системам реального размера
- Расширение на многоцелевую оптимизацию или оптимизацию композиции
- Динамическая регулировка температуры и адаптивная выборка
- Повышение масштабируемости для больших систем
- Ускорение суррогатом и многоцелевая оптимизация
- Методологическая инновативность: первое успешное применение диффузионных моделей к глобальной оптимизации структуры без данных
- Технологическая продвинутость: конструкция функции потерь сопоставления оценок с взвешиванием по Больцману изящна и избегает сложности существующих методов
- Практическая ценность: амортизированная оптимизация демонстрирует значительные преимущества в практических приложениях
- Полнота экспериментов: комплексное тестирование на системах различной сложности
- Теоретическая основа: строгие теоретические выводы, основанные на выборке по важности
- Ограничение размера системы: проверено только на относительно малых атомных системах (≤20 атомов)
- Настройка гиперпараметров: метод чувствителен к нескольким гиперпараметрам, что может ограничить его универсальность
- Ограниченные тесты: сравнение только с RSS, отсутствие сравнения с другими современными методами
- Недостаточный теоретический анализ: отсутствуют теоретические гарантии сходимости и сложности выборки
- Академический вклад: вводит новую парадигму генеративного моделирования в область глобальной оптимизации
- Практическая ценность: потенциальные приложения в открытии материалов и проектировании катализаторов
- Воспроизводимость: предоставляет полный код и детали реализации
- Вдохновляющее значение: открывает новые направления применения диффузионных моделей к задачам оптимизации
- Открытие материалов: предсказание структуры новых катализаторов и функциональных материалов
- Поверхностная наука: исследование адсорбционных позиций и поверхностной реконструкции
- Оптимизация малых молекул: поиск конформаций молекул и проектирование лекарств
- Системы с существующими аналогами: особенно подходит для сценариев, требующих многократной оптимизации на похожих системах
Данная работа ссылается на 38 релевантных источников, охватывающих ключевые области глобальной оптимизации, диффузионных моделей и машинных потенциалов, обеспечивая прочную теоретическую основу для развития метода.