2025-11-13T10:34:10.524110

Accelerating Molecular Dynamics Simulations with Foundation Neural Network Models using Multiple Time-Step and Distillation

Cattin, PlÃ©, Adjoua et al.

We present a strategy to accelerate molecular dynamics simulations using foundation neural network models. To do so, we apply a dual-level neural network multi-time-step (MTS) strategy where the target accurate potential is coupled to a simpler but faster model obtained via a distillation process. Thus, the 3.5 Ã-cutoff distilled model is sufficient to capture the fast varying forces, i.e. mainly bonded interactions, from the accurate potential allowing its use in a reversible reference system propagator algorithms (RESPA)-like formalism. The approach conserves accuracy, preserving both static and dynamical properties, while enabling to evaluate the costly model only every 3 to 6 fs depending on the system. Consequently, large simulation speedups over standard 1 fs integration are observed: 4-fold in homogeneous systems and 2.7-fold in large solvated proteins. Such a strategy is applicable to any neural network potential and reduces their performance gap with classical force fields.

academic

Ускорение молекулярно-динамических симуляций с использованием фундаментальных нейросетевых моделей с многошаговым интегрированием и дистилляцией

Основная информация

ID статьи: 2510.06562
Название: Accelerating Molecular Dynamics Simulations with Foundation Neural Network Models using Multiple Time-Step and Distillation
Авторы: Côme Cattin, Thomas Plé, Olivier Adjoua, Nicoläı Gouraud, Louis Lagardère, Jean-Philip Piquemal
Категория: physics.chem-ph
Дата публикации: 14 октября 2025 г. (arXiv v2)
Ссылка на статью: https://arxiv.org/abs/2510.06562

Аннотация

В данной работе предложена стратегия ускорения молекулярно-динамических (МД) симуляций с использованием фундаментальных нейросетевых моделей. Метод применяет двухуровневую стратегию многошагового интегрирования (MTS), связывая целевой точный потенциал с более простой, но более быстрой моделью, полученной посредством процесса дистилляции. Дистиллированная модель с радиусом отсечения 3,5 Å достаточна для захвата быстро изменяющихся сил в точном потенциале (в основном ковалентные взаимодействия), что позволяет использовать её в схеме, аналогичной алгоритму распространения в обратимой системе отсчёта (RESPA). Метод сохраняет точность, сохраняя статические и динамические свойства, при этом требуя оценки дорогостоящей модели только один раз каждые 3-6 фс. Таким образом, наблюдается значительное ускорение симуляции по сравнению со стандартным интегрированием с шагом 1 фс: 4-кратное в однородных системах и 2,7-кратное в больших сольватированных белках.

Научный контекст и мотивация

Определение проблемы

Нейросетевые потенциалы (NNPs), хотя и обеспечивают точность, близкую к квантово-механической, имеют значительно более высокие вычислительные затраты по сравнению с традиционными эмпирическими потенциалами, что ограничивает их применение в больших системах и симуляциях на длительных временных масштабах. Основные узкие места:

Требования к временному интегрированию высокочастотных движений: молекулярная динамика должна использовать малые временные шаги (0,5-1 фс) для разрешения высокочастотных движений, таких как колебания связей
Дорогостоящие вычисления сил: вычислительная интенсивность ML-моделей приводит к большому количеству дорогостоящих оценок сил
Разрыв в производительности с классическими силовыми полями: вычислительные затраты NNPs препятствуют их широкому применению

Научная мотивация

Интеграторы с несколькими временными шагами (MTS) уже доказали свою эффективность в классических молекулярных симуляциях, но ещё не адаптированы к области ML-потенциалов. Данное исследование направлено на:

Разработку первой RESPA-based MTS-схемы для ML-потенциалов
Реализацию эффективной MTS-схемы с использованием нескольких нейросетей различной сложности и стоимости вывода
Сокращение разрыва в производительности между NNPs и классическими силовыми полями

Основные вклады

Первая реализация MTS-схемы для ML-потенциалов: предложена первая RESPA-based схема многошагового интегрирования, специально разработанная для потенциалов машинного обучения
Стратегия дистилляции знаний: разработаны две стратегии дистилляции (модели, специфичные для системы, и универсальные модели) для создания быстрых короткодействующих моделей
Значительное ускорение вычислений: достигнуто ускорение в 4 раза (однородные системы) и 2,7 раза (комплексы белок-лиганд) при сохранении точности
Широкая применимость: стратегия применима к любому нейросетевому потенциалу и имеет универсальный характер
Полная реализация и верификация: реализовано в библиотеке FeNNol и пакете Tinker-HP, верифицировано на множестве систем

Подробное описание методики

Определение задачи

Задача исследования состоит в разработке схемы многошагового интегрирования, использующей два нейросетевых потенциала различной сложности:

Входные данные: координаты и скорости молекулярной системы
Выходные данные: ускоренная МД-траектория с сохранением точности одношаговой схемы
Ограничения: сохранение точности статических и динамических свойств

Архитектура модели

Двухуровневая архитектура нейросети

Эталонная модель: FeNNix-Bio1(M) - на основе архитектуры Transformer с разделением по диапазону и эквивариантностью
- Поле восприятия: 11 Å (два прохода передачи сообщений)
- Включает головы локального и дальнодействующего внимания
- Высокая точность, но вычислительно дорогостоящая
Быстрая модель: дистиллированная лёгкая модель
- Поле восприятия: 3,5 Å (один проход передачи сообщений)
- Удалены головы дальнодействующего внимания
- Сосредоточена на быстро изменяющихся "ковалентных" силах
- Ускорение вывода примерно в 10 раз

Схема интегрирования BAOAB-RESPA

Алгоритм работает следующим образом:

Алгоритм 1: Шаг MTS-интегрирования с разделением сил FENNIX
1: если первый шаг то
2:   Fsmall ← FENNIXsmall(x)
3:   F ← FENNIXlarge(x)
4: конец если
5: v ← v + Δt/(2m) · (F - Fsmall)
6: для i = 1 до nslow выполнить
7:   v ← v + Δt/(2m·nslow) · Fsmall
8:   x ← x + Δt/(2·nslow) · v
9:   v ← thermo(v, Δt/nslow)  # Применить термостат
10:  x ← x + Δt/(2·nslow) · v
11:  Fsmall ← FENNIXsmall(x)
12:  v ← v + Δt/(2m·nslow) · Fsmall
13: конец для
14: F ← FENNIXlarge(x)
15: v ← v + Δt/(2m) · (F - Fsmall)

Технические инновации

Стратегия дистилляции знаний

Модели, специфичные для системы:
- Генерация эталонного набора данных посредством коротких МД-симуляций
- Использование фрагментированной стратегии для снижения вычислительной нагрузки на больших системах
- Обучение на данных, размеченных эталонной моделью
Универсальные модели:
- Обучение на подмножестве набора данных SPICE2
- Возможность повторного использования между системами
- Могут служить начальной точкой для дальнейшей тонкой настройки

Механизм разделения сил

Использование быстрой модели для захвата высокочастотных ковалентных взаимодействий
Эталонная модель обеспечивает периодические коррекции
Эффективное обновление через разность сил (F - Fsmall)

Экспериментальная установка

Тестируемые системы

Объёмная вода: ящик воды из 648 атомов для тестирования стабильности
Сольватированные малые молекулы: этанол, бензол, триметиламин, диэтилсульфид, уксусная кислота
Комплексы белок-лиганд: комплекс лизоцима с фенолом (PDB ID: 4I7L)

Критерии оценки

Динамические свойства: коэффициент диффузии, спектр скоростной автокорреляции
Термодинамические свойства: радиальная функция распределения, температура, потенциальная энергия
Свободная энергия: энергия гидратации (HFE)
Структурные свойства: RMSD главной цепи белка, режим связывания лиганда

Детали реализации

Внутренний временной шаг: 1 фс (стандартный) или 1,75 фс (системы с белками)
Внешний временной шаг: 2-6 фс в зависимости от системы и использования переназначения массы водорода (HMR)
Термостат: интегратор BAOAB Langevin
Отсечение сил: 150 ккал/моль/Å (для повышения стабильности)

Результаты экспериментов

Основные результаты

Система объёмной воды

Стабильность: стабильна при внешних временных шагах 2-3 фс, HMR позволяет расширить до 5-6 фс
Динамические свойства: коэффициент диффузии сохраняется в диапазоне 2,1-2,6×10⁻⁵ см²/с (по сравнению с 2,2×10⁻⁵ см²/с для одношагового интегрирования)
Структурные свойства: радиальная функция распределения согласуется с результатами одношагового интегрирования в пределах статистической ошибки
Коэффициент ускорения: 4-кратное ускорение

Сольватированные малые молекулы

Результаты расчёта энергии гидратации:

Модели, специфичные для системы: MAE = 0,091 ккал/моль, RMSE = 0,124 ккал/моль, R² = 0,996
Универсальные модели: MAE = 0,103 ккал/моль, RMSE = 0,138 ккал/моль, R² = 0,995

Комплексы белок-лиганд

Стабильность: стабильная 20 нс симуляция при внешнем временном шаге 3,5 фс
Сохранение структуры: RMSD главной цепи белка < 2 Å, режим связывания лиганда стабилен
Коэффициент ускорения: 2,7-кратное ускорение
Производительность: примерно 7 нс/день на одном GPU A100

Абляционные исследования

Зависимость от временного шага

Анализ спектра скоростной автокорреляции выявил:

Артефакты MTS-интегрирования связаны с обертонами O-H-растяжения
HMR снижает частоту с 7500 см⁻¹ до 4000 см⁻¹, позволяя использовать большие временные шаги

Сравнение моделей

Модели, специфичные для системы, более стабильны, чем универсальные модели
Универсальные модели в некоторых системах (например, бензол) требуют уменьшения временного шага до 3 фс

Анализ стабильности

Анализ распределения разности сил показывает:

Большинство разностей сил близки к 0 ккал/моль/Å
Длинный хвост распределения начинается с 150 ккал/моль/Å, соответствуя "дырам" на поверхности потенциальной энергии
Стратегия отсечения сил эффективно повышает стабильность

Связанные работы

Методы многошагового интегрирования

Классическое MTS: успешное применение алгоритма RESPA в классических силовых полях
Физическое разделение: традиционные методы основаны на естественном разделении физических взаимодействий
Вызовы ML-потенциалов: отсутствие естественного разделения сил требует новых стратегий

Нейросетевые потенциалы

История развития: от Behler-Parrinello к современным фундаментальным моделям
Вычислительные вызовы: повышение точности сопровождается увеличением вычислительных затрат
Стратегии ускорения: данная работа впервые применяет MTS к NNPs

Заключение и обсуждение

Основные выводы

Успешно реализована первая MTS-схема для ML-потенциалов
Достигнуто значительное ускорение (4-кратное и 2,7-кратное) при сохранении точности
Метод универсален и применим к любому нейросетевому потенциалу
Открыт новый путь для высокоточных МД-симуляций больших систем на длительных временных масштабах

Ограничения

Ограничения временного шага: ограничены резонансными эффектами, максимальный внешний временной шаг примерно 6 фс
Дыры на поверхности потенциальной энергии: несовершенство дистиллированной модели приводит к редким нестабильностям
Зависимость от системы: сложные системы требуют более консервативных настроек временного шага
Оптимизация кода: эффективность двухуровневого метода может быть улучшена

Направления будущих исследований

Случайные временные шаги: исследование случайных вариантов RESPA, таких как интегратор JUMP
Активное обучение: использование стратегий активного обучения на основе фрагментов для улучшения малой модели
Большие временные шаги: достижение больших временных шагов путём заполнения дыр на поверхности потенциальной энергии
Оптимизация кода: дальнейшая оптимизация вычислительной эффективности двухуровневого метода

Глубокая оценка

Преимущества

Высокая инновационность: впервые успешно применены методы MTS к области ML-потенциалов
Высокая практическая ценность: значительное ускорение делает возможными высокоточные долгосрочные симуляции
Полнота метода: предоставлена полная реализация и верификация на множестве систем
Прочная теоретическая база: основано на зрелой теории RESPA в сочетании с дистилляцией знаний
Хорошая универсальность: применимо к любому нейросетевому потенциалу

Недостатки

Проблемы стабильности: в сложных системах сохраняются редкие нестабильности
Ограничения временного шага: доступные временные шаги всё ещё меньше, чем в классических силовых полях
Затраты на обучение модели: модели, специфичные для системы, требуют дополнительного времени на обучение
Недостаточный теоретический анализ: отсутствует строгий анализ сходимости метода и распространения ошибок

Влияние

Академическая ценность: предоставляет важный технологический путь для практического применения ML-потенциалов
Перспективы применения: в сочетании с методами выборки позволяет реализовать истинно крупномасштабные симуляции
Инженерное значение: сокращает разрыв в производительности между NNPs и классическими силовыми полями
Воспроизводимость: предоставлена полная реализация с открытым исходным кодом

Области применения

Дизайн лекарств: долгосрочные симуляции взаимодействий белок-лиганд
Материаловедение: точное предсказание свойств материалов в большом масштабе
Биохимия: исследование сложных биологических процессов, таких как катализ ферментов
Химические реакции: исследование динамики, требующей квантово-механической точности

Библиография

Данная работа цитирует 49 важных источников, охватывающих классические и новейшие работы в ключевых областях нейросетевых потенциалов, методов многошагового интегрирования и дистилляции знаний, обеспечивая прочную теоретическую базу для исследования.

Общая оценка: Это высококачественная исследовательская работа, успешно внедрившая методы многошагового интегрирования в область потенциалов машинного обучения, предоставляющая инновационное и практичное решение для решения проблемы вычислительной эффективности NNPs. Несмотря на некоторые технические ограничения, её новаторский вклад и значительная практическая ценность делают её важным прогрессом в данной области.