We present a strategy to accelerate molecular dynamics simulations using foundation neural network models. To do so, we apply a dual-level neural network multi-time-step (MTS) strategy where the target accurate potential is coupled to a simpler but faster model obtained via a distillation process. Thus, the 3.5 Ã -cutoff distilled model is sufficient to capture the fast varying forces, i.e. mainly bonded interactions, from the accurate potential allowing its use in a reversible reference system propagator algorithms (RESPA)-like formalism. The approach conserves accuracy, preserving both static and dynamical properties, while enabling to evaluate the costly model only every 3 to 6 fs depending on the system. Consequently, large simulation speedups over standard 1 fs integration are observed: 4-fold in homogeneous systems and 2.7-fold in large solvated proteins. Such a strategy is applicable to any neural network potential and reduces their performance gap with classical force fields.
academic
Ускорение молекулярно-динамических симуляций с использованием фундаментальных нейросетевых моделей с многошаговым интегрированием и дистилляцией
В данной работе предложена стратегия ускорения молекулярно-динамических (МД) симуляций с использованием фундаментальных нейросетевых моделей. Метод применяет двухуровневую стратегию многошагового интегрирования (MTS), связывая целевой точный потенциал с более простой, но более быстрой моделью, полученной посредством процесса дистилляции. Дистиллированная модель с радиусом отсечения 3,5 Å достаточна для захвата быстро изменяющихся сил в точном потенциале (в основном ковалентные взаимодействия), что позволяет использовать её в схеме, аналогичной алгоритму распространения в обратимой системе отсчёта (RESPA). Метод сохраняет точность, сохраняя статические и динамические свойства, при этом требуя оценки дорогостоящей модели только один раз каждые 3-6 фс. Таким образом, наблюдается значительное ускорение симуляции по сравнению со стандартным интегрированием с шагом 1 фс: 4-кратное в однородных системах и 2,7-кратное в больших сольватированных белках.
Нейросетевые потенциалы (NNPs), хотя и обеспечивают точность, близкую к квантово-механической, имеют значительно более высокие вычислительные затраты по сравнению с традиционными эмпирическими потенциалами, что ограничивает их применение в больших системах и симуляциях на длительных временных масштабах. Основные узкие места:
Требования к временному интегрированию высокочастотных движений: молекулярная динамика должна использовать малые временные шаги (0,5-1 фс) для разрешения высокочастотных движений, таких как колебания связей
Дорогостоящие вычисления сил: вычислительная интенсивность ML-моделей приводит к большому количеству дорогостоящих оценок сил
Разрыв в производительности с классическими силовыми полями: вычислительные затраты NNPs препятствуют их широкому применению
Интеграторы с несколькими временными шагами (MTS) уже доказали свою эффективность в классических молекулярных симуляциях, но ещё не адаптированы к области ML-потенциалов. Данное исследование направлено на:
Разработку первой RESPA-based MTS-схемы для ML-потенциалов
Реализацию эффективной MTS-схемы с использованием нескольких нейросетей различной сложности и стоимости вывода
Сокращение разрыва в производительности между NNPs и классическими силовыми полями
Первая реализация MTS-схемы для ML-потенциалов: предложена первая RESPA-based схема многошагового интегрирования, специально разработанная для потенциалов машинного обучения
Стратегия дистилляции знаний: разработаны две стратегии дистилляции (модели, специфичные для системы, и универсальные модели) для создания быстрых короткодействующих моделей
Значительное ускорение вычислений: достигнуто ускорение в 4 раза (однородные системы) и 2,7 раза (комплексы белок-лиганд) при сохранении точности
Широкая применимость: стратегия применима к любому нейросетевому потенциалу и имеет универсальный характер
Полная реализация и верификация: реализовано в библиотеке FeNNol и пакете Tinker-HP, верифицировано на множестве систем
Алгоритм 1: Шаг MTS-интегрирования с разделением сил FENNIX
1: если первый шаг то
2: Fsmall ← FENNIXsmall(x)
3: F ← FENNIXlarge(x)
4: конец если
5: v ← v + Δt/(2m) · (F - Fsmall)
6: для i = 1 до nslow выполнить
7: v ← v + Δt/(2m·nslow) · Fsmall
8: x ← x + Δt/(2·nslow) · v
9: v ← thermo(v, Δt/nslow) # Применить термостат
10: x ← x + Δt/(2·nslow) · v
11: Fsmall ← FENNIXsmall(x)
12: v ← v + Δt/(2m·nslow) · Fsmall
13: конец для
14: F ← FENNIXlarge(x)
15: v ← v + Δt/(2m) · (F - Fsmall)
Данная работа цитирует 49 важных источников, охватывающих классические и новейшие работы в ключевых областях нейросетевых потенциалов, методов многошагового интегрирования и дистилляции знаний, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это высококачественная исследовательская работа, успешно внедрившая методы многошагового интегрирования в область потенциалов машинного обучения, предоставляющая инновационное и практичное решение для решения проблемы вычислительной эффективности NNPs. Несмотря на некоторые технические ограничения, её новаторский вклад и значительная практическая ценность делают её важным прогрессом в данной области.