We present a strategy to accelerate molecular dynamics simulations using foundation neural network models. To do so, we apply a dual-level neural network multi-time-step (MTS) strategy where the target accurate potential is coupled to a simpler but faster model obtained via a distillation process. Thus, the 3.5 Ã -cutoff distilled model is sufficient to capture the fast varying forces, i.e. mainly bonded interactions, from the accurate potential allowing its use in a reversible reference system propagator algorithms (RESPA)-like formalism. The approach conserves accuracy, preserving both static and dynamical properties, while enabling to evaluate the costly model only every 3 to 6 fs depending on the system. Consequently, large simulation speedups over standard 1 fs integration are observed: 4-fold in homogeneous systems and 2.7-fold in large solvated proteins. Such a strategy is applicable to any neural network potential and reduces their performance gap with classical force fields.
academic
Aceleración de Simulaciones de Dinámica Molecular con Modelos de Redes Neuronales Fundacionales utilizando Múltiples Pasos de Tiempo y Destilación
Título: Aceleración de Simulaciones de Dinámica Molecular con Modelos de Redes Neuronales Fundacionales utilizando Múltiples Pasos de Tiempo y Destilación
Autores: Côme Cattin, Thomas Plé, Olivier Adjoua, Nicoläı Gouraud, Louis Lagardère, Jean-Philip Piquemal
Clasificación: physics.chem-ph
Fecha de Publicación: 14 de octubre de 2025 (arXiv v2)
Este artículo propone una estrategia para acelerar simulaciones de dinámica molecular utilizando modelos de redes neuronales fundacionales. El método emplea una estrategia de múltiples pasos de tiempo (MTS) de dos capas, acoplando el potencial de energía exacto con un modelo más simple pero más rápido obtenido mediante un proceso de destilación. El modelo destilado con un radio de corte de 3.5 Å es suficiente para capturar las fuerzas que cambian rápidamente en el potencial exacto (principalmente interacciones de enlace), permitiendo su uso en un esquema similar al algoritmo de propagación en sistemas de referencia reversibles (RESPA). El método mantiene la precisión, preservando propiedades estáticas y dinámicas, mientras que requiere evaluar el modelo costoso solo cada 3 a 6 fs según el sistema. Por lo tanto, se observó una aceleración significativa de la simulación en comparación con la integración estándar de 1 fs: 4 veces en sistemas uniformes y 2.7 veces en proteínas grandes solvatadas.
Aunque los potenciales de redes neuronales (NNPs) pueden proporcionar precisión cercana a la mecánica cuántica, su costo computacional es significativamente mayor que los potenciales empíricos tradicionales, lo que limita su aplicación en sistemas grandes y simulaciones de escalas de tiempo largas. Los principales cuellos de botella son:
Requisitos de integración temporal para movimientos de alta frecuencia: La dinámica molecular debe resolver movimientos de alta frecuencia como vibraciones de enlace utilizando pasos de tiempo pequeños (0.5-1 fs)
Evaluaciones de fuerzas costosas: La intensidad computacional de los modelos de aprendizaje automático resulta en numerosas evaluaciones de fuerzas costosas
Brecha de rendimiento con campos de fuerza clásicos: El costo computacional de los NNPs obstaculiza su adopción generalizada
Los integradores de múltiples pasos de tiempo (MTS) han demostrado ser efectivos en simulaciones moleculares clásicas, pero aún no se han adaptado al campo de potenciales de aprendizaje automático. Esta investigación tiene como objetivo:
Desarrollar el primer esquema MTS basado en RESPA aplicable a potenciales de aprendizaje automático
Implementar un esquema MTS eficiente utilizando múltiples redes neuronales con diferentes complejidades y costos de inferencia
Reducir la brecha de rendimiento entre NNPs y campos de fuerza clásicos
Primera implementación de esquema MTS para potenciales de aprendizaje automático: Se propone el primer esquema de integración de múltiples pasos de tiempo basado en RESPA específicamente para potenciales de aprendizaje automático
Estrategia de destilación de conocimiento: Se desarrollaron dos estrategias de destilación (modelos específicos del sistema y modelos universales) para crear modelos de corto alcance rápidos
Aceleración computacional significativa: Se logró una aceleración de 4 veces (sistemas uniformes) y 2.7 veces (complejos proteína-ligando) manteniendo la precisión
Aplicabilidad generalizada: La estrategia es aplicable a cualquier potencial de red neuronal, con carácter universal
Implementación y validación completas: Se implementó en la biblioteca FeNNol y el paquete Tinker-HP, validado en múltiples sistemas
La tarea de esta investigación es diseñar un esquema de integración de múltiples pasos de tiempo utilizando dos potenciales de redes neuronales de diferente complejidad:
Entrada: Coordenadas y velocidades del sistema molecular
Salida: Trayectoria de dinámica molecular acelerada, manteniendo la misma precisión que el esquema de un solo paso de tiempo
Restricciones: Mantener la precisión de propiedades estáticas y dinámicas
Algoritmo 1: Paso de Integración MTS con División de Fuerzas FENNIX
1: si primer paso entonces
2: Fsmall ← FENNIXsmall(x)
3: F ← FENNIXlarge(x)
4: fin si
5: v ← v + Δt/(2m) · (F - Fsmall)
6: para i = 1 hasta nslow hacer
7: v ← v + Δt/(2m·nslow) · Fsmall
8: x ← x + Δt/(2·nslow) · v
9: v ← thermo(v, Δt/nslow) # Aplicar termostato
10: x ← x + Δt/(2·nslow) · v
11: Fsmall ← FENNIXsmall(x)
12: v ← v + Δt/(2m·nslow) · Fsmall
13: fin para
14: F ← FENNIXlarge(x)
15: v ← v + Δt/(2m) · (F - Fsmall)
Este artículo cita 49 referencias importantes que abarcan trabajos clásicos y recientes en campos clave como potenciales de redes neuronales, métodos de múltiples pasos de tiempo y destilación de conocimiento, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de investigación de alta calidad que introduce exitosamente métodos de múltiples pasos de tiempo al campo de potenciales de aprendizaje automático, proporcionando una solución innovadora y práctica para resolver el problema de eficiencia computacional de los NNPs. Aunque existen algunas limitaciones técnicas, sus contribuciones pioneras y valor práctico significativo lo convierten en un progreso importante en el campo.