We present a strategy to accelerate molecular dynamics simulations using foundation neural network models. To do so, we apply a dual-level neural network multi-time-step (MTS) strategy where the target accurate potential is coupled to a simpler but faster model obtained via a distillation process. Thus, the 3.5 Ã -cutoff distilled model is sufficient to capture the fast varying forces, i.e. mainly bonded interactions, from the accurate potential allowing its use in a reversible reference system propagator algorithms (RESPA)-like formalism. The approach conserves accuracy, preserving both static and dynamical properties, while enabling to evaluate the costly model only every 3 to 6 fs depending on the system. Consequently, large simulation speedups over standard 1 fs integration are observed: 4-fold in homogeneous systems and 2.7-fold in large solvated proteins. Such a strategy is applicable to any neural network potential and reduces their performance gap with classical force fields.
academic
Accélération des Simulations de Dynamique Moléculaire avec des Modèles de Réseaux de Neurones Fondamentaux utilisant des Pas de Temps Multiples et la Distillation
Cet article propose une stratégie d'accélération des simulations de dynamique moléculaire utilisant des modèles de réseaux de neurones fondamentaux. La méthode emploie une stratégie à pas de temps multiples (MTS) à deux niveaux de réseaux de neurones, couplant le potentiel énergétique cible précis avec un modèle plus simple mais plus rapide obtenu par distillation. Le modèle distillé avec une coupure de 3,5 Å est suffisant pour capturer les forces variant rapidement dans le potentiel précis (principalement les interactions de liaison), permettant son utilisation dans un schéma similaire à l'algorithme de propagation en système de référence réversible (RESPA). La méthode préserve la précision, conservant les propriétés statiques et dynamiques, tout en ne nécessitant d'évaluer le modèle coûteux que tous les 3 à 6 fs selon le système. Par conséquent, une accélération significative des simulations a été observée par rapport à l'intégration standard à 1 fs : 4 fois dans les systèmes homogènes, 2,7 fois dans les grandes protéines solvatées.
Bien que les potentiels énergétiques basés sur les réseaux de neurones (NNPs) offrent une précision proche de la mécanique quantique, leur coût computationnel est significativement plus élevé que celui des potentiels empiriques traditionnels, ce qui limite leur application aux grands systèmes et aux simulations sur de longues échelles de temps. Les principaux goulots d'étranglement sont :
Exigences d'intégration temporelle pour les mouvements haute fréquence : la dynamique moléculaire doit utiliser des petits pas de temps (0,5-1 fs) pour résoudre les mouvements haute fréquence tels que les vibrations de liaison
Évaluations de forces coûteuses : l'intensité computationnelle des modèles d'apprentissage automatique entraîne de nombreuses évaluations de forces onéreuses
Écart de performance avec les champs de force classiques : le coût computationnel des NNPs entrave leur adoption généralisée
Les intégrateurs à pas de temps multiples (MTS) se sont avérés efficaces dans les simulations moléculaires classiques, mais n'ont pas encore été adaptés au domaine des potentiels d'apprentissage automatique. Cette recherche vise à :
Développer le premier schéma MTS basé sur RESPA applicable aux potentiels d'apprentissage automatique
Mettre en œuvre un schéma MTS efficace utilisant plusieurs réseaux de neurones de complexité et de coût d'inférence différents
Réduire l'écart de performance entre les NNPs et les champs de force classiques
Première implémentation d'un schéma MTS pour les potentiels d'apprentissage automatique : proposition du premier schéma d'intégration à pas de temps multiples basé sur RESPA pour les potentiels d'apprentissage automatique
Stratégie de distillation de connaissances : développement de deux stratégies de distillation (modèles spécifiques au système et modèles universels) pour créer des modèles rapides à courte portée
Accélération computationnelle significative : réalisation d'une accélération de 4 fois (systèmes homogènes) et 2,7 fois (complexes protéine-ligand) tout en maintenant la précision
Applicabilité générale : la stratégie s'applique à tout potentiel énergétique basé sur les réseaux de neurones, avec une universalité
Implémentation et validation complètes : implémentation dans la bibliothèque FeNNol et le package Tinker-HP, validée sur plusieurs systèmes
La tâche de cette recherche consiste à concevoir un schéma d'intégration à pas de temps multiples utilisant deux potentiels énergétiques de réseaux de neurones de complexité différente :
Entrées : coordonnées et vitesses du système moléculaire
Sorties : trajectoire MD accélérée, maintenant la même précision que le schéma à pas de temps unique
Contraintes : préserver la précision des propriétés statiques et dynamiques
Algorithme 1 : Étape d'Intégration MTS avec Séparation de Forces FENNIX
1: si première étape alors
2: Fsmall ← FENNIXsmall(x)
3: F ← FENNIXlarge(x)
4: fin si
5: v ← v + Δt/(2m) · (F - Fsmall)
6: pour i = 1 à nslow faire
7: v ← v + Δt/(2m·nslow) · Fsmall
8: x ← x + Δt/(2·nslow) · v
9: v ← thermo(v, Δt/nslow) # Appliquer le thermostat
10: x ← x + Δt/(2·nslow) · v
11: Fsmall ← FENNIXsmall(x)
12: v ← v + Δt/(2m·nslow) · Fsmall
13: fin pour
14: F ← FENNIXlarge(x)
15: v ← v + Δt/(2m) · (F - Fsmall)
Cet article cite 49 références importantes couvrant les domaines clés des potentiels énergétiques de réseaux de neurones, des méthodes à pas de temps multiples, de la distillation de connaissances et d'autres travaux classiques et récents, fournissant une base théorique solide pour la recherche.
Évaluation Globale : Il s'agit d'un article de recherche de haute qualité qui introduit avec succès les méthodes à pas de temps multiples dans le domaine des potentiels d'apprentissage automatique, fournissant une solution innovante et pratique pour résoudre le problème d'efficacité computationnelle des NNPs. Bien que présentant certaines limitations techniques, ses contributions pionnières et sa valeur pratique significative en font un progrès important dans ce domaine.