We present a strategy to accelerate molecular dynamics simulations using foundation neural network models. To do so, we apply a dual-level neural network multi-time-step (MTS) strategy where the target accurate potential is coupled to a simpler but faster model obtained via a distillation process. Thus, the 3.5 Ã -cutoff distilled model is sufficient to capture the fast varying forces, i.e. mainly bonded interactions, from the accurate potential allowing its use in a reversible reference system propagator algorithms (RESPA)-like formalism. The approach conserves accuracy, preserving both static and dynamical properties, while enabling to evaluate the costly model only every 3 to 6 fs depending on the system. Consequently, large simulation speedups over standard 1 fs integration are observed: 4-fold in homogeneous systems and 2.7-fold in large solvated proteins. Such a strategy is applicable to any neural network potential and reduces their performance gap with classical force fields.
academic
Accelerazione delle Simulazioni di Dinamica Molecolare con Modelli di Reti Neurali Fondazionali Utilizzando Passi Temporali Multipli e Distillazione
Titolo: Accelerazione delle Simulazioni di Dinamica Molecolare con Modelli di Reti Neurali Fondazionali Utilizzando Passi Temporali Multipli e Distillazione
Autori: Côme Cattin, Thomas Plé, Olivier Adjoua, Nicoläı Gouraud, Louis Lagardère, Jean-Philip Piquemal
Questo articolo propone una strategia per accelerare le simulazioni di dinamica molecolare utilizzando modelli di reti neurali fondazionali. Il metodo impiega una strategia a due livelli con passi temporali multipli (MTS), accoppiando il potenziale energetico di riferimento accurato con un modello più semplice ma più veloce ottenuto attraverso un processo di distillazione. Il modello distillato con cutoff di 3,5 Å è sufficiente per catturare le forze che variano rapidamente nel potenziale accurato (principalmente interazioni di legame), consentendo l'utilizzo in uno schema simile all'algoritmo di propagazione del sistema di riferimento reversibile (RESPA). Il metodo mantiene l'accuratezza, preservando le proprietà statiche e dinamiche, mentre richiede la valutazione del modello costoso solo ogni 3-6 fs a seconda del sistema. Di conseguenza, si osserva un'accelerazione significativa della simulazione rispetto all'integrazione standard a 1 fs: 4 volte nei sistemi uniformi e 2,7 volte nelle proteine solvatate di grandi dimensioni.
Sebbene i potenziali di reti neurali (NNPs) forniscano precisione prossima alla meccanica quantistica, il loro costo computazionale è significativamente superiore ai potenziali empirici tradizionali, limitandone l'applicazione in sistemi grandi e simulazioni su scale temporali lunghe. I principali colli di bottiglia sono:
Requisiti di integrazione temporale per movimenti ad alta frequenza: la dinamica molecolare deve utilizzare piccoli passi temporali (0,5-1 fs) per risolvere movimenti ad alta frequenza come le vibrazioni di legame
Valutazioni di forza costose: l'intensità computazionale dei modelli ML comporta numerose valutazioni di forza onerose
Divario di prestazioni rispetto ai campi di forza classici: il costo computazionale degli NNPs ostacola la loro diffusa applicazione
Gli integratori a passi temporali multipli (MTS) si sono dimostrati efficaci nelle simulazioni molecolari classiche, ma non sono ancora stati adattati al dominio dei potenziali ML. Questa ricerca mira a:
Sviluppare il primo schema MTS basato su RESPA applicabile ai potenziali ML
Implementare uno schema MTS efficiente utilizzando multiple reti neurali con diversa complessità e costo di inferenza
Ridurre il divario di prestazioni tra gli NNPs e i campi di forza classici
Prima implementazione di uno schema MTS per potenziali ML: propone il primo schema di integrazione a passi temporali multipli basato su RESPA specificamente per potenziali di apprendimento automatico
Strategia di distillazione della conoscenza: sviluppa due strategie di distillazione (modelli specifici del sistema e modelli universali) per creare modelli a corto raggio veloci
Accelerazione computazionale significativa: realizza un'accelerazione di 4 volte (sistemi uniformi) e 2,7 volte (complessi proteina-ligando) mantenendo l'accuratezza
Applicabilità diffusa: la strategia è applicabile a qualsiasi potenziale di rete neurale, con carattere universale
Implementazione completa e validazione: implementata nella libreria FeNNol e nel pacchetto Tinker-HP, validata su molteplici sistemi
Il compito di questa ricerca è progettare uno schema di integrazione a passi temporali multipli utilizzando due potenziali di reti neurali di diversa complessità:
Input: coordinate e velocità del sistema molecolare
Output: traiettoria MD accelerata, mantenendo la stessa accuratezza dello schema a passo temporale singolo
Vincoli: mantenere l'accuratezza delle proprietà statiche e dinamiche
Algoritmo 1: Passo di Integrazione MTS con Splitting di Forza FENNIX
1: if primo passo then
2: Fsmall ← FENNIXsmall(x)
3: F ← FENNIXlarge(x)
4: end if
5: v ← v + Δt/(2m) · (F - Fsmall)
6: for i = 1 to nslow do
7: v ← v + Δt/(2m·nslow) · Fsmall
8: x ← x + Δt/(2·nslow) · v
9: v ← thermo(v, Δt/nslow) # Applicare termostato
10: x ← x + Δt/(2·nslow) · v
11: Fsmall ← FENNIXsmall(x)
12: v ← v + Δt/(2m·nslow) · Fsmall
13: end for
14: F ← FENNIXlarge(x)
15: v ← v + Δt/(2m) · (F - Fsmall)
Questo articolo cita 49 riferimenti importanti, coprendo lavori classici e recenti nei campi chiave dei potenziali di reti neurali, metodi a passi temporali multipli e distillazione della conoscenza, fornendo una base teorica solida per la ricerca.
Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che introduce con successo il metodo a passi temporali multipli nel dominio dei potenziali di apprendimento automatico, fornendo una soluzione innovativa e pratica per affrontare il problema dell'efficienza computazionale degli NNPs. Sebbene presenti alcune limitazioni tecniche, i suoi contributi pioneristici e il significativo valore pratico lo rendono un progresso importante nel campo.