Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic
Sfruttare la ricorrenza nelle funzioni d'onda di reti neurali per simulazioni su larga scala di antiferromagneti di Heisenberg sul reticolo triangolare
Questo articolo utilizza ansätze di funzioni d'onda con reti neurali ricorrenti (RNN) per studiare il modello antiferromagnetico di Heisenberg su reticolo triangolare (TLAHM) con dimensioni di sistema fino a 30×30. A differenza dei modelli su reticolo quadrato precedentemente studiati senza il problema del segno, il TLAHM presenta una struttura di segno complessa, rendendo le simulazioni numeriche più difficili. Lo studio dimostra che attraverso opportune trasformazioni di base e tecniche di annealing neurale variazionale è possibile aumentare significativamente la precisione della simulazione. Le proprietà dello stato fondamentale nel limite termodinamico ottenute risultano altamente coerenti con i valori in letteratura, provando la potenza delle funzioni d'onda RNN nello studio del finite-size scaling di sistemi quantistici a molti corpi frustrati.
Il modello antiferromagnetico di Heisenberg su reticolo triangolare (TLAHM) è uno degli esempi standard di magnetismo quantico frustrato. Sebbene sia ormai noto che lo stato fondamentale presenta ordine magnetico a 120°, lo studio numerico di questo sistema è estremamente impegnativo a causa della frustrazione geometrica. A differenza del reticolo quadrato, il TLAHM presenta il problema del segno, rendendo difficili le simulazioni di Monte Carlo quantistico (QMC).
Gli stati quantistici neurali (NQS) come ansätze variazionali ad alta espressività hanno recentemente attirato grande attenzione, ma la frustrazione e la struttura di segno non banale sono considerate ostacoli potenziali all'ottimizzazione di NQS. Il TLAHM rappresenta quindi un importante benchmark per testare le prestazioni delle funzioni d'onda RNN, e questo articolo mira a verificare l'efficacia di tali funzioni in sistemi così difficili.
Prima applicazione riuscita di funzioni d'onda RNN con riaddestramenti iterativi al TLAHM, realizzando simulazioni su larga scala fino a sistemi 30×30
Studio sistematico dell'effetto delle trasformazioni di base sulla precisione della simulazione, scoprendo che la trasformazione a 120° produce miglioramenti significativi rispetto alla regola di segno Marshall-Peierls
Introduzione della tecnica di annealing neurale variazionale (VNA), superando efficacemente le difficoltà di ottimizzazione causate dalla frustrazione minimizzando la pseudo-energia libera
Ottenimento delle proprietà nel limite termodinamico attraverso finite-size scaling, con energia dello stato fondamentale e magnetizzazione dei sottoreticoli altamente coerenti con i valori di riferimento in letteratura
Fornitura di analisi dettagliata della complessità computazionale e dei tempi di esecuzione, provando la praticità del metodo
Studio delle proprietà dello stato fondamentale del TLAHM:
H^=∑⟨ij⟩Si⋅Sj
dove ⟨i,j⟩ denota le interazioni tra i primi vicini sul reticolo triangolare e Si è l'operatore di spin-1/2.
Minimizzazione della pseudo-energia libera:
FW(t)=EW−T(t)Sclassical(pW)
dove T(t) è la temperatura di annealing e Sclassical è l'entropia di Shannon.
Rottura di Simmetria SU(2): lo stato appreso dalla RNN è una sovrapposizione della torre di Anderson, non un vero singoletto
Importanza della Struttura di Segno: il successo della trasformazione a 120° dimostra il ruolo cruciale della scelta di base nell'apprendimento di strutture di segno non banali
Efficacia del VNA: anche in basi subottimali è possibile ottenere buoni risultati attraverso annealing appropriato
Storicamente c'è stata controversia sulle proprietà dello stato fondamentale, infine confermata attraverso Monte Carlo della funzione di Green come stato antiferromagnetico ordinato a 120°.
Questo articolo cita importanti riferimenti nel campo, includendo:
Lavori fondamentali di Anderson sulla teoria della risonanza dei legami di valenza
Risultati di diagonalizzazione esatta di Bernu e colleghi
Ricerca di Monte Carlo della funzione di Green di Capriotti e colleghi
Lavoro fondativo di Carleo-Troyer sugli stati quantistici neurali
Risultati recenti ad alta precisione di DMRG e iPEPS
Valutazione Complessiva: Questo è un articolo di alta qualità di fisica computazionale con importanti contributi sia dal punto di vista metodologico che applicativo. Attraverso la combinazione intelligente di trasformazioni di base, annealing variazionale e riaddestramenti iterativi, ha affrontato con successo il difficile problema del TLAHM, aprendo nuove strade per l'applicazione degli stati quantistici neurali a sistemi frustrati. Nonostante alcune insufficienze nella comprensione teorica, il suo valore pratico e il suo significato ispirativo lo rendono un importante progresso in questo campo.