Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic
Nutzung von Rekurrenz in neuronalen Netzwerk-Wellenfunktionen für großskalige Simulationen von Heisenberg-Antiferromagneten auf dem Dreiecksgitter
In diesem Artikel werden rekurrente neuronale Netzwerk (RNN)-Wellenfunktions-Ansätze zur Untersuchung des Heisenberg-Antiferromagneten-Modells auf dem Dreiecksgitter (TLAHM) mit Systemgrößen bis zu 30×30 verwendet. Im Gegensatz zu zuvor untersuchten Quadratgitter-Modellen ohne Vorzeichenproblem weist das TLAHM eine komplexe Vorzeichenstruktur auf, die numerische Simulationen erheblich erschwert. Die Forschung zeigt, dass durch angemessene Basiswechsel und variationelle neuronale Abkühlungstechniken die Simulationsgenauigkeit erheblich verbessert werden kann. Die erhaltenen Grundzustandseigenschaften im thermodynamischen Limes stimmen stark mit Literaturwerten überein und demonstrieren die starke Leistungsfähigkeit von RNN-Wellenfunktionen bei der Untersuchung der endlichen Größenskalierung in frustrierten Quantenmultikörpersystemen.
Das Heisenberg-Antiferromagneten-Modell auf dem Dreiecksgitter (TLAHM) ist eines der Standardbeispiele für frustrierte Quantenmagnete. Obwohl bekannt ist, dass sein Grundzustand 120°-magnetische Ordnung aufweist, ist die numerische Untersuchung dieses Systems aufgrund der geometrischen Frustration äußerst herausfordernd. Im Gegensatz zum Quadratgitter weist das TLAHM ein Vorzeichenproblem auf, das Quantenmontecarlo (QMC)-Simulationen erschwert.
Neuronale Quantenzustände (NQS) als hochexpressive variationelle Ansätze haben in letzter Zeit große Aufmerksamkeit erhalten, aber Frustration und nicht-triviale Vorzeichenstrukturen werden als potenzielle Hindernisse für die NQS-Optimierung angesehen. Das TLAHM wird daher zu einer wichtigen Benchmark zur Prüfung der NQS-Leistung. Dieser Artikel zielt darauf ab, die Wirksamkeit von RNN-Wellenfunktionen in solch schwierigen Systemen zu überprüfen.
Erstmalige erfolgreiche Anwendung von iterativ umgeschulten RNN-Wellenfunktionen auf das TLAHM, mit großskaligen Simulationen von bis zu 30×30 Systemen
Systematische Untersuchung der Auswirkungen von Basiswechseln auf die Simulationsgenauigkeit, wobei die 120°-Transformation im Vergleich zur Marshall-Peierls-Vorzeichenregel eine signifikante Verbesserung zeigt
Einführung der Technik der variationellen neuronalen Abkühlung (VNA), die Optimierungsschwierigkeiten durch Minimierung der Pseudo-Freien Energie effektiv überwindet
Gewinnung von Grundzustandseigenschaften im thermodynamischen Limes durch endliche Größenskalierung, wobei Grundzustandsenergie und Untergitter-Magnetisierungsstärke stark mit Literaturwerten übereinstimmen
Bereitstellung detaillierter Analysen der Rechenkomplexität und Laufzeiten, die die Praktikabilität der Methode demonstrieren
Untersuchung der Grundzustandseigenschaften des TLAHM:
H^=∑⟨ij⟩Si⋅Sj
wobei ⟨i,j⟩ die Wechselwirkung zwischen nächsten Nachbarn auf dem Dreiecksgitter bezeichnet und Si der Spin-1/2-Operator ist.
Minimierung der Pseudo-Freien Energie:
FW(t)=EW−T(t)Sclassical(pW)
wobei T(t) die Abkühlungstemperatur ist und Sclassical die Shannon-Entropie darstellt.
SU(2)-Symmetriebrechung: Der vom RNN gelernte Zustand ist eine Überlagerung von Anderson-Turm-Zuständen, nicht ein echter Singulett-Zustand
Bedeutung der Vorzeichenstruktur: Der Erfolg der 120°-Transformation demonstriert die Schlüsselrolle der Basiswahl beim Erlernen nicht-trivialer Vorzeichenstrukturen
Wirksamkeit der VNA: Auch in suboptimalen Basen können gute Ergebnisse durch angemessene Abkühlung erreicht werden
Historisch gab es Kontroversen über Grundzustandseigenschaften, die letztendlich durch Green-Funktions-Montecarlo und andere Methoden bestätigt wurden.
Der Artikel zitiert wichtige Literatur in diesem Bereich, einschließlich:
Bahnbrechende Arbeiten von Anderson zur Resonanzvalenz-Bindungstheorie
Exakte Diagonalisierungsbenchmark-Ergebnisse von Bernu et al.
Green-Funktions-Montecarlo-Studien von Capriotti et al.
Grundlegende Arbeiten von Carleo-Troyer zu neuronalen Quantenzuständen
Aktuelle hochpräzise DMRG- und iPEPS-Ergebnisse
Gesamtbewertung: Dies ist ein hochqualitatives Papier der Computerphysik mit wichtigen Beiträgen sowohl auf methodologischer als auch auf anwendungsorientierter Ebene. Durch geschickte Kombination von Basiswechsel, variationeller Abkühlung und iterativem Umschulen wird das schwierige TLAHM-Problem erfolgreich gelöst und neue Wege für die Anwendung neuronaler Quantenzustände in frustrierten Systemen eröffnet. Trotz einiger theoretischer Verständnislücken machen sein praktischer Wert und seine inspirierende Bedeutung es zu einem wichtigen Fortschritt in diesem Bereich.