Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic
Exploiter la récurrence dans les fonctions d'onde de réseaux de neurones pour les simulations à grande échelle des antiferromagnétiques de Heisenberg sur le réseau triangulaire
Cet article étudie le modèle antiferromagnétique de Heisenberg sur réseau triangulaire (TLAHM) en utilisant des ansätze de fonctions d'onde de réseaux de neurones récurrents (RNN), pour des tailles de système atteignant 30×30. Contrairement aux modèles de réseau carré sans problème de signe étudiés précédemment, le TLAHM présente une structure de signe complexe, rendant la simulation numérique considérablement plus difficile. L'étude montre que par des changements de base appropriés et des techniques de recuit neuronal variationnel, on peut améliorer significativement la précision de la simulation. Les propriétés de l'état fondamental à la limite thermodynamique obtenues sont hautement cohérentes avec les valeurs de la littérature, démontrant la puissance des fonctions d'onde RNN pour l'étude de l'échelle de taille finie des systèmes quantiques multi-corps frustrés.
Le modèle antiferromagnétique de Heisenberg sur réseau triangulaire (TLAHM) est l'un des exemples standards du magnétisme quantique frustré. Bien que l'on sache maintenant que son état fondamental présente un ordre magnétique à 120°, l'étude numérique de ce système est extrêmement difficile en raison de la frustration géométrique. Contrairement au réseau carré, le TLAHM présente un problème de signe, rendant les simulations de Monte-Carlo quantique (QMC) difficiles.
Les états quantiques neuronaux (NQS) en tant qu'ansätze variationnels hautement expressifs ont récemment attiré beaucoup d'attention, mais la frustration et la structure de signe non triviale sont considérées comme des obstacles potentiels à l'optimisation des NQS. Le TLAHM devient donc un point de repère important pour tester les performances des NQS. Cet article vise à vérifier l'efficacité des fonctions d'onde RNN dans ces systèmes difficiles.
Application réussie pour la première fois des fonctions d'onde RNN avec réentraînement itératif au TLAHM, réalisant des simulations à grande échelle jusqu'à des systèmes 30×30
Étude systématique de l'effet des changements de base sur la précision de la simulation, découvrant que la transformation à 120° améliore significativement les résultats par rapport à la règle de signe Marshall-Peierls
Introduction de la technique de recuit neuronal variationnel (VNA), surmontant efficacement les difficultés d'optimisation causées par la frustration en minimisant l'énergie libre pseudo
Obtention des propriétés à la limite thermodynamique par extrapolation de taille finie, avec l'énergie de l'état fondamental et la magnétisation des sous-réseaux hautement cohérentes avec les valeurs de référence de la littérature
Fourniture d'une analyse détaillée de la complexité de calcul et du temps d'exécution, démontrant la praticité de la méthode
Étude des propriétés de l'état fondamental du TLAHM :
H^=∑⟨ij⟩Si⋅Sj
où ⟨i,j⟩ désigne les interactions entre plus proches voisins sur le réseau triangulaire, et Si est l'opérateur de spin-1/2.
Minimisation de l'énergie libre pseudo :
FW(t)=EW−T(t)Sclassical(pW)
où T(t) est la température de recuit et Sclassical est l'entropie de Shannon.
Mécanisme de partage de poids : le nombre de paramètres RNN est indépendant de la taille du système, supportant le réentraînement itératif
Moyenne de symétrie : moyenne du groupe C6v appliquée uniquement à l'amplitude de la fonction d'onde, évitant l'instabilité numérique de la moyenne de phase
Plan d'entraînement paramétrisé :
Nsteps(L,s,r;L0,C,F)=s×[Cexp(−r(L−L0))+F]
Extrapolation à variance nulle : utilisation de la séquence d'états variationnels améliorée du système pour obtenir des estimations d'énergie plus précises
Rupture de symétrie SU(2) : l'état appris par le RNN est une superposition de tours d'Anderson plutôt qu'un vrai singulet
Importance de la structure de signe : le succès de la transformation à 120° démontre le rôle clé du choix de base pour apprendre les structures de signe non triviales
Efficacité du VNA : même dans une base sous-optimale, on peut obtenir de bons résultats grâce à un recuit approprié
Historiquement, il y avait des désaccords sur les propriétés de l'état fondamental, finalement confirmées par Monte-Carlo de fonction de Green et autres méthodes comme un état antiferromagnétique ordonné à 120°.
Cet article cite les travaux importants du domaine, notamment :
Travaux fondateurs de la théorie des liaisons de valence résonantes d'Anderson
Résultats de référence de diagonalisation exacte de Bernu et al.
Étude Monte-Carlo de fonction de Green de Capriotti et al.
Travail fondateur des états quantiques neuronaux de Carleo-Troyer
Résultats récents de haute précision de DMRG et iPEPS
Évaluation globale : Ceci est un article de physique computationnelle de haute qualité avec des contributions importantes tant au niveau méthodologique qu'applicatif. En combinant habilement les changements de base, le recuit variationnel et le réentraînement itératif, il résout avec succès le problème difficile du TLAHM, ouvrant de nouvelles voies pour l'application des états quantiques neuronaux aux systèmes frustrés. Malgré certaines insuffisances dans la compréhension théorique, sa valeur pratique et sa signification inspirante en font un progrès important dans le domaine.