Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic
Aprovechando la recurrencia en funciones de onda de redes neuronales para simulaciones a gran escala de antiferroimanes de Heisenberg en la red triangular
Este artículo estudia el modelo de Heisenberg antiferromagnético en red triangular (TLAHM) utilizando ansätze de funciones de onda de redes neuronales recurrentes (RNN), alcanzando tamaños de sistema de 30×30. A diferencia de los modelos de red cuadrada estudiados previamente sin problema de signos, el TLAHM presenta una estructura de signos compleja que hace que la simulación numérica sea más desafiante. El estudio demuestra que mediante cambios de base apropiados y técnicas de recocido neuronal variacional se puede mejorar significativamente la precisión de la simulación. Las propiedades del estado fundamental en el límite termodinámico obtenidas son altamente consistentes con valores de la literatura, demostrando la capacidad robusta de las funciones de onda RNN en estudios de escalado de tamaño finito de sistemas cuánticos de muchos cuerpos frustrados.
El modelo de Heisenberg antiferromagnético en red triangular (TLAHM) es uno de los ejemplos estándar de magnetismo cuántico frustrado. Aunque actualmente se conoce que su estado fundamental exhibe orden magnético de 120°, la investigación numérica de este sistema es extremadamente desafiante debido a la frustración geométrica presente. A diferencia de la red cuadrada, el TLAHM presenta un problema de signos que dificulta las simulaciones de Monte Carlo cuántico (QMC).
Los estados cuánticos neuronales (NQS) como ansätze variacionales de alta expresividad han recibido considerable atención recientemente, pero la frustración y la estructura de signos no trivial se consideraban obstáculos potenciales para la optimización de NQS. El TLAHM se convierte así en un punto de referencia importante para probar el desempeño de NQS, y este artículo tiene como objetivo verificar la efectividad de las funciones de onda RNN en tales sistemas difíciles.
Primera aplicación exitosa de funciones de onda RNN con reentrenamiento iterativo al TLAHM, logrando simulaciones a gran escala de sistemas de hasta 30×30
Estudio sistemático del impacto de cambios de base en la precisión de simulación, descubriendo que la transformación de 120° mejora significativamente los resultados en comparación con la regla de signos de Marshall-Peierls
Introducción de la técnica de recocido neuronal variacional (VNA), superando efectivamente las dificultades de optimización causadas por la frustración mediante minimización de energía libre pseudoclásica
Obtención de propiedades en el límite termodinámico mediante escalado de tamaño finito, con energía del estado fundamental e intensidad de magnetización de subred altamente consistentes con valores de referencia de la literatura
Análisis detallado de complejidad computacional y tiempo de ejecución, demostrando la practicidad del método
Investigación de las propiedades del estado fundamental del TLAHM:
H^=∑⟨ij⟩Si⋅Sj
donde ⟨i,j⟩ denota interacciones de primeros vecinos en la red triangular, y Si es el operador de espín-1/2.
Minimización de energía libre pseudoclásica:
FW(t)=EW−T(t)Sclassical(pW)
donde T(t) es la temperatura de recocido y Sclassical es la entropía de Shannon.
Mecanismo de compartición de pesos: El número de parámetros RNN es independiente del tamaño del sistema, permitiendo reentrenamiento iterativo
Promediado de simetría: Solo se promedian los valores absolutos de la función de onda del grupo C6v, evitando inestabilidad numérica del promediado de fase
Plan de entrenamiento parametrizado:
Nsteps(L,s,r;L0,C,F)=s×[Cexp(−r(L−L0))+F]
Extrapolación de varianza cero: Utiliza secuencias de estados variacionales mejorados del sistema para obtener estimaciones de energía más precisas
Ruptura de simetría SU(2): El estado aprendido por RNN es una superposición de estados de torre de Anderson, no un verdadero singlete
Importancia de la estructura de signos: El éxito de la transformación de 120° demuestra el papel crítico de la elección de base en el aprendizaje de estructuras de signos no triviales
Efectividad de VNA: Incluso en bases subóptimas se pueden obtener buenos resultados mediante recocido apropiado
Históricamente hubo controversia sobre las propiedades del estado fundamental, finalmente confirmado mediante Monte Carlo de función de Green que presenta orden antiferromagnético de 120°.
Este artículo cita literatura importante en el campo, incluyendo:
Trabajo pionero de Anderson en teoría de enlaces de valencia resonantes
Resultados de referencia de diagonalización exacta de Bernu et al.
Investigación de Monte Carlo de función de Green de Capriotti et al.
Trabajo fundamental de Carleo-Troyer en estados cuánticos neuronales
Resultados recientes de alta precisión de DMRG e iPEPS
Evaluación General: Este es un artículo de alta calidad en física computacional con contribuciones importantes tanto en metodología como en aplicación. Mediante combinación ingeniosa de cambio de base, recocido variacional y reentrenamiento iterativo, resuelve exitosamente el problema difícil del TLAHM, abriendo nuevos caminos para la aplicación de estados cuánticos neuronales en sistemas frustrados. A pesar de algunas insuficiencias en comprensión teórica, su valor práctico e importancia inspiradora lo convierten en un progreso importante en el campo.