Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic
Использование рекуррентности в нейронных сетевых волновых функциях для крупномасштабного моделирования антиферромагнетиков Гейзенберга на треугольной решётке
В данной работе исследуется модель антиферромагнетика Гейзенберга на треугольной решётке (TLAHM) с использованием анзацев волновых функций рекуррентных нейронных сетей (RNN) для систем размером до 30×30. В отличие от изученных ранее моделей на квадратной решётке без знаковой проблемы, TLAHM обладает сложной знаковой структурой, что значительно усложняет численное моделирование. Исследование показывает, что посредством надлежащего преобразования базиса и техники вариационного нейронного отжига можно существенно повысить точность моделирования. Полученные свойства основного состояния в термодинамическом пределе хорошо согласуются с литературными значениями, что доказывает мощь волновых функций RNN при исследовании конечномерного масштабирования в фрустрированных квантовых многотельных системах.
Модель антиферромагнетика Гейзенберга на треугольной решётке (TLAHM) является стандартным примером фрустрированного квантового магнетизма. Хотя известно, что основное состояние демонстрирует 120° магнитный порядок, численное исследование этой системы чрезвычайно сложно из-за геометрической фрустрации. В отличие от квадратной решётки, TLAHM содержит знаковую проблему, что затрудняет моделирование квантовым методом Монте-Карло (QMC).
Нейронные квантовые состояния (NQS) как высокоэкспрессивные вариационные анзацы привлекли внимание в последние годы, однако фрустрация и нетривиальная знаковая структура рассматривались как потенциальные препятствия для оптимизации NQS. TLAHM таким образом становится важным тестовым примером для проверки производительности NQS. Данная работа направлена на верификацию эффективности волновых функций RNN в таких сложных системах.
Первое успешное применение итеративно переобученных волновых функций RNN к TLAHM, реализующее крупномасштабное моделирование систем размером до 30×30
Систематическое исследование влияния преобразования базиса на точность моделирования, обнаружившее, что 120° преобразование значительно превосходит правило знака Маршалла-Пейерлса
Получение свойств основного состояния в термодинамическом пределе посредством конечномерного масштабирования, энергия основного состояния и намагниченность подрешётки хорошо согласуются с литературными эталонными значениями
Предоставление детального анализа вычислительной сложности и времени выполнения, доказывающего практичность метода
Исследование свойств основного состояния TLAHM:
H^=∑⟨ij⟩Si⋅Sj
где ⟨i,j⟩ обозначает взаимодействие ближайших соседей на треугольной решётке, Si — оператор спина-1/2.
Механизм совместного использования весов: количество параметров RNN независимо от размера системы, поддерживает итеративное переобучение
Усреднение по симметриям: применение C6v группового усреднения только к амплитуде волновой функции, избегание численной нестабильности при усреднении фазы
Исторически существовали разногласия относительно свойств основного состояния, окончательно подтверждённые методом Монте-Карло функций Грина как 120° антиферромагнитный упорядоченный состояние.
Данная работа цитирует важные публикации в этой области, включая:
Основополагающие работы Андерсона по теории резонирующих валентных связей
Эталонные результаты точной диагонализации Bernu и соавторов
Исследования методом Монте-Карло функций Грина Capriotti и соавторов
Основополагающие работы Carleo-Troyer по нейронным квантовым состояниям
Недавние высокоточные результаты DMRG и iPEPS
Общая оценка: Это высококачественная статья по вычислительной физике с важными вкладами как в методологию, так и в приложения. Посредством умелого сочетания преобразования базиса, вариационного отжига и итеративного переобучения авторы успешно решили сложную задачу TLAHM, открыв новые пути применения нейронных квантовых состояний в фрустрированных системах. Несмотря на некоторые недостатки в теоретическом понимании, её практическая ценность и вдохновляющее значение делают её важным прогрессом в данной области.