Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
論文ID : 2505.20406タイトル : Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice著者 : M. Schuyler Moss, Roeland Wiersema, Mohamed Hibat-Allah, Juan Carrasquilla, Roger G. Melko分類 : cond-mat.str-el cond-mat.dis-nn quant-ph発表日時 : 2025年10月13日 (arXiv版本v3)論文リンク : https://arxiv.org/abs/2505.20406 本論文は、再帰型ニューラルネットワーク(RNN)波動関数ansätzeを用いて、三角格子反強磁性ハイゼンベルク模型(TLAHM)を30×30の大規模系統サイズで研究する。先行研究で調査された符号問題のない正方格子模型とは異なり、TLAHMは複雑な符号構造を有するため、数値シミュレーションがより困難である。適切な基変換と変分ニューラル焼鈍技術を通じてシミュレーション精度を大幅に向上させることができることが判明し、最終的に得られた熱力学極限基底状態特性は文献値と高度に一致している。これはRNN波動関数が阻害された量子多体系の有限サイズスケーリング研究における強力な能力を実証している。
三角格子反強磁性ハイゼンベルク模型(TLAHM)は、阻害された量子磁性の標準的な例の一つである。現在、その基底状態が120°磁気秩序を示すことが知られているが、幾何学的阻害の存在により、本系統の数値研究は極めて困難である。正方格子とは異なり、TLAHMは符号問題を有するため、量子モンテカルロ(QMC)シミュレーションが困難である。
厳密対角化 : 小規模系統に限定され、有限サイズ効果が深刻従来の変分モンテカルロ : ansätzeの選択に依存し、精度が限定的QMC法 : 符号問題に悩まされ、制御可能な誤差を得ることが困難神経量子状態(NQS)は高い表現力を持つ変分ansätzeとして近年注目されているが、阻害と非自明な符号構造はNQS最適化の潜在的な障害と考えられている。したがってTLAHMはNQS性能をテストするための重要なベンチマークとなり、本論文はこのような困難な系統におけるRNN波動関数の有効性を検証することを目的としている。
反復的再トレーニングRNN波動関数をTLAHMに初めて正常に適用 し、30×30系統の大規模シミュレーションを実現基変換がシミュレーション精度に与える影響を系統的に研究 し、120°変換がMarshall-Peierls符号規則と比較して結果を大幅に向上させることを発見変分ニューラル焼鍛(VNA)技術を導入 し、疑似自由エネルギーの最小化を通じて阻害による最適化困難を効果的に克服有限サイズスケーリングを通じて熱力学極限特性を取得 し、基底状態エネルギーと副格子磁化強度が文献ベンチマーク値と高度に一致詳細な計算複雑度と実行時間分析を提供 し、手法の実用性を実証TLAHMの基底状態特性を研究する:
H ^ = ∑ ⟨ i j ⟩ S ⃗ i ⋅ S ⃗ j \hat{H} = \sum_{\langle ij \rangle} \vec{S}_i \cdot \vec{S}_j H ^ = ∑ ⟨ ij ⟩ S i ⋅ S j
ここで⟨ i , j ⟩ \langle i,j \rangle ⟨ i , j ⟩ は三角格子上の最近接相互作用を表し、S ⃗ i \vec{S}_i S i はスピン-1/2演算子である。
二次元再帰ニューラルネットワークを用いて波動関数を構築する:
p ( ∣ σ ⟩ ) = p ( σ 1 ) p ( σ 2 ∣ σ 1 ) ⋯ p ( σ N ∣ σ N − 1 , … , σ 1 ) p(|\sigma\rangle) = p(\sigma_1)p(\sigma_2|\sigma_1)\cdots p(\sigma_N|\sigma_{N-1},\ldots,\sigma_1) p ( ∣ σ ⟩) = p ( σ 1 ) p ( σ 2 ∣ σ 1 ) ⋯ p ( σ N ∣ σ N − 1 , … , σ 1 )
主要コンポーネント :
ゲート付き再帰ユニット(GRU) : 隠れベクトル情報伝播を処理複素位相パラメータ化 : 非自明な符号構造を処理
Ψ W ( σ ) = exp [ i ϕ W ( σ ) ] p W ( σ ) \Psi_W(\sigma) = \exp[i\phi_W(\sigma)]\sqrt{p_W(\sigma)} Ψ W ( σ ) = exp [ i ϕ W ( σ )] p W ( σ ) 疑似周期境界条件 : 因果性を保持しながら周期系をシミュレートMarshall-Peierls変換 (U s q U_{sq} U s q ):
U s q = exp ( − i π ∑ j ∈ B s q S ^ j z ) U_{sq} = \exp\left(-i\pi\sum_{j\in B_{sq}}\hat{S}^z_j\right) U s q = exp ( − iπ ∑ j ∈ B s q S ^ j z )
120°変換 (U t r i U_{tri} U t r i ):
U t r i = exp ( − 2 π i 3 [ ∑ b ∈ B t r i S ^ b z − ∑ c ∈ C t r i S ^ c z ] ) U_{tri} = \exp\left(-\frac{2\pi i}{3}\left[\sum_{b\in B_{tri}}\hat{S}^z_b - \sum_{c\in C_{tri}}\hat{S}^z_c\right]\right) U t r i = exp ( − 3 2 πi [ ∑ b ∈ B t r i S ^ b z − ∑ c ∈ C t r i S ^ c z ] )
疑似自由エネルギーを最小化する:
F W ( t ) = E W − T ( t ) S c l a s s i c a l ( p W ) F_W(t) = E_W - T(t)S_{classical}(p_W) F W ( t ) = E W − T ( t ) S c l a ss i c a l ( p W )
ここでT ( t ) T(t) T ( t ) は焼鍛温度、S c l a s s i c a l S_{classical} S c l a ss i c a l はシャノンエントロピーである。
重み共有メカニズム : RNNパラメータ数はシステムサイズに無関係で、反復的再トレーニングをサポート対称性平均化 : 波動関数振幅に対してのみC 6 v C_{6v} C 6 v 群平均を適用し、位相平均の数値不安定性を回避パラメータ化トレーニング計画 :
N s t e p s ( L , s , r ; L 0 , C , F ) = s × [ C exp ( − r ( L − L 0 ) ) + F ] N_{steps}(L,s,r;L_0,C,F) = s \times [C\exp(-r(L-L_0)) + F] N s t e p s ( L , s , r ; L 0 , C , F ) = s × [ C exp ( − r ( L − L 0 )) + F ] ゼロ分散外挿 : 改善された変分状態の系列を利用してより正確なエネルギー推定を取得格子サイズ : L = 6, 12, 18, 24, 30 (周期境界条件)隠れベクトル次元 : d h d_h d h = 固定値(十分な表現力を保証)対称性 : U(1)対称性を強制(ゼロ磁化)、C 6 v C_{6v} C 6 v 点群対称を適用4段階トレーニング (L=6):
固定学習率γ = 5 × 10 − 4 \gamma = 5 \times 10^{-4} γ = 5 × 1 0 − 4 、温度T 0 T_0 T 0 変分ニューラル焼鍛: 線形に0まで冷却 学習率減衰: γ ( t ) = γ 0 × ( 1 + ( t / δ ) ) − 1 \gamma(t) = \gamma_0 \times (1+(t/\delta))^{-1} γ ( t ) = γ 0 × ( 1 + ( t / δ ) ) − 1 対称性を適用、最終最適化 反復的再トレーニング : 小規模サイズ最適化結果を用いて大規模サイズトレーニングを初期化
変分エネルギー : E W = ⟨ Ψ W ∣ H ^ ∣ Ψ W ⟩ / ⟨ Ψ W ∣ Ψ W ⟩ E_W = \langle\Psi_W|\hat{H}|\Psi_W\rangle/\langle\Psi_W|\Psi_W\rangle E W = ⟨ Ψ W ∣ H ^ ∣ Ψ W ⟩ / ⟨ Ψ W ∣ Ψ W ⟩ エネルギー分散 : 固有状態への接近度を測定V-スコア : V = N var ( E ) / ( E − E ∞ ) 2 V = N\text{var}(E)/(E-E_\infty)^2 V = N var ( E ) / ( E − E ∞ ) 2 副格子磁化強度 : 運動量空間相関関数を通じて計算変換なし/Marshall-Peierls変換 : 正確な結果を得るために高温焼鍛(T 0 = 1.0 T_0 = 1.0 T 0 = 1.0 )が必要120°変換 : 焼鍛温度に対して鈍感で、T 0 = 0 T_0 = 0 T 0 = 0 でも優れた結果を得られる最適エネルギー : -0.5562(2) (厳密対角化結果-0.5603734に接近)エネルギースケーリング (E ( L ) = E ∞ + e 1 / L 3 E(L) = E_\infty + e_1/L^3 E ( L ) = E ∞ + e 1 / L 3 を使用):
ゼロ分散外挿エネルギー: E ∞ = − 0.5517569 ( 9 ) E_\infty = -0.5517569(9) E ∞ = − 0.5517569 ( 9 ) DMRGベンチマーク: E ∞ D M R G = − 0.5503 ( 8 ) E_\infty^{DMRG} = -0.5503(8) E ∞ D MRG = − 0.5503 ( 8 ) iPEPSベンチマーク: E ∞ i P E P S = − 0.55161 ( 6 ) E_\infty^{iPEPS} = -0.55161(6) E ∞ i PEPS = − 0.55161 ( 6 ) 副格子磁化強度 :
M ∞ = 0.192 ( 2 ) M_\infty = 0.192(2) M ∞ = 0.192 ( 2 ) (M 2 M^2 M 2 外挿から)M ∞ = 0.198 ( 2 ) M_\infty = 0.198(2) M ∞ = 0.198 ( 2 ) (M C 2 M^2_C M C 2 外挿から)DMRGベンチマーク: M ∞ D M R G = 0.208 ( 8 ) M_\infty^{DMRG} = 0.208(8) M ∞ D MRG = 0.208 ( 8 ) 単一ステップトレーニング時間 : O ( L 4 ) O(L^4) O ( L 4 ) スケーリング総実行時間 : 最長シミュレーション1700 GPU時間(6つのシステムサイズを含む)パラメータ化トレーニング計画 は大規模系統の計算コストを効果的に制御SU(2)対称性の破れ : RNNが学習した状態はAndersonタワー状態の重ね合わせであり、真の一重項ではない符号構造の重要性 : 120°変換の成功は、非自明な符号構造を学習する際の基選択の重要性を証明VNAの有効性 : 準最適基の下でも適切な焼鍛を通じて良好な結果を得られるDMRG : 円筒幾何で重要な進展を達成iPEPS : 熱力学極限基底状態を直接パラメータ化従来のVMC : 投影波動関数などのansätzeを使用RBM : 最初のNQSアーキテクチャCNN : 並進不変性を利用Transformer : 長距離相関を処理RNN : 本論文の焦点、反復的再トレーニングをサポート歴史的には基底状態特性について議論があったが、最終的にGreen関数モンテカルロなどの手法を通じて120°反強磁性秩序状態が確認された。
RNN波動関数はTLAHMを正常にシミュレートできる 。阻害と非自明な符号構造が存在する場合でも基変換とVNAが重要な技術 であり、最適化効果を大幅に向上させる反復的再トレーニング戦略は有効 で、大規模系統の効率的なシミュレーションを実現熱力学極限結果はベンチマークと一致 し、手法の信頼性を検証正方格子と比較してより多くの計算リソースが必要 : 最小減衰率が0.25から0.158に低下V-スコアが低い : TLAHMが確かにより困難な最適化問題であることを示唆SU(2)対称性が完全に保持されていない : 特定の物理量の精度に影響する可能性依然としてAdam最適化器が必要 : SR等の高度な最適化手法はRNNに対して効果が低い符号構造の系統的研究 : 基変換成功の深層的な理由を理解より高度な最適化アルゴリズム : RNNに適用可能なSR変体を探索その他の阻害系統 : カゴメ格子などの幾何学的構造に拡張量子相転移研究 : スケーラビリティを利用して臨界現象を研究技術的革新性が強い : 反復的再トレーニングRNNを困難な阻害系統に初めて正常に適用実験設計が完全 : 異なる基変換と最適化戦略の効果を系統的に比較結果の信頼性が高い : 複数の手法で検証され、独立したベンチマークと高度に一致実用価値が大きい : 大規模阻害量子系を処理するための有効なツールを提供分析が深い : 最適化の観点から符号問題の影響を理解理論的理解が限定的 : 120°変換成功のメカニズムに対する深い分析が不足計算コストが高い : 正方格子と比較してもより多くのリソースが必要対称性処理 : SU(2)破れが特定の観測量の精度に影響する可能性汎化性が未知 : 他の阻害系統での性能は未検証方法論的貢献 : 阻害系統におけるNQS応用の重要な範例を提供技術の推広性 : 反復的再トレーニング戦略を他の量子多体問題に適用可能ベンチマーク価値 : TLAHMの新しい高精度数値結果を提供啓発的意義 : 量子機械学習における基変換の重要性を明らかにする二次元阻害量子磁体 : 特に幾何学的阻害系統に適切有限サイズスケーリング研究 : RNNのスケーラビリティ優位性が明白基底状態特性計算 : エネルギー、磁化強度などの基底状態観測量方法論研究 : 新しいNQSアーキテクチャをテストするためのベンチマーク問題本論文は本分野の重要な文献を引用しており、以下を含む:
Andersonの共鳴価結合理論の開拓的研究 Bernuらの厳密対角化ベンチマーク結果 Capriottらのグリーン関数モンテカルロ研究 Carleo-Troyerの神経量子状態基礎的研究 最近のDMRGおよびiPEPS高精度結果 総合評価 : これは計算物理学の高品質論文であり、方法論と応用の両面で重要な貢献をしている。基変換、変分焼鍛、反復的再トレーニングなどの技術を巧みに組み合わせることで、困難なTLAHM問題を成功裏に解決し、阻害系統における神経量子状態の応用に新たな道を開いた。理論的理解に若干の不足があるが、その実用的価値と啓発的意義により、本論文は本分野の重要な進展となっている。