2025-11-25T09:01:17.655044

Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice

Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic

Sfruttare la ricorrenza nelle funzioni d'onda di reti neurali per simulazioni su larga scala di antiferromagneti di Heisenberg sul reticolo triangolare

Informazioni Fondamentali

  • ID Articolo: 2505.20406
  • Titolo: Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice
  • Autori: M. Schuyler Moss, Roeland Wiersema, Mohamed Hibat-Allah, Juan Carrasquilla, Roger G. Melko
  • Classificazione: cond-mat.str-el cond-mat.dis-nn quant-ph
  • Data di Pubblicazione: 13 ottobre 2025 (versione arXiv v3)
  • Link Articolo: https://arxiv.org/abs/2505.20406

Riassunto

Questo articolo utilizza ansätze di funzioni d'onda con reti neurali ricorrenti (RNN) per studiare il modello antiferromagnetico di Heisenberg su reticolo triangolare (TLAHM) con dimensioni di sistema fino a 30×30. A differenza dei modelli su reticolo quadrato precedentemente studiati senza il problema del segno, il TLAHM presenta una struttura di segno complessa, rendendo le simulazioni numeriche più difficili. Lo studio dimostra che attraverso opportune trasformazioni di base e tecniche di annealing neurale variazionale è possibile aumentare significativamente la precisione della simulazione. Le proprietà dello stato fondamentale nel limite termodinamico ottenute risultano altamente coerenti con i valori in letteratura, provando la potenza delle funzioni d'onda RNN nello studio del finite-size scaling di sistemi quantistici a molti corpi frustrati.

Contesto di Ricerca e Motivazione

Importanza del Problema

Il modello antiferromagnetico di Heisenberg su reticolo triangolare (TLAHM) è uno degli esempi standard di magnetismo quantico frustrato. Sebbene sia ormai noto che lo stato fondamentale presenta ordine magnetico a 120°, lo studio numerico di questo sistema è estremamente impegnativo a causa della frustrazione geometrica. A differenza del reticolo quadrato, il TLAHM presenta il problema del segno, rendendo difficili le simulazioni di Monte Carlo quantistico (QMC).

Limitazioni dei Metodi Esistenti

  1. Diagonalizzazione esatta: limitata a dimensioni di sistema piccole, con gravi effetti di finite-size
  2. Monte Carlo variazionale tradizionale: dipende dalla scelta dell'ansatz, accuratezza limitata
  3. Metodi QMC: afflitti dal problema del segno, difficili da controllare con errori gestibili

Motivazione della Ricerca

Gli stati quantistici neurali (NQS) come ansätze variazionali ad alta espressività hanno recentemente attirato grande attenzione, ma la frustrazione e la struttura di segno non banale sono considerate ostacoli potenziali all'ottimizzazione di NQS. Il TLAHM rappresenta quindi un importante benchmark per testare le prestazioni delle funzioni d'onda RNN, e questo articolo mira a verificare l'efficacia di tali funzioni in sistemi così difficili.

Contributi Principali

  1. Prima applicazione riuscita di funzioni d'onda RNN con riaddestramenti iterativi al TLAHM, realizzando simulazioni su larga scala fino a sistemi 30×30
  2. Studio sistematico dell'effetto delle trasformazioni di base sulla precisione della simulazione, scoprendo che la trasformazione a 120° produce miglioramenti significativi rispetto alla regola di segno Marshall-Peierls
  3. Introduzione della tecnica di annealing neurale variazionale (VNA), superando efficacemente le difficoltà di ottimizzazione causate dalla frustrazione minimizzando la pseudo-energia libera
  4. Ottenimento delle proprietà nel limite termodinamico attraverso finite-size scaling, con energia dello stato fondamentale e magnetizzazione dei sottoreticoli altamente coerenti con i valori di riferimento in letteratura
  5. Fornitura di analisi dettagliata della complessità computazionale e dei tempi di esecuzione, provando la praticità del metodo

Dettagli Metodologici

Definizione del Compito

Studio delle proprietà dello stato fondamentale del TLAHM: H^=ijSiSj\hat{H} = \sum_{\langle ij \rangle} \vec{S}_i \cdot \vec{S}_j dove i,j\langle i,j \rangle denota le interazioni tra i primi vicini sul reticolo triangolare e Si\vec{S}_i è l'operatore di spin-1/2.

Architettura del Modello

Progettazione della Funzione d'Onda RNN

Costruzione di una funzione d'onda con rete neurale ricorrente bidimensionale: p(σ)=p(σ1)p(σ2σ1)p(σNσN1,,σ1)p(|\sigma\rangle) = p(\sigma_1)p(\sigma_2|\sigma_1)\cdots p(\sigma_N|\sigma_{N-1},\ldots,\sigma_1)

Componenti Chiave:

  1. Unità Ricorrente Controllata (GRU): elaborazione della trasmissione di informazioni del vettore nascosto
  2. Parametrizzazione di Fase Complessa: gestione della struttura di segno non banale ΨW(σ)=exp[iϕW(σ)]pW(σ)\Psi_W(\sigma) = \exp[i\phi_W(\sigma)]\sqrt{p_W(\sigma)}
  3. Condizioni di Contorno Pseudo-Periodiche: mantenimento della causalità simulando sistemi periodici

Tecnica di Trasformazione di Base

Trasformazione Marshall-Peierls (UsqU_{sq}): Usq=exp(iπjBsqS^jz)U_{sq} = \exp\left(-i\pi\sum_{j\in B_{sq}}\hat{S}^z_j\right)

Trasformazione a 120° (UtriU_{tri}): Utri=exp(2πi3[bBtriS^bzcCtriS^cz])U_{tri} = \exp\left(-\frac{2\pi i}{3}\left[\sum_{b\in B_{tri}}\hat{S}^z_b - \sum_{c\in C_{tri}}\hat{S}^z_c\right]\right)

Annealing Neurale Variazionale

Minimizzazione della pseudo-energia libera: FW(t)=EWT(t)Sclassical(pW)F_W(t) = E_W - T(t)S_{classical}(p_W) dove T(t)T(t) è la temperatura di annealing e SclassicalS_{classical} è l'entropia di Shannon.

Punti di Innovazione Tecnica

  1. Meccanismo di Condivisione dei Pesi: il numero di parametri RNN è indipendente dalla dimensione del sistema, supportando riaddestramenti iterativi
  2. Media di Simmetria: media C6vC_{6v} solo sull'ampiezza della funzione d'onda, evitando instabilità numerica della media di fase
  3. Piano di Addestramento Parametrizzato: Nsteps(L,s,r;L0,C,F)=s×[Cexp(r(LL0))+F]N_{steps}(L,s,r;L_0,C,F) = s \times [C\exp(-r(L-L_0)) + F]
  4. Estrapolazione a Varianza Zero: utilizzo di sequenze di stati variazionali migliorati per ottenere stime energetiche più precise

Configurazione Sperimentale

Parametri di Sistema

  • Dimensioni del Reticolo: L = 6, 12, 18, 24, 30 (condizioni di contorno periodiche)
  • Dimensione del Vettore Nascosto: dhd_h = valore fisso (garantendo espressività sufficiente)
  • Simmetrie: simmetria U(1) forzata (magnetizzazione zero), applicazione della simmetria del gruppo puntuale C6vC_{6v}

Strategia di Addestramento

Addestramento in Quattro Fasi (L=6):

  1. Tasso di apprendimento fisso γ=5×104\gamma = 5 \times 10^{-4}, temperatura T0T_0
  2. Annealing neurale variazionale: raffreddamento lineare a 0
  3. Decadimento del tasso di apprendimento: γ(t)=γ0×(1+(t/δ))1\gamma(t) = \gamma_0 \times (1+(t/\delta))^{-1}
  4. Applicazione di simmetrie, ottimizzazione finale

Riaddestramenti Iterativi: utilizzo dei risultati di ottimizzazione di dimensioni piccole per inizializzare l'addestramento di dimensioni maggiori

Metriche di Valutazione

  1. Energia Variazionale: EW=ΨWH^ΨW/ΨWΨWE_W = \langle\Psi_W|\hat{H}|\Psi_W\rangle/\langle\Psi_W|\Psi_W\rangle
  2. Varianza Energetica: misura della vicinanza allo stato proprio
  3. V-score: V=Nvar(E)/(EE)2V = N\text{var}(E)/(E-E_\infty)^2
  4. Magnetizzazione dei Sottoreticoli: calcolata attraverso funzioni di correlazione nello spazio dei momenti

Risultati Sperimentali

Risultati Principali

Confronto dell'Effetto delle Trasformazioni di Base (L=6)

  • Nessuna trasformazione/Trasformazione Marshall-Peierls: richiede annealing ad alta temperatura (T0=1.0T_0 = 1.0) per risultati accurati
  • Trasformazione a 120°: insensibile alla temperatura di annealing, risultati eccellenti anche con T0=0T_0 = 0
  • Energia Ottimale: -0.5562(2) (vicina al risultato di diagonalizzazione esatta -0.5603734)

Risultati di Finite-Size Scaling

Scaling Energetico (utilizzando E(L)=E+e1/L3E(L) = E_\infty + e_1/L^3):

  • Energia estrapolata a varianza zero: E=0.5517569(9)E_\infty = -0.5517569(9)
  • Benchmark DMRG: EDMRG=0.5503(8)E_\infty^{DMRG} = -0.5503(8)
  • Benchmark iPEPS: EiPEPS=0.55161(6)E_\infty^{iPEPS} = -0.55161(6)

Magnetizzazione dei Sottoreticoli:

  • M=0.192(2)M_\infty = 0.192(2) (da estrapolazione M2M^2)
  • M=0.198(2)M_\infty = 0.198(2) (da estrapolazione MC2M^2_C)
  • Benchmark DMRG: MDMRG=0.208(8)M_\infty^{DMRG} = 0.208(8)

Analisi della Complessità Computazionale

  • Tempo di Addestramento per Passo: scaling O(L4)O(L^4)
  • Tempo di Esecuzione Totale: fino a 1700 ore GPU (coprendo sei dimensioni di sistema)
  • Piano di Addestramento Parametrizzato controlla efficacemente i costi computazionali per sistemi di grandi dimensioni

Scoperte Importanti

  1. Rottura di Simmetria SU(2): lo stato appreso dalla RNN è una sovrapposizione della torre di Anderson, non un vero singoletto
  2. Importanza della Struttura di Segno: il successo della trasformazione a 120° dimostra il ruolo cruciale della scelta di base nell'apprendimento di strutture di segno non banali
  3. Efficacia del VNA: anche in basi subottimali è possibile ottenere buoni risultati attraverso annealing appropriato

Lavori Correlati

Metodi Numerici per Sistemi Quantistici a Molti Corpi

  • DMRG: progressi importanti in geometria cilindrica
  • iPEPS: parametrizzazione diretta dello stato fondamentale nel limite termodinamico
  • VMC Tradizionale: utilizzo di ansätze come funzioni d'onda proiettate

Sviluppo degli Stati Quantistici Neurali

  • RBM: prima architettura NQS
  • CNN: sfruttamento dell'invarianza traslazionale
  • Transformer: gestione di correlazioni a lungo raggio
  • RNN: focus di questo articolo, supporto per riaddestramenti iterativi

Ricerca Specializzata su TLAHM

Storicamente c'è stata controversia sulle proprietà dello stato fondamentale, infine confermata attraverso Monte Carlo della funzione di Green come stato antiferromagnetico ordinato a 120°.

Conclusioni e Discussione

Conclusioni Principali

  1. Le funzioni d'onda RNN possono simulare con successo il TLAHM, anche in presenza di frustrazione e struttura di segno non banale
  2. Le trasformazioni di base e il VNA sono tecniche chiave, migliorando significativamente i risultati dell'ottimizzazione
  3. La strategia di riaddestramenti iterativi è efficace, realizzando simulazioni efficienti di sistemi su larga scala
  4. I risultati nel limite termodinamico sono coerenti con i benchmark, verificando l'affidabilità del metodo

Limitazioni

  1. Richiede più risorse computazionali rispetto al reticolo quadrato: il tasso di decadimento minimo scende da 0.25 a 0.158
  2. V-score peggiore: indica che il TLAHM è effettivamente un problema di ottimizzazione più difficile
  3. Simmetria SU(2) non completamente preservata: potrebbe influenzare l'accuratezza di alcune quantità fisiche
  4. Richiede ancora l'ottimizzatore Adam: metodi avanzati come SR non funzionano bene con RNN

Direzioni Future

  1. Studio sistematico della struttura di segno: comprensione dei meccanismi sottostanti al successo della trasformazione di base
  2. Algoritmi di ottimizzazione più avanzati: esplorazione di varianti di SR applicabili a RNN
  3. Altri sistemi frustrati: estensione a reticoli kagome e altre geometrie
  4. Studio di transizioni di fase quantistiche: utilizzo della scalabilità per investigare fenomeni critici

Valutazione Approfondita

Punti di Forza

  1. Forte innovazione tecnica: prima applicazione riuscita di RNN con riaddestramenti iterativi a sistemi frustrati difficili
  2. Progettazione sperimentale completa: confronto sistematico di diverse trasformazioni di base e strategie di ottimizzazione
  3. Alta credibilità dei risultati: verificati attraverso molteplici metodi, altamente coerenti con benchmark indipendenti
  4. Grande valore pratico: fornisce uno strumento efficace per affrontare sistemi quantistici frustrati su larga scala
  5. Analisi approfondita: comprensione dell'impatto del problema del segno dal punto di vista dell'ottimizzazione

Insufficienze

  1. Comprensione teorica limitata: manca analisi approfondita dei meccanismi alla base del successo della trasformazione a 120°
  2. Costi computazionali elevati: ancora richiede più risorse rispetto al reticolo quadrato
  3. Gestione della simmetria: la rottura di SU(2) potrebbe influenzare la precisione di alcune osservabili
  4. Generalizzabilità sconosciuta: le prestazioni su altri sistemi frustrati rimangono da verificare

Impatto

  1. Contributo Metodologico: fornisce un esempio importante dell'applicazione di NQS a sistemi frustrati
  2. Trasferibilità Tecnica: la strategia di riaddestramenti iterativi può essere applicata ad altri problemi di molti corpi quantistici
  3. Valore di Benchmark: fornisce nuovi risultati numerici ad alta precisione per il TLAHM
  4. Significato Ispirativo: rivela il ruolo importante delle trasformazioni di base nell'apprendimento automatico quantistico

Scenari di Applicazione

  1. Magneti Quantistici Frustrati Bidimensionali: particolarmente adatto a sistemi con frustrazione geometrica
  2. Studio di Finite-Size Scaling: i vantaggi di scalabilità della RNN sono evidenti
  3. Calcolo di Proprietà dello Stato Fondamentale: energia, magnetizzazione e altre osservabili dello stato fondamentale
  4. Ricerca Metodologica: come problema benchmark per testare nuove architetture NQS

Riferimenti Bibliografici

Questo articolo cita importanti riferimenti nel campo, includendo:

  • Lavori fondamentali di Anderson sulla teoria della risonanza dei legami di valenza
  • Risultati di diagonalizzazione esatta di Bernu e colleghi
  • Ricerca di Monte Carlo della funzione di Green di Capriotti e colleghi
  • Lavoro fondativo di Carleo-Troyer sugli stati quantistici neurali
  • Risultati recenti ad alta precisione di DMRG e iPEPS

Valutazione Complessiva: Questo è un articolo di alta qualità di fisica computazionale con importanti contributi sia dal punto di vista metodologico che applicativo. Attraverso la combinazione intelligente di trasformazioni di base, annealing variazionale e riaddestramenti iterativi, ha affrontato con successo il difficile problema del TLAHM, aprendo nuove strade per l'applicazione degli stati quantistici neurali a sistemi frustrati. Nonostante alcune insufficienze nella comprensione teorica, il suo valore pratico e il suo significato ispirativo lo rendono un importante progresso in questo campo.