2025-11-25T09:01:17.655044

Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice

Moss, Wiersema, Hibat-Allah et al.

Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansÃ¤tze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.

academic

पुनरावर्ती तंत्रिका नेटवर्क तरंग कार्यों का उपयोग करके त्रिकोणीय जाली पर हाइजेनबर्ग प्रतिचुंबकों के बड़े पैमाने पर सिमुलेशन

मूल जानकारी

पेपर ID: 2505.20406
शीर्षक: पुनरावर्ती तंत्रिका नेटवर्क तरंग कार्यों का उपयोग करके त्रिकोणीय जाली पर हाइजेनबर्ग प्रतिचुंबकों के बड़े पैमाने पर सिमुलेशन
लेखक: M. Schuyler Moss, Roeland Wiersema, Mohamed Hibat-Allah, Juan Carrasquilla, Roger G. Melko
वर्गीकरण: cond-mat.str-el cond-mat.dis-nn quant-ph
प्रकाशन समय: 25 अक्टूबर 2025 (arXiv संस्करण v3)
पेपर लिंक: https://arxiv.org/abs/2505.20406

सारांश

यह पेपर पुनरावर्ती तंत्रिका नेटवर्क (RNN) तरंग कार्य ansätze का उपयोग करके त्रिकोणीय जाली प्रतिचुंबकीय हाइजेनबर्ग मॉडल (TLAHM) का अध्ययन करता है, जिसमें 30×30 तक की प्रणाली के आकार हैं। पहले अध्ययन किए गए वर्ग जाली मॉडल के विपरीत, जिसमें कोई चिन्ह समस्या नहीं है, TLAHM में जटिल चिन्ह संरचना है, जो संख्यात्मक सिमुलेशन को अधिक कठिन बनाता है। अनुसंधान से पता चलता है कि उचित आधार परिवर्तन और परिवर्तनशील तंत्रिका एनीलिंग तकनीक के माध्यम से सिमुलेशन सटीकता में उल्लेखनीय सुधार किया जा सकता है, अंततः प्राप्त थर्मोडायनामिक सीमा आधार अवस्था गुण साहित्य मानों के साथ अत्यधिक सुसंगत हैं, जो बाधित क्वांटम बहु-शरीर प्रणालियों के परिमित आकार स्केलिंग अध्ययन में RNN तरंग कार्यों की शक्तिशाली क्षमता को प्रमाणित करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की महत्ता

त्रिकोणीय जाली प्रतिचुंबकीय हाइजेनबर्ग मॉडल (TLAHM) बाधित क्वांटम चुंबकत्व के मानक उदाहरणों में से एक है। यद्यपि अब ज्ञात है कि इसकी आधार अवस्था 120° चुंबकीय क्रम प्रदर्शित करती है, ज्यामितीय बाधा की उपस्थिति के कारण इस प्रणाली का संख्यात्मक अध्ययन अत्यंत चुनौतीपूर्ण है। वर्ग जाली के विपरीत, TLAHM में चिन्ह समस्या है, जो क्वांटम मोंटे कार्लो (QMC) सिमुलेशन को कठिन बनाती है।

मौजूदा विधियों की सीमाएं

सटीक विकर्णीकरण: केवल छोटी प्रणाली आकार तक सीमित, परिमित आकार प्रभाव गंभीर
पारंपरिक परिवर्तनशील मोंटे कार्लो: ansätze की पसंद पर निर्भर, सटीकता सीमित
QMC विधि: चिन्ह समस्या से ग्रस्त, नियंत्रित त्रुटि प्राप्त करना कठिन

अनुसंधान प्रेरणा

तंत्रिका क्वांटम अवस्था (NQS) उच्च अभिव्यक्ति शक्ति वाले परिवर्तनशील ansätze के रूप में हाल ही में ध्यान आकर्षित कर रहे हैं, लेकिन बाधा और गैर-तुच्छ चिन्ह संरचना को NQS अनुकूलन के संभावित बाधा माना जाता है। TLAHM इसलिए NQS प्रदर्शन का परीक्षण करने के लिए एक महत्वपूर्ण बेंचमार्क बन जाता है, यह पेपर इस तरह की कठिन प्रणालियों में RNN तरंग कार्यों की प्रभावशीलता को सत्यापित करने का लक्ष्य रखता है।

मुख्य योगदान

पहली बार पुनरावर्ती पुनः प्रशिक्षण RNN तरंग कार्यों को TLAHM पर सफलतापूर्वक लागू किया, 30×30 प्रणाली के बड़े पैमाने पर सिमुलेशन को प्राप्त किया
आधार परिवर्तन के सिमुलेशन सटीकता पर प्रभाव का व्यवस्थित अध्ययन किया, पाया कि 120° परिवर्तन Marshall-Peierls चिन्ह नियम की तुलना में परिणामों में उल्लेखनीय सुधार कर सकता है
परिवर्तनशील तंत्रिका एनीलिंग (VNA) तकनीक पेश की, छद्म मुक्त ऊर्जा को कम करके बाधा द्वारा लाई गई अनुकूलन कठिनाइयों को प्रभावी ढंग से दूर किया
परिमित आकार स्केलिंग के माध्यम से थर्मोडायनामिक सीमा गुण प्राप्त किए, आधार अवस्था ऊर्जा और उप-जाली चुंबकीकरण तीव्रता साहित्य बेंचमार्क मानों के साथ अत्यधिक सुसंगत
विस्तृत कम्प्यूटेशनल जटिलता और रन टाइम विश्लेषण प्रदान किया, विधि की व्यावहारिकता को प्रमाणित किया

विधि विवरण

कार्य परिभाषा

TLAHM की आधार अवस्था गुणों का अध्ययन: $\hat{H} = \sum_{\langle ij \rangle} \vec{S}_i \cdot \vec{S}_j$ जहां $\langle i,j \rangle$ त्रिकोणीय जाली पर निकटतम-पड़ोसी अंतःक्रिया को दर्शाता है, $\vec{S}_i$ स्पिन-1/2 संचालक है।

मॉडल आर्किटेक्चर

RNN तरंग कार्य डिजाइन

द्वि-आयामी पुनरावर्ती तंत्रिका नेटवर्क का उपयोग करके तरंग कार्य का निर्माण: $p(|\sigma\rangle) = p(\sigma_1)p(\sigma_2|\sigma_1)\cdots p(\sigma_N|\sigma_{N-1},\ldots,\sigma_1)$

मुख्य घटक:

गेटेड पुनरावर्ती इकाई (GRU): छिपे हुए वेक्टर सूचना संचरण को संभालता है
जटिल चरण पैरामीटरीकरण: गैर-तुच्छ चिन्ह संरचना को संभालता है $\Psi_W(\sigma) = \exp[i\phi_W(\sigma)]\sqrt{p_W(\sigma)}$
छद्म आवधिक सीमा शर्तें: कारण संबंध बनाए रखते हुए आवधिक प्रणाली का अनुकरण करता है

आधार परिवर्तन तकनीक

Marshall-Peierls परिवर्तन ( $U_{sq}$ ): $U_{sq} = \exp\left(-i\pi\sum_{j\in B_{sq}}\hat{S}^z_j\right)$

120° परिवर्तन ( $U_{tri}$ ): $U_{tri} = \exp\left(-\frac{2\pi i}{3}\left[\sum_{b\in B_{tri}}\hat{S}^z_b - \sum_{c\in C_{tri}}\hat{S}^z_c\right]\right)$

परिवर्तनशील तंत्रिका एनीलिंग

छद्म मुक्त ऊर्जा को कम करता है: $F_W(t) = E_W - T(t)S_{classical}(p_W)$ जहां $T(t)$ एनीलिंग तापमान है, $S_{classical}$ Shannon एंट्रॉपी है।

तकनीकी नवाचार बिंदु

वजन साझाकरण तंत्र: RNN पैरामीटर संख्या प्रणाली आकार से स्वतंत्र है, पुनरावर्ती पुनः प्रशिक्षण का समर्थन करता है
समरूपता औसत: केवल तरंग कार्य आयाम पर $C_{6v}$ समूह औसत लागू करता है, चरण औसत के संख्यात्मक अस्थिरता से बचता है
पैरामीटरीकृत प्रशिक्षण योजना: $N_{steps}(L,s,r;L_0,C,F) = s \times [C\exp(-r(L-L_0)) + F]$
शून्य-विचरण एक्सट्रापोलेशन: सुधारी गई परिवर्तनशील अवस्था अनुक्रम का उपयोग करके अधिक सटीक ऊर्जा अनुमान प्राप्त करता है

प्रायोगिक सेटअप

प्रणाली पैरामीटर

जाली आकार: L = 6, 12, 18, 24, 30 (आवधिक सीमा शर्तें)
छिपा हुआ वेक्टर आयाम: $d_h$ = निश्चित मान (पर्याप्त अभिव्यक्ति शक्ति सुनिश्चित करने के लिए)
समरूपता: U(1) समरूपता को बाध्य करता है (शून्य चुंबकीकरण), $C_{6v}$ बिंदु समूह समरूपता लागू करता है

प्रशिक्षण रणनीति

चार-चरण प्रशिक्षण (L=6):

निश्चित सीखने की दर $\gamma = 5 \times 10^{-4}$ , तापमान $T_0$
परिवर्तनशील तंत्रिका एनीलिंग: रैखिक रूप से 0 तक ठंडा करना
सीखने की दर क्षय: $\gamma(t) = \gamma_0 \times (1+(t/\delta))^{-1}$
समरूपता लागू करना, अंतिम अनुकूलन

पुनरावर्ती पुनः प्रशिक्षण: छोटे आकार के अनुकूलन परिणामों का उपयोग करके बड़े आकार के प्रशिक्षण को आरंभ करता है

मूल्यांकन संकेतक

परिवर्तनशील ऊर्जा: $E_W = \langle\Psi_W|\hat{H}|\Psi_W\rangle/\langle\Psi_W|\Psi_W\rangle$
ऊर्जा विचरण: आइजेनस्टेट के साथ निकटता को मापता है
V-स्कोर: $V = N\text{var}(E)/(E-E_\infty)^2$
उप-जाली चुंबकीकरण तीव्रता: गति स्थान सहसंबंध कार्य के माध्यम से गणना की जाती है

प्रायोगिक परिणाम

मुख्य परिणाम

आधार परिवर्तन प्रभाव तुलना (L=6)

कोई परिवर्तन/Marshall-Peierls परिवर्तन: सटीक परिणाम प्राप्त करने के लिए उच्च तापमान एनीलिंग ( $T_0 = 1.0$ ) की आवश्यकता है
120° परिवर्तन: एनीलिंग तापमान के प्रति असंवेदनशील, $T_0 = 0$ पर भी उत्कृष्ट परिणाम प्राप्त कर सकता है
इष्टतम ऊर्जा: -0.5562(2) (सटीक विकर्णीकरण परिणाम -0.5603734 के करीब)

परिमित आकार स्केलिंग परिणाम

ऊर्जा स्केलिंग ( $E(L) = E_\infty + e_1/L^3$ का उपयोग करके):

शून्य-विचरण एक्सट्रापोलेशन ऊर्जा: $E_\infty = -0.5517569(9)$
DMRG बेंचमार्क: $E_\infty^{DMRG} = -0.5503(8)$
iPEPS बेंचमार्क: $E_\infty^{iPEPS} = -0.55161(6)$

उप-जाली चुंबकीकरण तीव्रता:

$M_\infty = 0.192(2)$ ( $M^2$ एक्सट्रापोलेशन से)
$M_\infty = 0.198(2)$ ( $M^2_C$ एक्सट्रापोलेशन से)
DMRG बेंचमार्क: $M_\infty^{DMRG} = 0.208(8)$

कम्प्यूटेशनल जटिलता विश्लेषण

एकल-चरण प्रशिक्षण समय: $O(L^4)$ स्केलिंग
कुल रन टाइम: सबसे लंबा सिमुलेशन 1700 GPU घंटे (6 प्रणाली आकार को कवर करता है)
पैरामीटरीकृत प्रशिक्षण योजना बड़े आकार की प्रणालियों की कम्प्यूटेशनल लागत को प्रभावी ढंग से नियंत्रित करता है

महत्वपूर्ण निष्कर्ष

SU(2) समरूपता टूटना: RNN द्वारा सीखी गई अवस्था Anderson टावर अवस्था का अध्यारोपण है, न कि सच्ची सिंगलेट अवस्था
चिन्ह संरचना की महत्ता: 120° परिवर्तन की सफलता गैर-तुच्छ चिन्ह संरचना सीखने के लिए आधार चयन की महत्वपूर्ण भूमिका को प्रमाणित करती है
VNA की प्रभावशीलता: उप-इष्टतम आधार में भी उचित एनीलिंग के माध्यम से अच्छे परिणाम प्राप्त कर सकता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

RNN तरंग कार्य TLAHM को सफलतापूर्वक मॉडल कर सकते हैं, भले ही बाधा और गैर-तुच्छ चिन्ह संरचना मौजूद हो
आधार परिवर्तन और VNA मुख्य तकनीकें हैं, अनुकूलन प्रभाव में उल्लेखनीय सुधार करती हैं
पुनरावर्ती पुनः प्रशिक्षण रणनीति प्रभावी है, बड़े पैमाने की प्रणालियों के कुशल सिमुलेशन को प्राप्त करती है
थर्मोडायनामिक सीमा परिणाम बेंचमार्क के साथ सुसंगत हैं, विधि की विश्वसनीयता को सत्यापित करता है

सीमाएं

वर्ग जाली की तुलना में अधिक कम्प्यूटेशनल संसाधन की आवश्यकता: न्यूनतम क्षय दर 0.25 से 0.158 तक गिरता है
V-स्कोर खराब है: TLAHM वास्तव में अधिक कठिन अनुकूलन समस्या है
SU(2) समरूपता पूरी तरह से संरक्षित नहीं है: कुछ भौतिक मात्राओं की सटीकता को प्रभावित कर सकता है
अभी भी Adam अनुकूलक की आवश्यकता है: SR जैसी उन्नत अनुकूलन विधियां RNN के लिए प्रभावी नहीं हैं

भविष्य की दिशाएं

चिन्ह संरचना का व्यवस्थित अध्ययन: आधार परिवर्तन सफलता के गहरे कारणों को समझना
अधिक उन्नत अनुकूलन एल्गोरिदम: RNN के लिए उपयुक्त SR वेरिएंट की खोज करना
अन्य बाधित प्रणालियां: kagome जाली आदि ज्यामितीय संरचनाओं तक विस्तार करना
क्वांटम चरण संक्रमण अनुसंधान: स्केलेबिलिटी का उपयोग करके महत्वपूर्ण घटनाओं का अध्ययन करना

गहन मूल्यांकन

शक्तियां

तकनीकी नवाचार शक्तिशाली है: पहली बार पुनरावर्ती पुनः प्रशिक्षण RNN को कठिन बाधित प्रणाली पर सफलतापूर्वक लागू किया
प्रायोगिक डिजाइन संपूर्ण है: विभिन्न आधार परिवर्तन और अनुकूलन रणनीतियों के प्रभाव की व्यवस्थित तुलना
परिणाम विश्वसनीयता उच्च है: कई विधियों द्वारा सत्यापित, स्वतंत्र बेंचमार्क के साथ अत्यधिक सुसंगत
व्यावहारिक मूल्य बड़ा है: बड़े पैमाने की बाधित क्वांटम प्रणालियों को संभालने के लिए प्रभावी उपकरण प्रदान करता है
विश्लेषण गहन है: अनुकूलन दृष्टिकोण से चिन्ह समस्या के प्रभाव को समझता है

कमियां

सैद्धांतिक समझ सीमित है: 120° परिवर्तन सफलता के तंत्र की गहन विश्लेषण की कमी
कम्प्यूटेशनल लागत अधिक है: वर्ग जाली की तुलना में अभी भी अधिक संसाधन की आवश्यकता है
समरूपता हैंडलिंग: SU(2) टूटना कुछ अवलोकन योग्य मात्राओं की सटीकता को प्रभावित कर सकता है
सामान्यीकरण क्षमता अज्ञात है: अन्य बाधित प्रणालियों पर प्रदर्शन सत्यापन की प्रतीक्षा में है

प्रभाव

पद्धति विज्ञान योगदान: बाधित प्रणालियों में NQS अनुप्रयोग के लिए महत्वपूर्ण उदाहरण प्रदान करता है
तकनीक प्रचार योग्यता: पुनरावर्ती पुनः प्रशिक्षण रणनीति अन्य क्वांटम बहु-शरीर समस्याओं पर लागू की जा सकती है
बेंचमार्क मूल्य: TLAHM के लिए नए उच्च-सटीकता संख्यात्मक परिणाम प्रदान करता है
प्रेरणा महत्व: क्वांटम मशीन लर्निंग में आधार परिवर्तन की महत्वपूर्ण भूमिका को प्रकट करता है

लागू परिदृश्य

द्वि-आयामी बाधित क्वांटम चुंबक: विशेष रूप से ज्यामितीय बाधित प्रणालियों के लिए उपयुक्त
परिमित आकार स्केलिंग अनुसंधान: RNN की स्केलेबिलिटा लाभ स्पष्ट है
आधार अवस्था गुण गणना: ऊर्जा, चुंबकीकरण तीव्रता आदि आधार अवस्था अवलोकन योग्य मात्राएं
पद्धति विज्ञान अनुसंधान: नए NQS आर्किटेक्चर का परीक्षण करने के लिए बेंचमार्क समस्या के रूप में

संदर्भ

यह पेपर इस क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:

Anderson के अनुनाद वैलेंस बॉन्ड सिद्धांत की मौलिक कार्य
Bernu आदि द्वारा सटीक विकर्णीकरण बेंचमार्क परिणाम
Capriotti आदि द्वारा Green फ़ंक्शन मोंटे कार्लो अनुसंधान
Carleo-Troyer द्वारा तंत्रिका क्वांटम अवस्था की स्थापना कार्य
हाल के DMRG और iPEPS उच्च-सटीकता परिणाम

समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला कम्प्यूटेशनल भौतिकी पेपर है, जिसमें पद्धति विज्ञान और अनुप्रयोग दोनों स्तरों पर महत्वपूर्ण योगदान है। आधार परिवर्तन, परिवर्तनशील एनीलिंग और पुनरावर्ती पुनः प्रशिक्षण आदि तकनीकों को चतुराई से जोड़कर, TLAHM जैसी कठिन समस्या को सफलतापूर्वक हल किया गया है, जो बाधित प्रणालियों में तंत्रिका क्वांटम अवस्था के अनुप्रयोग के लिए नए रास्ते खोलता है। यद्यपि सैद्धांतिक समझ में कुछ कमियां हैं, लेकिन इसकी व्यावहारिक मूल्य और प्रेरणा महत्व इसे इस क्षेत्र की महत्वपूर्ण प्रगति बनाते हैं।