2025-11-25T09:01:17.655044

Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice

Moss, Wiersema, Hibat-Allah et al.
Variational Monte Carlo simulations have been crucial for understanding quantum many-body systems, especially when the Hamiltonian is frustrated and the ground-state wavefunction has a non-trivial sign structure. In this paper, we use recurrent neural network (RNN) wavefunction ansätze to study the triangular-lattice antiferromagnetic Heisenberg model (TLAHM) for lattice sizes up to $30\times30$. In a recent study [M. S. Moss et al. arXiv:2502.17144], the authors demonstrated how RNN wavefunctions can be iteratively retrained in order to obtain variational results for multiple lattice sizes with a reasonable amount of compute. That study, which looked at the sign-free, square-lattice antiferromagnetic Heisenberg model, showed favorable scaling properties, allowing accurate finite-size extrapolations to the thermodynamic limit. In contrast, our present results illustrate in detail the relative difficulty in simulating the sign-problematic TLAHM. We find that the accuracy of our simulations can be significantly improved by transforming the Hamiltonian with a judicious choice of basis rotation. We also show that a similar benefit can be achieved by using variational neural annealing, an alternative optimization technique that minimizes a pseudo free energy. Ultimately, we are able to obtain estimates of the ground-state properties of the TLAHM in the thermodynamic limit that are in close agreement with values in the literature, showing that RNN wavefunctions provide a powerful toolbox for performing finite-size scaling studies for frustrated quantum many-body systems.
academic

पुनरावर्ती तंत्रिका नेटवर्क तरंग कार्यों का उपयोग करके त्रिकोणीय जाली पर हाइजेनबर्ग प्रतिचुंबकों के बड़े पैमाने पर सिमुलेशन

मूल जानकारी

  • पेपर ID: 2505.20406
  • शीर्षक: पुनरावर्ती तंत्रिका नेटवर्क तरंग कार्यों का उपयोग करके त्रिकोणीय जाली पर हाइजेनबर्ग प्रतिचुंबकों के बड़े पैमाने पर सिमुलेशन
  • लेखक: M. Schuyler Moss, Roeland Wiersema, Mohamed Hibat-Allah, Juan Carrasquilla, Roger G. Melko
  • वर्गीकरण: cond-mat.str-el cond-mat.dis-nn quant-ph
  • प्रकाशन समय: 25 अक्टूबर 2025 (arXiv संस्करण v3)
  • पेपर लिंक: https://arxiv.org/abs/2505.20406

सारांश

यह पेपर पुनरावर्ती तंत्रिका नेटवर्क (RNN) तरंग कार्य ansätze का उपयोग करके त्रिकोणीय जाली प्रतिचुंबकीय हाइजेनबर्ग मॉडल (TLAHM) का अध्ययन करता है, जिसमें 30×30 तक की प्रणाली के आकार हैं। पहले अध्ययन किए गए वर्ग जाली मॉडल के विपरीत, जिसमें कोई चिन्ह समस्या नहीं है, TLAHM में जटिल चिन्ह संरचना है, जो संख्यात्मक सिमुलेशन को अधिक कठिन बनाता है। अनुसंधान से पता चलता है कि उचित आधार परिवर्तन और परिवर्तनशील तंत्रिका एनीलिंग तकनीक के माध्यम से सिमुलेशन सटीकता में उल्लेखनीय सुधार किया जा सकता है, अंततः प्राप्त थर्मोडायनामिक सीमा आधार अवस्था गुण साहित्य मानों के साथ अत्यधिक सुसंगत हैं, जो बाधित क्वांटम बहु-शरीर प्रणालियों के परिमित आकार स्केलिंग अध्ययन में RNN तरंग कार्यों की शक्तिशाली क्षमता को प्रमाणित करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की महत्ता

त्रिकोणीय जाली प्रतिचुंबकीय हाइजेनबर्ग मॉडल (TLAHM) बाधित क्वांटम चुंबकत्व के मानक उदाहरणों में से एक है। यद्यपि अब ज्ञात है कि इसकी आधार अवस्था 120° चुंबकीय क्रम प्रदर्शित करती है, ज्यामितीय बाधा की उपस्थिति के कारण इस प्रणाली का संख्यात्मक अध्ययन अत्यंत चुनौतीपूर्ण है। वर्ग जाली के विपरीत, TLAHM में चिन्ह समस्या है, जो क्वांटम मोंटे कार्लो (QMC) सिमुलेशन को कठिन बनाती है।

मौजूदा विधियों की सीमाएं

  1. सटीक विकर्णीकरण: केवल छोटी प्रणाली आकार तक सीमित, परिमित आकार प्रभाव गंभीर
  2. पारंपरिक परिवर्तनशील मोंटे कार्लो: ansätze की पसंद पर निर्भर, सटीकता सीमित
  3. QMC विधि: चिन्ह समस्या से ग्रस्त, नियंत्रित त्रुटि प्राप्त करना कठिन

अनुसंधान प्रेरणा

तंत्रिका क्वांटम अवस्था (NQS) उच्च अभिव्यक्ति शक्ति वाले परिवर्तनशील ansätze के रूप में हाल ही में ध्यान आकर्षित कर रहे हैं, लेकिन बाधा और गैर-तुच्छ चिन्ह संरचना को NQS अनुकूलन के संभावित बाधा माना जाता है। TLAHM इसलिए NQS प्रदर्शन का परीक्षण करने के लिए एक महत्वपूर्ण बेंचमार्क बन जाता है, यह पेपर इस तरह की कठिन प्रणालियों में RNN तरंग कार्यों की प्रभावशीलता को सत्यापित करने का लक्ष्य रखता है।

मुख्य योगदान

  1. पहली बार पुनरावर्ती पुनः प्रशिक्षण RNN तरंग कार्यों को TLAHM पर सफलतापूर्वक लागू किया, 30×30 प्रणाली के बड़े पैमाने पर सिमुलेशन को प्राप्त किया
  2. आधार परिवर्तन के सिमुलेशन सटीकता पर प्रभाव का व्यवस्थित अध्ययन किया, पाया कि 120° परिवर्तन Marshall-Peierls चिन्ह नियम की तुलना में परिणामों में उल्लेखनीय सुधार कर सकता है
  3. परिवर्तनशील तंत्रिका एनीलिंग (VNA) तकनीक पेश की, छद्म मुक्त ऊर्जा को कम करके बाधा द्वारा लाई गई अनुकूलन कठिनाइयों को प्रभावी ढंग से दूर किया
  4. परिमित आकार स्केलिंग के माध्यम से थर्मोडायनामिक सीमा गुण प्राप्त किए, आधार अवस्था ऊर्जा और उप-जाली चुंबकीकरण तीव्रता साहित्य बेंचमार्क मानों के साथ अत्यधिक सुसंगत
  5. विस्तृत कम्प्यूटेशनल जटिलता और रन टाइम विश्लेषण प्रदान किया, विधि की व्यावहारिकता को प्रमाणित किया

विधि विवरण

कार्य परिभाषा

TLAHM की आधार अवस्था गुणों का अध्ययन: H^=ijSiSj\hat{H} = \sum_{\langle ij \rangle} \vec{S}_i \cdot \vec{S}_j जहां i,j\langle i,j \rangle त्रिकोणीय जाली पर निकटतम-पड़ोसी अंतःक्रिया को दर्शाता है, Si\vec{S}_i स्पिन-1/2 संचालक है।

मॉडल आर्किटेक्चर

RNN तरंग कार्य डिजाइन

द्वि-आयामी पुनरावर्ती तंत्रिका नेटवर्क का उपयोग करके तरंग कार्य का निर्माण: p(σ)=p(σ1)p(σ2σ1)p(σNσN1,,σ1)p(|\sigma\rangle) = p(\sigma_1)p(\sigma_2|\sigma_1)\cdots p(\sigma_N|\sigma_{N-1},\ldots,\sigma_1)

मुख्य घटक:

  1. गेटेड पुनरावर्ती इकाई (GRU): छिपे हुए वेक्टर सूचना संचरण को संभालता है
  2. जटिल चरण पैरामीटरीकरण: गैर-तुच्छ चिन्ह संरचना को संभालता है ΨW(σ)=exp[iϕW(σ)]pW(σ)\Psi_W(\sigma) = \exp[i\phi_W(\sigma)]\sqrt{p_W(\sigma)}
  3. छद्म आवधिक सीमा शर्तें: कारण संबंध बनाए रखते हुए आवधिक प्रणाली का अनुकरण करता है

आधार परिवर्तन तकनीक

Marshall-Peierls परिवर्तन (UsqU_{sq}): Usq=exp(iπjBsqS^jz)U_{sq} = \exp\left(-i\pi\sum_{j\in B_{sq}}\hat{S}^z_j\right)

120° परिवर्तन (UtriU_{tri}): Utri=exp(2πi3[bBtriS^bzcCtriS^cz])U_{tri} = \exp\left(-\frac{2\pi i}{3}\left[\sum_{b\in B_{tri}}\hat{S}^z_b - \sum_{c\in C_{tri}}\hat{S}^z_c\right]\right)

परिवर्तनशील तंत्रिका एनीलिंग

छद्म मुक्त ऊर्जा को कम करता है: FW(t)=EWT(t)Sclassical(pW)F_W(t) = E_W - T(t)S_{classical}(p_W) जहां T(t)T(t) एनीलिंग तापमान है, SclassicalS_{classical} Shannon एंट्रॉपी है।

तकनीकी नवाचार बिंदु

  1. वजन साझाकरण तंत्र: RNN पैरामीटर संख्या प्रणाली आकार से स्वतंत्र है, पुनरावर्ती पुनः प्रशिक्षण का समर्थन करता है
  2. समरूपता औसत: केवल तरंग कार्य आयाम पर C6vC_{6v} समूह औसत लागू करता है, चरण औसत के संख्यात्मक अस्थिरता से बचता है
  3. पैरामीटरीकृत प्रशिक्षण योजना: Nsteps(L,s,r;L0,C,F)=s×[Cexp(r(LL0))+F]N_{steps}(L,s,r;L_0,C,F) = s \times [C\exp(-r(L-L_0)) + F]
  4. शून्य-विचरण एक्सट्रापोलेशन: सुधारी गई परिवर्तनशील अवस्था अनुक्रम का उपयोग करके अधिक सटीक ऊर्जा अनुमान प्राप्त करता है

प्रायोगिक सेटअप

प्रणाली पैरामीटर

  • जाली आकार: L = 6, 12, 18, 24, 30 (आवधिक सीमा शर्तें)
  • छिपा हुआ वेक्टर आयाम: dhd_h = निश्चित मान (पर्याप्त अभिव्यक्ति शक्ति सुनिश्चित करने के लिए)
  • समरूपता: U(1) समरूपता को बाध्य करता है (शून्य चुंबकीकरण), C6vC_{6v} बिंदु समूह समरूपता लागू करता है

प्रशिक्षण रणनीति

चार-चरण प्रशिक्षण (L=6):

  1. निश्चित सीखने की दर γ=5×104\gamma = 5 \times 10^{-4}, तापमान T0T_0
  2. परिवर्तनशील तंत्रिका एनीलिंग: रैखिक रूप से 0 तक ठंडा करना
  3. सीखने की दर क्षय: γ(t)=γ0×(1+(t/δ))1\gamma(t) = \gamma_0 \times (1+(t/\delta))^{-1}
  4. समरूपता लागू करना, अंतिम अनुकूलन

पुनरावर्ती पुनः प्रशिक्षण: छोटे आकार के अनुकूलन परिणामों का उपयोग करके बड़े आकार के प्रशिक्षण को आरंभ करता है

मूल्यांकन संकेतक

  1. परिवर्तनशील ऊर्जा: EW=ΨWH^ΨW/ΨWΨWE_W = \langle\Psi_W|\hat{H}|\Psi_W\rangle/\langle\Psi_W|\Psi_W\rangle
  2. ऊर्जा विचरण: आइजेनस्टेट के साथ निकटता को मापता है
  3. V-स्कोर: V=Nvar(E)/(EE)2V = N\text{var}(E)/(E-E_\infty)^2
  4. उप-जाली चुंबकीकरण तीव्रता: गति स्थान सहसंबंध कार्य के माध्यम से गणना की जाती है

प्रायोगिक परिणाम

मुख्य परिणाम

आधार परिवर्तन प्रभाव तुलना (L=6)

  • कोई परिवर्तन/Marshall-Peierls परिवर्तन: सटीक परिणाम प्राप्त करने के लिए उच्च तापमान एनीलिंग (T0=1.0T_0 = 1.0) की आवश्यकता है
  • 120° परिवर्तन: एनीलिंग तापमान के प्रति असंवेदनशील, T0=0T_0 = 0 पर भी उत्कृष्ट परिणाम प्राप्त कर सकता है
  • इष्टतम ऊर्जा: -0.5562(2) (सटीक विकर्णीकरण परिणाम -0.5603734 के करीब)

परिमित आकार स्केलिंग परिणाम

ऊर्जा स्केलिंग (E(L)=E+e1/L3E(L) = E_\infty + e_1/L^3 का उपयोग करके):

  • शून्य-विचरण एक्सट्रापोलेशन ऊर्जा: E=0.5517569(9)E_\infty = -0.5517569(9)
  • DMRG बेंचमार्क: EDMRG=0.5503(8)E_\infty^{DMRG} = -0.5503(8)
  • iPEPS बेंचमार्क: EiPEPS=0.55161(6)E_\infty^{iPEPS} = -0.55161(6)

उप-जाली चुंबकीकरण तीव्रता:

  • M=0.192(2)M_\infty = 0.192(2) (M2M^2 एक्सट्रापोलेशन से)
  • M=0.198(2)M_\infty = 0.198(2) (MC2M^2_C एक्सट्रापोलेशन से)
  • DMRG बेंचमार्क: MDMRG=0.208(8)M_\infty^{DMRG} = 0.208(8)

कम्प्यूटेशनल जटिलता विश्लेषण

  • एकल-चरण प्रशिक्षण समय: O(L4)O(L^4) स्केलिंग
  • कुल रन टाइम: सबसे लंबा सिमुलेशन 1700 GPU घंटे (6 प्रणाली आकार को कवर करता है)
  • पैरामीटरीकृत प्रशिक्षण योजना बड़े आकार की प्रणालियों की कम्प्यूटेशनल लागत को प्रभावी ढंग से नियंत्रित करता है

महत्वपूर्ण निष्कर्ष

  1. SU(2) समरूपता टूटना: RNN द्वारा सीखी गई अवस्था Anderson टावर अवस्था का अध्यारोपण है, न कि सच्ची सिंगलेट अवस्था
  2. चिन्ह संरचना की महत्ता: 120° परिवर्तन की सफलता गैर-तुच्छ चिन्ह संरचना सीखने के लिए आधार चयन की महत्वपूर्ण भूमिका को प्रमाणित करती है
  3. VNA की प्रभावशीलता: उप-इष्टतम आधार में भी उचित एनीलिंग के माध्यम से अच्छे परिणाम प्राप्त कर सकता है

संबंधित कार्य

क्वांटम बहु-शरीर प्रणाली संख्यात्मक विधि

  • DMRG: बेलनाकार ज्यामिति में महत्वपूर्ण प्रगति
  • iPEPS: थर्मोडायनामिक सीमा आधार अवस्था को सीधे पैरामीटरीकृत करता है
  • पारंपरिक VMC: प्रक्षेपण तरंग कार्य आदि ansätze का उपयोग करता है

तंत्रिका क्वांटम अवस्था विकास

  • RBM: सबसे प्रारंभिक NQS आर्किटेक्चर
  • CNN: अनुवाद अपरिवर्तनीयता का उपयोग करता है
  • Transformer: दीर्घ-श्रेणी सहसंबंध को संभालता है
  • RNN: इस पेपर का ध्यान केंद्र, पुनरावर्ती पुनः प्रशिक्षण का समर्थन करता है

TLAHM विशेष अनुसंधान

ऐतिहासिक रूप से आधार अवस्था गुणों पर विवाद था, अंततः Green फ़ंक्शन मोंटे कार्लो आदि विधियों द्वारा 120° प्रतिचुंबकीय क्रम अवस्था की पुष्टि की गई।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. RNN तरंग कार्य TLAHM को सफलतापूर्वक मॉडल कर सकते हैं, भले ही बाधा और गैर-तुच्छ चिन्ह संरचना मौजूद हो
  2. आधार परिवर्तन और VNA मुख्य तकनीकें हैं, अनुकूलन प्रभाव में उल्लेखनीय सुधार करती हैं
  3. पुनरावर्ती पुनः प्रशिक्षण रणनीति प्रभावी है, बड़े पैमाने की प्रणालियों के कुशल सिमुलेशन को प्राप्त करती है
  4. थर्मोडायनामिक सीमा परिणाम बेंचमार्क के साथ सुसंगत हैं, विधि की विश्वसनीयता को सत्यापित करता है

सीमाएं

  1. वर्ग जाली की तुलना में अधिक कम्प्यूटेशनल संसाधन की आवश्यकता: न्यूनतम क्षय दर 0.25 से 0.158 तक गिरता है
  2. V-स्कोर खराब है: TLAHM वास्तव में अधिक कठिन अनुकूलन समस्या है
  3. SU(2) समरूपता पूरी तरह से संरक्षित नहीं है: कुछ भौतिक मात्राओं की सटीकता को प्रभावित कर सकता है
  4. अभी भी Adam अनुकूलक की आवश्यकता है: SR जैसी उन्नत अनुकूलन विधियां RNN के लिए प्रभावी नहीं हैं

भविष्य की दिशाएं

  1. चिन्ह संरचना का व्यवस्थित अध्ययन: आधार परिवर्तन सफलता के गहरे कारणों को समझना
  2. अधिक उन्नत अनुकूलन एल्गोरिदम: RNN के लिए उपयुक्त SR वेरिएंट की खोज करना
  3. अन्य बाधित प्रणालियां: kagome जाली आदि ज्यामितीय संरचनाओं तक विस्तार करना
  4. क्वांटम चरण संक्रमण अनुसंधान: स्केलेबिलिटी का उपयोग करके महत्वपूर्ण घटनाओं का अध्ययन करना

गहन मूल्यांकन

शक्तियां

  1. तकनीकी नवाचार शक्तिशाली है: पहली बार पुनरावर्ती पुनः प्रशिक्षण RNN को कठिन बाधित प्रणाली पर सफलतापूर्वक लागू किया
  2. प्रायोगिक डिजाइन संपूर्ण है: विभिन्न आधार परिवर्तन और अनुकूलन रणनीतियों के प्रभाव की व्यवस्थित तुलना
  3. परिणाम विश्वसनीयता उच्च है: कई विधियों द्वारा सत्यापित, स्वतंत्र बेंचमार्क के साथ अत्यधिक सुसंगत
  4. व्यावहारिक मूल्य बड़ा है: बड़े पैमाने की बाधित क्वांटम प्रणालियों को संभालने के लिए प्रभावी उपकरण प्रदान करता है
  5. विश्लेषण गहन है: अनुकूलन दृष्टिकोण से चिन्ह समस्या के प्रभाव को समझता है

कमियां

  1. सैद्धांतिक समझ सीमित है: 120° परिवर्तन सफलता के तंत्र की गहन विश्लेषण की कमी
  2. कम्प्यूटेशनल लागत अधिक है: वर्ग जाली की तुलना में अभी भी अधिक संसाधन की आवश्यकता है
  3. समरूपता हैंडलिंग: SU(2) टूटना कुछ अवलोकन योग्य मात्राओं की सटीकता को प्रभावित कर सकता है
  4. सामान्यीकरण क्षमता अज्ञात है: अन्य बाधित प्रणालियों पर प्रदर्शन सत्यापन की प्रतीक्षा में है

प्रभाव

  1. पद्धति विज्ञान योगदान: बाधित प्रणालियों में NQS अनुप्रयोग के लिए महत्वपूर्ण उदाहरण प्रदान करता है
  2. तकनीक प्रचार योग्यता: पुनरावर्ती पुनः प्रशिक्षण रणनीति अन्य क्वांटम बहु-शरीर समस्याओं पर लागू की जा सकती है
  3. बेंचमार्क मूल्य: TLAHM के लिए नए उच्च-सटीकता संख्यात्मक परिणाम प्रदान करता है
  4. प्रेरणा महत्व: क्वांटम मशीन लर्निंग में आधार परिवर्तन की महत्वपूर्ण भूमिका को प्रकट करता है

लागू परिदृश्य

  1. द्वि-आयामी बाधित क्वांटम चुंबक: विशेष रूप से ज्यामितीय बाधित प्रणालियों के लिए उपयुक्त
  2. परिमित आकार स्केलिंग अनुसंधान: RNN की स्केलेबिलिटा लाभ स्पष्ट है
  3. आधार अवस्था गुण गणना: ऊर्जा, चुंबकीकरण तीव्रता आदि आधार अवस्था अवलोकन योग्य मात्राएं
  4. पद्धति विज्ञान अनुसंधान: नए NQS आर्किटेक्चर का परीक्षण करने के लिए बेंचमार्क समस्या के रूप में

संदर्भ

यह पेपर इस क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:

  • Anderson के अनुनाद वैलेंस बॉन्ड सिद्धांत की मौलिक कार्य
  • Bernu आदि द्वारा सटीक विकर्णीकरण बेंचमार्क परिणाम
  • Capriotti आदि द्वारा Green फ़ंक्शन मोंटे कार्लो अनुसंधान
  • Carleo-Troyer द्वारा तंत्रिका क्वांटम अवस्था की स्थापना कार्य
  • हाल के DMRG और iPEPS उच्च-सटीकता परिणाम

समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला कम्प्यूटेशनल भौतिकी पेपर है, जिसमें पद्धति विज्ञान और अनुप्रयोग दोनों स्तरों पर महत्वपूर्ण योगदान है। आधार परिवर्तन, परिवर्तनशील एनीलिंग और पुनरावर्ती पुनः प्रशिक्षण आदि तकनीकों को चतुराई से जोड़कर, TLAHM जैसी कठिन समस्या को सफलतापूर्वक हल किया गया है, जो बाधित प्रणालियों में तंत्रिका क्वांटम अवस्था के अनुप्रयोग के लिए नए रास्ते खोलता है। यद्यपि सैद्धांतिक समझ में कुछ कमियां हैं, लेकिन इसकी व्यावहारिक मूल्य और प्रेरणा महत्व इसे इस क्षेत्र की महत्वपूर्ण प्रगति बनाते हैं।