Simulating the dynamics of neutral atom arrays is a challenging problem. To address this, we introduce two emulators, emu-sv and emu-mps, as computational backends for Pasqal's pulser package. Emu-sv is designed for high-precision state-vector simulations, giving the possibility to emulate systems of up to $\thicksim 27$ qubits on an A100 40GB GPU, making it perfect for cases where numerically exact results are needed. In contrast, emu-mps uses a Matrix Product State representation and other controlled approximations to efficiently simulate much larger arrays of atoms with manageable errors. We show through benchmark comparisons that both emulators provide significant speed-ups over generic solvers such as QuTiP. In addition, we provide practical guidance on choosing between the two emulators. These quantum software tools are designed to support researchers and developers aiming to simulate quantum systems either as a precursor to full hardware implementation or as a means of benchmarking hardware performance.
- पेपर ID: 2510.09813
- शीर्षक: तटस्थ परमाणु क्वांटम हार्डवेयर का कुशल अनुकरण
- लेखक: केमल बिडझिएव, स्टेफानो ग्रावा, पाब्लो ले हेनाफ, माउरो मेंडिजाबल, एली मेरहेज, एंटन क्वेल (PASQAL)
- वर्गीकरण: quant-ph (क्वांटम भौतिकी)
- प्रकाशन समय: 14 अक्टूबर, 2025
- पेपर लिंक: https://arxiv.org/abs/2510.09813
तटस्थ परमाणु सरणियों की गतिशीलता का अनुकरण करना एक चुनौतीपूर्ण समस्या है। इस समस्या को हल करने के लिए, लेखकों ने दो अनुकारक—emu-sv और emu-mps—पेश किए हैं, जो Pasqal के pulser पैकेज के लिए कम्प्यूटेशनल बैकएंड के रूप में कार्य करते हैं। Emu-sv उच्च परिशुद्धता वाली स्थिति-सदिश अनुकरण के लिए डिज़ाइन किया गया है, जो A100 40GB GPU पर 27 क्वांटम बिट्स तक की प्रणालियों का अनुकरण कर सकता है, जो संख्यात्मक सटीक परिणामों की आवश्यकता वाली स्थितियों के लिए आदर्श है। इसके विपरीत, emu-mps मैट्रिक्स उत्पाद स्थिति (MPS) प्रतिनिधित्व और अन्य नियंत्रित सन्निकटन का उपयोग करके बड़ी परमाणु सरणियों का कुशलतापूर्वक अनुकरण करता है, जबकि प्रबंधनीय त्रुटि बनाए रखता है। बेंचमार्क तुलना से पता चलता है कि दोनों अनुकारक QuTiP जैसे सामान्य समाधानकर्ताओं की तुलना में महत्वपूर्ण त्वरण प्रदान करते हैं। इसके अलावा, लेखकों ने दोनों अनुकारकों के बीच चयन करने के लिए व्यावहारिक मार्गदर्शन प्रदान किया है।
- मुख्य चुनौती: तटस्थ परमाणु सरणियों की क्वांटम गतिशीलता का अनुकरण करना एक कम्प्यूटेशनल रूप से गहन समस्या है, जो प्रणाली के आकार के साथ घातीय जटिलता प्रदर्शित करती है
- मौजूदा सीमाएं: Pulser सॉफ्टवेयर पैकेज शास्त्रीय अनुकरण के लिए QuTiP पर निर्भर करता है, लेकिन QuTiP समाधानकर्ता तटस्थ परमाणु प्रोसेसर से संबंधित बड़ी प्रणाली के आकार तक प्रभावी रूप से स्केल नहीं कर सकते
- व्यावहारिक आवश्यकता: ऐसे अनुकारकों की आवश्यकता है जो QuTiP बैकएंड की विशेषताओं को विश्वासपूर्वक पुनः प्रस्तुत कर सकें, साथ ही प्रदर्शन और स्केलेबिलिटी में सुधार कर सकें
- तटस्थ परमाणु क्वांटम प्रोसेसर अपनी लचीली क्वांटम बिट कनेक्टिविटी, स्केलेबिलिटी और लंबे सुसंगतता समय के कारण ध्यान आकर्षित कर रहे हैं
- गतिशील पुनर्निर्माण योग्य ज्यामिति और नियंत्रित अंतःक्रिया के साथ बड़ी क्वांटम बिट सरणियों को लागू करने में सक्षम
- क्वांटम सिमुलेशन और सामान्य क्वांटम कंप्यूटिंग दोनों के लिए उपयुक्त
अनुसंधान समय-निर्भर श्रोडिंगर समीकरण पर आधारित है:
idtd∣ψ⟩=H^(t)∣ψ⟩
जहां हैमिल्टनियन है:
H^(t)=∑i=1N2Ωi(t)σ^ix−∑i=1Nδi(t)n^i+∑i>j∣rij∣6Cn^in^j
- दो उच्च-प्रदर्शन क्वांटम अनुकारकों का विकास:
- emu-sv: स्थिति-सदिश आधारित सटीक अनुकारक, अधिकतम 27 क्वांटम बिट्स का समर्थन करता है
- emu-mps: मैट्रिक्स उत्पाद स्थिति आधारित अनुमानित अनुकारक, बड़ी प्रणालियों को संभाल सकता है
- महत्वपूर्ण प्रदर्शन सुधार का कार्यान्वयन: QuTiP जैसे सामान्य समाधानकर्ताओं की तुलना में व्यापक त्वरण प्रदान किया
- पूर्ण सॉफ्टवेयर पारिस्थितिकी तंत्र एकीकरण प्रदान किया:
- Pulser पैकेज के साथ पूर्ण संगतता
- PyTorch मशीन लर्निंग वर्कफ़्लो का समर्थन
- एकीकृत API इंटरफेस का कार्यान्वयन
- व्यावहारिक चयन मार्गदर्शन स्थापित किया: विभिन्न अनुप्रयोग परिदृश्यों के लिए अनुकारक चयन के अनुभवजन्य नियम प्रदान किए
इनपुट:
- N क्वांटम बिट्स की तटस्थ परमाणु प्रणाली
- समय-निर्भर नियंत्रण पैरामीटर Ωᵢ(t) (रबी आवृत्ति) और δᵢ(t) (विसंगति)
- प्रारंभिक क्वांटम स्थिति |ψ(0)⟩
आउटपुट:
- समय विकास के बाद की क्वांटम स्थिति |ψ(t)⟩
- अवलोकनीय मात्राओं की अपेक्षा मान
बाधाएं:
- मेमोरी सीमा (GPU/CPU)
- परिशुद्धता आवश्यकताएं
- कम्प्यूटेशनल समय सीमा
- स्थिति प्रतिनिधित्व: पूर्ण स्थिति-सदिश प्रतिनिधित्व का उपयोग, आयाम 2^N
- हैमिल्टनियन भंडारण: Rydberg हैमिल्टनियन की संरचनात्मक विशेषताओं का लाभ उठाते हुए, केवल विकर्ण तत्व और Ωᵢ मान संग्रहीत करता है
- समय विकास एल्गोरिदम:
- खंडित स्थिर सन्निकटन का उपयोग: |ψ(tₖ₊₁)⟩ = e^(-iHₖdt)|ψ(tₖ)⟩
- मैट्रिक्स घातांक की गणना के लिए Lanczos एल्गोरिदम का उपयोग
- औपचारिक रूप से द्वितीय-क्रम एकीकारक
- MPS प्रतिनिधित्व: क्वांटम स्थिति को मैट्रिक्स उत्पाद स्थिति के रूप में प्रतिनिधित्व करता है
ci1...iN=Aj1i1Aj1,j2i2…AjNiN
- समय विकास एल्गोरिदम:
- समय-निर्भर परिवर्तनशील सिद्धांत (TDVP) का उपयोग
- द्वितीय-क्रम द्विस्थान TDVP योजना
- शोर मॉडल को संभालने के लिए मोंटे कार्लो क्वांटम जंप के माध्यम से
- मेमोरी अनुकूलन: कुंजी आयाम नियंत्रण के माध्यम से मेमोरी उपयोग, कम उलझन वाली स्थितियों के लिए घातीय मेमोरी बचत प्राप्त करता है
- संरचित हैमिल्टनियन भंडारण:
- σˣᵢ पद केवल गैर-विकर्ण तत्व उत्पन्न करते हैं, इस विशेषता का लाभ उठाता है
- उप-सदिश विनिमय के माध्यम से मैट्रिक्स-सदिश गुणन को लागू करता है
- COO और CSR प्रारूपों की तुलना में मेमोरी बचाता है
- अनुकूली एकीकरण क्रम:
- Lanczos एल्गोरिदम Krylov उप-स्थान का निर्माण करके अनुकूली क्रम प्राप्त करता है
- ZVODE जैसी विधियों की निश्चित ऊपरी सीमा से बचता है
- बड़ी प्रणालियों के विस्तृत हैमिल्टनियन स्पेक्ट्रम पर बेहतर प्रदर्शन
- बुद्धिमान क्वांटम बिट क्रमबद्धता:
- MPS में क्वांटम बिट क्रम को अनुकूलित करने के लिए Cuthill-McKee एल्गोरिदम का उपयोग
- द्वि-आयामी प्रणालियों में TDVP एल्गोरिदम त्रुटि को कम करता है
- आवश्यक कुंजी आयाम को कम करता है
- GPU: NVIDIA A100 40GB DRAM
- CPU: AMD EPYC 7742, अधिकतम 1TB RAM
- सॉफ्टवेयर संस्करण:
- Pulser 1.5 (QuTiP 5.2, NumPy 2.2, SciPy 1.15 पर आधारित)
- अनुकारक संस्करण 2.3 (PyTorch 2.8 पर आधारित)
- रन टाइम: विभिन्न प्रणाली आकारों के तहत कम्प्यूटेशनल समय
- मेमोरी खपत: शिखर मेमोरी उपयोग
- परिशुद्धता: QuTiP संदर्भ समाधान के साथ तरंग फलन मानदंड अंतर
- स्केलेबिलिटी: अधिकतम संभालने योग्य क्वांटम बिट्स संख्या
- Pulser डिफ़ॉल्ट बैकएंड: QuTiP आधारित ZVODE ODE समाधानकर्ता
- विभिन्न कॉन्फ़िगरेशन: विभिन्न समय चरण dt और परिशुद्धता पैरामीटर की तुलना
- रन टाइम तुलना:
- 9 क्वांटम बिट्स से शुरू करके, emu-sv Pulser से काफी बेहतर है
- घातीय स्केलिंग बाद में दिखाई देती है, लेकिन अंततः मेमोरी द्वारा सीमित है
- बड़ी प्रणालियों पर GPU त्वरण प्रभावी है
- मेमोरी खपत:
- 26 क्वांटम बिट्स के लिए स्थिति-सदिश संग्रहीत करने के लिए लगभग 1GB मेमोरी की आवश्यकता है
- 15 Krylov सदिशों को मानते हुए, 26 क्वांटम बिट्स के लिए कुल मेमोरी खपत 20GB से कम है
- परिशुद्धता विश्लेषण:
- मुख्य त्रुटि स्रोत समय विवेकीकरण योजना से है
- dt=5ns पर, विशिष्ट त्रुटि लगभग 10⁻⁵ है
- परिशुद्धता पैरामीटर p मुख्य रूप से Lanczos अभिसरण को प्रभावित करता है, कुल त्रुटि को नहीं
- मेमोरी पूर्वानुमान:
- दिए गए क्वांटम बिट्स संख्या N और अधिकतम कुंजी आयाम χ के लिए मेमोरी आवश्यकता को पहले से अनुमान लगा सकता है
- 40GB GPU द्वारा संभाली जा सकने वाली प्रणाली का आकार कुंजी आयाम पर निर्भर करता है
- रन टाइम अनुमान:
- एकल समय चरण की लागत N और χ पर निर्भर करती है
- Lanczos पुनरावृत्ति संख्या पैरामीटर श्रेणी पर कमजोर निर्भरता है
- परिशुद्धता नियंत्रण:
- डिफ़ॉल्ट ट्रंकेशन परिशुद्धता p=10⁻⁵
- कुल त्रुटि सीमा: p × m × (2N-3), जहां m समय चरणों की संख्या है
- वास्तविक त्रुटि आमतौर पर सैद्धांतिक सीमा से कम है
GPU बेंचमार्क परीक्षण के आधार पर अनुभवजन्य नियम:
- ≤27 क्वांटम बिट्स: emu-sv का उपयोग करने की सिफारिश की जाती है
- >27 क्वांटम बिट्स: emu-mps का उपयोग करने की सिफारिश की जाती है
- गतिशील संरचना कारक गणना: emu-mps 20 से अधिक क्वांटम बिट्स की प्रणालियों में सफलतापूर्वक लागू किया गया
- क्वांटम ग्राफ अनुकूलन: दोनों अनुकारक क्वांटम ग्राफ अनुकूलन संबंधित समस्याओं में लागू किए गए
- QuTiP: सामान्य क्वांटम टूलकिट, समय-निर्भर समस्याओं को संभालने के लिए ZVODE समाधानकर्ता का उपयोग करता है
- Pulser: तटस्थ परमाणु क्वांटम कंप्यूटिंग के लिए विशेष खुला स्रोत Python पैकेज
- अन्य प्लेटफॉर्म: अलग-अलग हार्डवेयर प्लेटफॉर्म (सुपरकंडक्टिंग क्वांटम बिट्स, आयन जाल, फोटोनिक उपकरण) के लिए सिमुलेशन उपकरण
- MPS/DMRG: घनत्व मैट्रिक्स पुनर्सामान्यीकरण समूह और मैट्रिक्स उत्पाद स्थिति विधियां
- TDVP: क्वांटम गतिशीलता में समय-निर्भर परिवर्तनशील सिद्धांत का अनुप्रयोग
- क्वांटम मोंटे कार्लो: खुली प्रणाली गतिशीलता को संभालने के लिए स्टोकेस्टिक विधि
- प्रदर्शन सुधार महत्वपूर्ण है: दोनों अनुकारक QuTiP की तुलना में बड़े प्रदर्शन सुधार प्रदान करते हैं
- पूरक डिजाइन: emu-sv सटीक छोटे पैमाने की गणना के लिए उपयुक्त है, emu-mps बड़े पैमाने की अनुमानित गणना के लिए उपयुक्त है
- उपयोग में आसानी: एकीकृत API डिजाइन विभिन्न अनुकारकों के बीच स्विच करना सरल बनाता है
- Emu-sv मेमोरी सीमा: स्थिति-सदिश की घातीय वृद्धि से सीमित, अधिकतम लगभग 27 क्वांटम बिट्स
- Emu-mps परिशुद्धता नियंत्रण: ट्रंकेशन पैरामीटर को सही तरीके से कॉन्फ़िगर करने की आवश्यकता है, द्वि-आयामी प्रणालियों में क्रमबद्धता समस्या
- एकीकरण क्रम: वर्तमान में द्वितीय-क्रम एकीकारक का उपयोग करता है, Richardson एक्सट्रापोलेशन जैसी उच्च-क्रम विधियां नहीं अपनाई गई हैं
- अवकलनीयता: emu-sv पहले से ही अवकलनीय कंप्यूटिंग का समर्थन करता है, emu-mps के लिए यह कार्यक्षमता जोड़ने की योजना है
- आधार स्थिति ट्रैकिंग: समय विकास में आधार स्थिति को ट्रैक करने के लिए DMRG एल्गोरिदम को लागू करना
- शोर मॉडल विस्तार: हार्डवेयर टीम के विश्लेषण के आधार पर नए शोर स्रोत जोड़ना
- मशीन लर्निंग एकीकरण: PyTorch आधारित मशीन लर्निंग वर्कफ़्लो समर्थन
- उच्च व्यावहारिक मूल्य: तटस्थ परमाणु क्वांटम कंप्यूटिंग क्षेत्र की वास्तविक आवश्यकताओं को सीधे हल करता है
- उत्कृष्ट तकनीकी कार्यान्वयन:
- Rydberg हैमिल्टनियन की संरचनात्मक विशेषताओं का पूर्ण लाभ उठाता है
- Lanczos एल्गोरिदम की अनुकूली विशेषता बड़ी प्रणालियों को संभालने में प्रभावी है
- कम उलझन वाली स्थितियों के लिए MPS विधि की मेमोरी अनुकूलन महत्वपूर्ण है
- सॉफ्टवेयर इंजीनियरिंग गुणवत्ता:
- मौजूदा पारिस्थितिकी तंत्र के साथ अच्छा एकीकरण
- एकीकृत API डिजाइन उपयोग को सुविधाजनक बनाता है
- व्यावहारिक चयन मार्गदर्शन प्रदान करता है
- व्यापक बेंचमार्क परीक्षण: रन टाइम, मेमोरी, परिशुद्धता आदि कई आयामों में विस्तृत तुलना शामिल है
- सीमित सैद्धांतिक विश्लेषण:
- एल्गोरिदम जटिलता का सैद्धांतिक विश्लेषण अभाव
- TDVP एल्गोरिदम त्रुटि की सैद्धांतिक सीमा विश्लेषण पर्याप्त नहीं है
- अपेक्षाकृत सीमित अनुप्रयोग परिदृश्य:
- मुख्य रूप से तटस्थ परमाणु प्रणालियों के लिए
- अन्य क्वांटम हार्डवेयर प्लेटफॉर्मों के लिए प्रयोज्यता पर्याप्त रूप से अन्वेषित नहीं है
- उच्च-क्रम विधियों का अभाव:
- Richardson एक्सट्रापोलेशन जैसी उच्च-क्रम एकीकरण विधियां लागू नहीं की गई हैं
- कुछ उच्च परिशुद्धता आवश्यकता वाली परिस्थितियों में अपर्याप्त प्रदर्शन हो सकता है
- क्षेत्र योगदान: तटस्थ परमाणु क्वांटम कंप्यूटिंग के लिए महत्वपूर्ण सिमुलेशन उपकरण प्रदान करता है
- व्यावहारिक मूल्य: कई अनुसंधान परियोजनाओं में सफलतापूर्वक लागू किया गया है
- खुला स्रोत योगदान: Pulser पारिस्थितिकी तंत्र का हिस्सा होने के नाते, क्षेत्र विकास को बढ़ावा देता है
- क्वांटम एल्गोरिदम विकास: हार्डवेयर कार्यान्वयन से पहले एल्गोरिदम सत्यापन
- हार्डवेयर बेंचमार्क परीक्षण: क्वांटम हार्डवेयर प्रदर्शन का मूल्यांकन
- क्वांटम भौतिकी अनुसंधान: बहु-निकाय क्वांटम प्रणालियों की गतिशीलता का अध्ययन
- शिक्षा और प्रशिक्षण: क्वांटम कंप्यूटिंग शिक्षण और अनुसंधान प्रशिक्षण
पेपर क्वांटम कंप्यूटिंग हार्डवेयर, संख्यात्मक एल्गोरिदम, टेंसर नेटवर्क विधियों आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए 51 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह एक उच्च गुणवत्ता वाला अनुप्रयोग-उन्मुख अनुसंधान पेपर है जो तटस्थ परमाणु क्वांटम कंप्यूटिंग क्षेत्र की वास्तविक आवश्यकताओं को हल करता है, तकनीकी कार्यान्वयन ठोस है, प्रायोगिक सत्यापन व्यापक है, और इसमें बहुत मजबूत व्यावहारिक मूल्य और प्रचार महत्व है।