2025-11-18T04:37:13.643074

Efficient Emulation of Neutral Atom Quantum Hardware

Bidzhiev, Grava, Henaff et al.

Simulating the dynamics of neutral atom arrays is a challenging problem. To address this, we introduce two emulators, emu-sv and emu-mps, as computational backends for Pasqal's pulser package. Emu-sv is designed for high-precision state-vector simulations, giving the possibility to emulate systems of up to $\thicksim 27$ qubits on an A100 40GB GPU, making it perfect for cases where numerically exact results are needed. In contrast, emu-mps uses a Matrix Product State representation and other controlled approximations to efficiently simulate much larger arrays of atoms with manageable errors. We show through benchmark comparisons that both emulators provide significant speed-ups over generic solvers such as QuTiP. In addition, we provide practical guidance on choosing between the two emulators. These quantum software tools are designed to support researchers and developers aiming to simulate quantum systems either as a precursor to full hardware implementation or as a means of benchmarking hardware performance.

academic

तटस्थ परमाणु क्वांटम हार्डवेयर का कुशल अनुकरण

बुनियादी जानकारी

पेपर ID: 2510.09813
शीर्षक: तटस्थ परमाणु क्वांटम हार्डवेयर का कुशल अनुकरण
लेखक: केमल बिडझिएव, स्टेफानो ग्रावा, पाब्लो ले हेनाफ, माउरो मेंडिजाबल, एली मेरहेज, एंटन क्वेल (PASQAL)
वर्गीकरण: quant-ph (क्वांटम भौतिकी)
प्रकाशन समय: 14 अक्टूबर, 2025
पेपर लिंक: https://arxiv.org/abs/2510.09813

सारांश

तटस्थ परमाणु सरणियों की गतिशीलता का अनुकरण करना एक चुनौतीपूर्ण समस्या है। इस समस्या को हल करने के लिए, लेखकों ने दो अनुकारक—emu-sv और emu-mps—पेश किए हैं, जो Pasqal के pulser पैकेज के लिए कम्प्यूटेशनल बैकएंड के रूप में कार्य करते हैं। Emu-sv उच्च परिशुद्धता वाली स्थिति-सदिश अनुकरण के लिए डिज़ाइन किया गया है, जो A100 40GB GPU पर 27 क्वांटम बिट्स तक की प्रणालियों का अनुकरण कर सकता है, जो संख्यात्मक सटीक परिणामों की आवश्यकता वाली स्थितियों के लिए आदर्श है। इसके विपरीत, emu-mps मैट्रिक्स उत्पाद स्थिति (MPS) प्रतिनिधित्व और अन्य नियंत्रित सन्निकटन का उपयोग करके बड़ी परमाणु सरणियों का कुशलतापूर्वक अनुकरण करता है, जबकि प्रबंधनीय त्रुटि बनाए रखता है। बेंचमार्क तुलना से पता चलता है कि दोनों अनुकारक QuTiP जैसे सामान्य समाधानकर्ताओं की तुलना में महत्वपूर्ण त्वरण प्रदान करते हैं। इसके अलावा, लेखकों ने दोनों अनुकारकों के बीच चयन करने के लिए व्यावहारिक मार्गदर्शन प्रदान किया है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

मुख्य चुनौती: तटस्थ परमाणु सरणियों की क्वांटम गतिशीलता का अनुकरण करना एक कम्प्यूटेशनल रूप से गहन समस्या है, जो प्रणाली के आकार के साथ घातीय जटिलता प्रदर्शित करती है
मौजूदा सीमाएं: Pulser सॉफ्टवेयर पैकेज शास्त्रीय अनुकरण के लिए QuTiP पर निर्भर करता है, लेकिन QuTiP समाधानकर्ता तटस्थ परमाणु प्रोसेसर से संबंधित बड़ी प्रणाली के आकार तक प्रभावी रूप से स्केल नहीं कर सकते
व्यावहारिक आवश्यकता: ऐसे अनुकारकों की आवश्यकता है जो QuTiP बैकएंड की विशेषताओं को विश्वासपूर्वक पुनः प्रस्तुत कर सकें, साथ ही प्रदर्शन और स्केलेबिलिटी में सुधार कर सकें

अनुसंधान का महत्व

तटस्थ परमाणु क्वांटम प्रोसेसर अपनी लचीली क्वांटम बिट कनेक्टिविटी, स्केलेबिलिटी और लंबे सुसंगतता समय के कारण ध्यान आकर्षित कर रहे हैं
गतिशील पुनर्निर्माण योग्य ज्यामिति और नियंत्रित अंतःक्रिया के साथ बड़ी क्वांटम बिट सरणियों को लागू करने में सक्षम
क्वांटम सिमुलेशन और सामान्य क्वांटम कंप्यूटिंग दोनों के लिए उपयुक्त

तकनीकी पृष्ठभूमि

अनुसंधान समय-निर्भर श्रोडिंगर समीकरण पर आधारित है: $i\frac{d|\psi\rangle}{dt} = \hat{H}(t)|\psi\rangle$

जहां हैमिल्टनियन है: $\hat{H}(t) = \sum_{i=1}^N \frac{\Omega_i(t)}{2}\hat{\sigma}^x_i - \sum_{i=1}^N \delta_i(t)\hat{n}_i + \sum_{i>j} \frac{C}{|r_{ij}|^6}\hat{n}_i\hat{n}_j$

मुख्य योगदान

दो उच्च-प्रदर्शन क्वांटम अनुकारकों का विकास:
- emu-sv: स्थिति-सदिश आधारित सटीक अनुकारक, अधिकतम 27 क्वांटम बिट्स का समर्थन करता है
- emu-mps: मैट्रिक्स उत्पाद स्थिति आधारित अनुमानित अनुकारक, बड़ी प्रणालियों को संभाल सकता है
महत्वपूर्ण प्रदर्शन सुधार का कार्यान्वयन: QuTiP जैसे सामान्य समाधानकर्ताओं की तुलना में व्यापक त्वरण प्रदान किया
पूर्ण सॉफ्टवेयर पारिस्थितिकी तंत्र एकीकरण प्रदान किया:
- Pulser पैकेज के साथ पूर्ण संगतता
- PyTorch मशीन लर्निंग वर्कफ़्लो का समर्थन
- एकीकृत API इंटरफेस का कार्यान्वयन
व्यावहारिक चयन मार्गदर्शन स्थापित किया: विभिन्न अनुप्रयोग परिदृश्यों के लिए अनुकारक चयन के अनुभवजन्य नियम प्रदान किए

विधि विवरण

कार्य परिभाषा

इनपुट:

N क्वांटम बिट्स की तटस्थ परमाणु प्रणाली
समय-निर्भर नियंत्रण पैरामीटर Ωᵢ(t) (रबी आवृत्ति) और δᵢ(t) (विसंगति)
प्रारंभिक क्वांटम स्थिति |ψ(0)⟩

आउटपुट:

समय विकास के बाद की क्वांटम स्थिति |ψ(t)⟩
अवलोकनीय मात्राओं की अपेक्षा मान

बाधाएं:

मेमोरी सीमा (GPU/CPU)
परिशुद्धता आवश्यकताएं
कम्प्यूटेशनल समय सीमा

मॉडल आर्किटेक्चर

Emu-sv आर्किटेक्चर

स्थिति प्रतिनिधित्व: पूर्ण स्थिति-सदिश प्रतिनिधित्व का उपयोग, आयाम 2^N
हैमिल्टनियन भंडारण: Rydberg हैमिल्टनियन की संरचनात्मक विशेषताओं का लाभ उठाते हुए, केवल विकर्ण तत्व और Ωᵢ मान संग्रहीत करता है
समय विकास एल्गोरिदम:
- खंडित स्थिर सन्निकटन का उपयोग: |ψ(tₖ₊₁)⟩ = e^(-iHₖdt)|ψ(tₖ)⟩
- मैट्रिक्स घातांक की गणना के लिए Lanczos एल्गोरिदम का उपयोग
- औपचारिक रूप से द्वितीय-क्रम एकीकारक

Emu-mps आर्किटेक्चर

MPS प्रतिनिधित्व: क्वांटम स्थिति को मैट्रिक्स उत्पाद स्थिति के रूप में प्रतिनिधित्व करता है $c_{i_1...i_N} = A^{i_1}_{j_1} A^{i_2}_{j_1,j_2} \ldots A^{i_N}_{j_N}$
समय विकास एल्गोरिदम:
- समय-निर्भर परिवर्तनशील सिद्धांत (TDVP) का उपयोग
- द्वितीय-क्रम द्विस्थान TDVP योजना
- शोर मॉडल को संभालने के लिए मोंटे कार्लो क्वांटम जंप के माध्यम से
मेमोरी अनुकूलन: कुंजी आयाम नियंत्रण के माध्यम से मेमोरी उपयोग, कम उलझन वाली स्थितियों के लिए घातीय मेमोरी बचत प्राप्त करता है

तकनीकी नवाचार

संरचित हैमिल्टनियन भंडारण:
- σˣᵢ पद केवल गैर-विकर्ण तत्व उत्पन्न करते हैं, इस विशेषता का लाभ उठाता है
- उप-सदिश विनिमय के माध्यम से मैट्रिक्स-सदिश गुणन को लागू करता है
- COO और CSR प्रारूपों की तुलना में मेमोरी बचाता है
अनुकूली एकीकरण क्रम:
- Lanczos एल्गोरिदम Krylov उप-स्थान का निर्माण करके अनुकूली क्रम प्राप्त करता है
- ZVODE जैसी विधियों की निश्चित ऊपरी सीमा से बचता है
- बड़ी प्रणालियों के विस्तृत हैमिल्टनियन स्पेक्ट्रम पर बेहतर प्रदर्शन
बुद्धिमान क्वांटम बिट क्रमबद्धता:
- MPS में क्वांटम बिट क्रम को अनुकूलित करने के लिए Cuthill-McKee एल्गोरिदम का उपयोग
- द्वि-आयामी प्रणालियों में TDVP एल्गोरिदम त्रुटि को कम करता है
- आवश्यक कुंजी आयाम को कम करता है

प्रायोगिक सेटअप

हार्डवेयर पर्यावरण

GPU: NVIDIA A100 40GB DRAM
CPU: AMD EPYC 7742, अधिकतम 1TB RAM
सॉफ्टवेयर संस्करण:
- Pulser 1.5 (QuTiP 5.2, NumPy 2.2, SciPy 1.15 पर आधारित)
- अनुकारक संस्करण 2.3 (PyTorch 2.8 पर आधारित)

मूल्यांकन मेट्रिक्स

रन टाइम: विभिन्न प्रणाली आकारों के तहत कम्प्यूटेशनल समय
मेमोरी खपत: शिखर मेमोरी उपयोग
परिशुद्धता: QuTiP संदर्भ समाधान के साथ तरंग फलन मानदंड अंतर
स्केलेबिलिटी: अधिकतम संभालने योग्य क्वांटम बिट्स संख्या

तुलना विधियां

Pulser डिफ़ॉल्ट बैकएंड: QuTiP आधारित ZVODE ODE समाधानकर्ता
विभिन्न कॉन्फ़िगरेशन: विभिन्न समय चरण dt और परिशुद्धता पैरामीटर की तुलना

प्रायोगिक परिणाम

मुख्य प्रदर्शन परिणाम

Emu-sv प्रदर्शन

रन टाइम तुलना:
- 9 क्वांटम बिट्स से शुरू करके, emu-sv Pulser से काफी बेहतर है
- घातीय स्केलिंग बाद में दिखाई देती है, लेकिन अंततः मेमोरी द्वारा सीमित है
- बड़ी प्रणालियों पर GPU त्वरण प्रभावी है
मेमोरी खपत:
- 26 क्वांटम बिट्स के लिए स्थिति-सदिश संग्रहीत करने के लिए लगभग 1GB मेमोरी की आवश्यकता है
- 15 Krylov सदिशों को मानते हुए, 26 क्वांटम बिट्स के लिए कुल मेमोरी खपत 20GB से कम है
परिशुद्धता विश्लेषण:
- मुख्य त्रुटि स्रोत समय विवेकीकरण योजना से है
- dt=5ns पर, विशिष्ट त्रुटि लगभग 10⁻⁵ है
- परिशुद्धता पैरामीटर p मुख्य रूप से Lanczos अभिसरण को प्रभावित करता है, कुल त्रुटि को नहीं

Emu-mps प्रदर्शन

मेमोरी पूर्वानुमान:
- दिए गए क्वांटम बिट्स संख्या N और अधिकतम कुंजी आयाम χ के लिए मेमोरी आवश्यकता को पहले से अनुमान लगा सकता है
- 40GB GPU द्वारा संभाली जा सकने वाली प्रणाली का आकार कुंजी आयाम पर निर्भर करता है
रन टाइम अनुमान:
- एकल समय चरण की लागत N और χ पर निर्भर करती है
- Lanczos पुनरावृत्ति संख्या पैरामीटर श्रेणी पर कमजोर निर्भरता है
परिशुद्धता नियंत्रण:
- डिफ़ॉल्ट ट्रंकेशन परिशुद्धता p=10⁻⁵
- कुल त्रुटि सीमा: p × m × (2N-3), जहां m समय चरणों की संख्या है
- वास्तविक त्रुटि आमतौर पर सैद्धांतिक सीमा से कम है

चयन मार्गदर्शन

GPU बेंचमार्क परीक्षण के आधार पर अनुभवजन्य नियम:

≤27 क्वांटम बिट्स: emu-sv का उपयोग करने की सिफारिश की जाती है
>27 क्वांटम बिट्स: emu-mps का उपयोग करने की सिफारिश की जाती है

अनुप्रयोग केस

गतिशील संरचना कारक गणना: emu-mps 20 से अधिक क्वांटम बिट्स की प्रणालियों में सफलतापूर्वक लागू किया गया
क्वांटम ग्राफ अनुकूलन: दोनों अनुकारक क्वांटम ग्राफ अनुकूलन संबंधित समस्याओं में लागू किए गए

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

प्रदर्शन सुधार महत्वपूर्ण है: दोनों अनुकारक QuTiP की तुलना में बड़े प्रदर्शन सुधार प्रदान करते हैं
पूरक डिजाइन: emu-sv सटीक छोटे पैमाने की गणना के लिए उपयुक्त है, emu-mps बड़े पैमाने की अनुमानित गणना के लिए उपयुक्त है
उपयोग में आसानी: एकीकृत API डिजाइन विभिन्न अनुकारकों के बीच स्विच करना सरल बनाता है

सीमाएं

Emu-sv मेमोरी सीमा: स्थिति-सदिश की घातीय वृद्धि से सीमित, अधिकतम लगभग 27 क्वांटम बिट्स
Emu-mps परिशुद्धता नियंत्रण: ट्रंकेशन पैरामीटर को सही तरीके से कॉन्फ़िगर करने की आवश्यकता है, द्वि-आयामी प्रणालियों में क्रमबद्धता समस्या
एकीकरण क्रम: वर्तमान में द्वितीय-क्रम एकीकारक का उपयोग करता है, Richardson एक्सट्रापोलेशन जैसी उच्च-क्रम विधियां नहीं अपनाई गई हैं

भविष्य की दिशाएं

अवकलनीयता: emu-sv पहले से ही अवकलनीय कंप्यूटिंग का समर्थन करता है, emu-mps के लिए यह कार्यक्षमता जोड़ने की योजना है
आधार स्थिति ट्रैकिंग: समय विकास में आधार स्थिति को ट्रैक करने के लिए DMRG एल्गोरिदम को लागू करना
शोर मॉडल विस्तार: हार्डवेयर टीम के विश्लेषण के आधार पर नए शोर स्रोत जोड़ना
मशीन लर्निंग एकीकरण: PyTorch आधारित मशीन लर्निंग वर्कफ़्लो समर्थन

गहन मूल्यांकन

लाभ

उच्च व्यावहारिक मूल्य: तटस्थ परमाणु क्वांटम कंप्यूटिंग क्षेत्र की वास्तविक आवश्यकताओं को सीधे हल करता है
उत्कृष्ट तकनीकी कार्यान्वयन:
- Rydberg हैमिल्टनियन की संरचनात्मक विशेषताओं का पूर्ण लाभ उठाता है
- Lanczos एल्गोरिदम की अनुकूली विशेषता बड़ी प्रणालियों को संभालने में प्रभावी है
- कम उलझन वाली स्थितियों के लिए MPS विधि की मेमोरी अनुकूलन महत्वपूर्ण है
सॉफ्टवेयर इंजीनियरिंग गुणवत्ता:
- मौजूदा पारिस्थितिकी तंत्र के साथ अच्छा एकीकरण
- एकीकृत API डिजाइन उपयोग को सुविधाजनक बनाता है
- व्यावहारिक चयन मार्गदर्शन प्रदान करता है
व्यापक बेंचमार्क परीक्षण: रन टाइम, मेमोरी, परिशुद्धता आदि कई आयामों में विस्तृत तुलना शामिल है

कमियां

सीमित सैद्धांतिक विश्लेषण:
- एल्गोरिदम जटिलता का सैद्धांतिक विश्लेषण अभाव
- TDVP एल्गोरिदम त्रुटि की सैद्धांतिक सीमा विश्लेषण पर्याप्त नहीं है
अपेक्षाकृत सीमित अनुप्रयोग परिदृश्य:
- मुख्य रूप से तटस्थ परमाणु प्रणालियों के लिए
- अन्य क्वांटम हार्डवेयर प्लेटफॉर्मों के लिए प्रयोज्यता पर्याप्त रूप से अन्वेषित नहीं है
उच्च-क्रम विधियों का अभाव:
- Richardson एक्सट्रापोलेशन जैसी उच्च-क्रम एकीकरण विधियां लागू नहीं की गई हैं
- कुछ उच्च परिशुद्धता आवश्यकता वाली परिस्थितियों में अपर्याप्त प्रदर्शन हो सकता है

प्रभाव

क्षेत्र योगदान: तटस्थ परमाणु क्वांटम कंप्यूटिंग के लिए महत्वपूर्ण सिमुलेशन उपकरण प्रदान करता है
व्यावहारिक मूल्य: कई अनुसंधान परियोजनाओं में सफलतापूर्वक लागू किया गया है
खुला स्रोत योगदान: Pulser पारिस्थितिकी तंत्र का हिस्सा होने के नाते, क्षेत्र विकास को बढ़ावा देता है

प्रयोज्य परिदृश्य

क्वांटम एल्गोरिदम विकास: हार्डवेयर कार्यान्वयन से पहले एल्गोरिदम सत्यापन
हार्डवेयर बेंचमार्क परीक्षण: क्वांटम हार्डवेयर प्रदर्शन का मूल्यांकन
क्वांटम भौतिकी अनुसंधान: बहु-निकाय क्वांटम प्रणालियों की गतिशीलता का अध्ययन
शिक्षा और प्रशिक्षण: क्वांटम कंप्यूटिंग शिक्षण और अनुसंधान प्रशिक्षण

संदर्भ

पेपर क्वांटम कंप्यूटिंग हार्डवेयर, संख्यात्मक एल्गोरिदम, टेंसर नेटवर्क विधियों आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए 51 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।

समग्र मूल्यांकन: यह एक उच्च गुणवत्ता वाला अनुप्रयोग-उन्मुख अनुसंधान पेपर है जो तटस्थ परमाणु क्वांटम कंप्यूटिंग क्षेत्र की वास्तविक आवश्यकताओं को हल करता है, तकनीकी कार्यान्वयन ठोस है, प्रायोगिक सत्यापन व्यापक है, और इसमें बहुत मजबूत व्यावहारिक मूल्य और प्रचार महत्व है।