We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
- पेपर ID: 2510.13448
- शीर्षक: GO-Diff: Data-free and amortized global structure optimization
- लेखक: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (डेनमार्क की तकनीकी विश्वविद्यालय)
- वर्गीकरण: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
- प्रकाशन समय: 15 अक्टूबर 2025 (प्रीप्रिंट)
- पेपर लिंक: https://arxiv.org/abs/2510.13448
यह पेपर GO-Diff प्रस्तुत करता है, जो विसरण मॉडल पर आधारित एक वैश्विक संरचना अनुकूलन विधि है जो पूर्व डेटा या स्पष्ट शिथिलीकरण के बिना सीधे निम्न-ऊर्जा परमाणु विन्यास का नमूना ले सकती है। GO-Diff बोल्ट्जमान-भारित स्कोर मिलान हानि का उपयोग करके शुरुआत से प्रशिक्षित है, केवल ज्ञात ऊर्जा फलन का उपयोग करके जनन प्रक्रिया को थर्मोडायनामिक रूप से अनुकूल क्षेत्रों की ओर निर्देशित करता है। यह विधि स्व-नमूनाकरण और मॉडल परिशोधन के दो-चरणीय चक्र को अपनाती है, जो क्रमिक रूप से निम्न-ऊर्जा संरचनाओं को लक्षित करने की क्षमता में सुधार करती है। पारंपरिक अनुकूलन प्रवाह की तुलना में, GO-Diff काफी कम ऊर्जा मूल्यांकन के साथ प्रतिस्पर्धी परिणाम प्राप्त करता है। इसके अलावा, संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल का पुनः उपयोग करके, GO-Diff परिशोधित अनुकूलन का समर्थन करता है — नए कार्यों पर तेजी से अभिसरण कर सकता है बिना शुरुआत से पुनः प्रशिक्षण के।
यह अनुसंधान परमाणु प्रणालियों की वैश्विक संरचना अनुकूलन समस्या को संबोधित करता है, अर्थात् संभावित ऊर्जा सतह (PES) पर निम्न-ऊर्जा स्थिर परमाणु विन्यास खोजना। संभावित ऊर्जा सतह एक उच्च-आयामी, गैर-उत्तल फलन है जो परमाणु स्थिति को संबंधित संभावित ऊर्जा में मैप करता है। इस सतह की खोज करके निम्न-ऊर्जा संरचनाओं की पहचान करना कम्प्यूटेशनल सामग्री विज्ञान, रसायन विज्ञान और उत्प्रेरण क्षेत्र में एक मौलिक चुनौती है।
वैश्विक संरचना अनुकूलन उत्प्रेरक सतह की खोज से लेकर कार्यात्मक सामग्री डिजाइन तक के अनुप्रयोगों का आधार है, जो निम्नलिखित के लिए महत्वपूर्ण है:
- नए उत्प्रेरक सतहों की खोज
- कार्यात्मक सामग्री का डिजाइन
- स्थिर परमाणु विन्यास की भविष्यवाणी
- सामग्री गुणों की समझ
पारंपरिक वैश्विक अनुकूलन विधियों में निम्नलिखित समस्याएं हैं:
- उच्च कम्प्यूटेशनल लागत: यादृच्छिक संरचना खोज (RSS), बेसिन हॉपिंग, आनुवंशिक एल्गोरिदम, सिम्युलेटेड एनीलिंग जैसी विधियां स्थानीय शिथिलीकरण और ढाल-आधारित अनुकूलकों पर निर्भर करती हैं, जिन्हें बड़ी संख्या में ऊर्जा और बल मूल्यांकन की आवश्यकता होती है
- स्थानीय अनुकूलन तक सीमित: स्थानीय इष्टतम समाधान में फंसना आसान है, जो जटिल ऊर्जा परिदृश्य की खोज को सीमित करता है
- डेटा निर्भरता: मशीन लर्निंग परमाणु अंतराल संभावनाओं को प्रासंगिक न्यूनतम को पकड़ने के लिए सावधानीपूर्वक चयनित प्रशिक्षण डेटा की आवश्यकता होती है, अन्यथा स्व-सुदृढ़ स्थानीय न्यूनतम में फंस सकते हैं
- स्थानांतरणीयता की कमी: मौजूदा विधियों के लिए संबंधित प्रणालियों के बीच सीखे गए ज्ञान का पुनः उपयोग करना कठिन है
विसरण मॉडल ने अणु और सामग्री विज्ञान में संरचना निर्माण में वादा दिखाया है, लेकिन इसे वैश्विक अनुकूलन कार्यों पर लागू करना चुनौतीपूर्ण है, क्योंकि लक्ष्य PES के वैश्विक न्यूनतम के अनुरूप दुर्लभ निम्न-ऊर्जा विन्यास का नमूना लेना है, लेकिन ऐसी संरचनाओं का डेटा वितरण आमतौर पर अज्ञात या अप्राप्य है।
- डेटा-मुक्त जनन अनुकूलन विधि प्रस्तावित की: पूर्व डेटा या स्पष्ट शिथिलीकरण के बिना संभावित ऊर्जा सतह के न्यूनतम का सीधे नमूना लेता है
- बोल्ट्जमान-भारित हानि फलन विकसित किया: अन्वेषण को बनाए रखते हुए नमूनाकरण को निम्न-ऊर्जा क्षेत्रों की ओर निर्देशित करने के लिए अनीलिंग रणनीति को जोड़ता है
- परिशोधित अनुकूलन लागू किया: संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल स्थानांतरण के माध्यम से ज्ञान पुनः उपयोग को सक्षम करता है
- उच्च नमूना दक्षता सत्यापित की: शास्त्रीय खोज विधियों की तुलना में बेहतर नमूना दक्षता
इनपुट: परमाणु प्रणाली का ऊर्जा फलन E(x), जहां x परमाणु विन्यास को दर्शाता है
आउटपुट: निम्न-ऊर्जा स्थिर परमाणु विन्यास
उद्देश्य: बोल्ट्जमान वितरण से नमूना लेना: πT(x)=ZTexp(−E(x)/T)
GO-Diff स्व-नमूनाकरण चक्र संचालन को अपनाता है:
- मॉडल विपरीत विसरण के माध्यम से परमाणु संरचनाएं उत्पन्न करता है
- उत्पन्न संरचनाओं की ऊर्जा का मूल्यांकन करता है
- परिणामी नमूनों का उपयोग करके मॉडल को परिशोधित करता है
एक रीप्ले बफर B={(x0(i),E(i))} बनाए रखता है जो उत्पन्न विन्यास और उनकी ऊर्जा को संग्रहीत करता है।
मुख्य नवाचार बोल्ट्जमान-भारित स्कोर मिलान हानि है:
LθBoltzmann=Et∼U(0,1)[λ(t)Ex0∼q,xt∼pt∣0(xt∣x0)w(E)∥sθ(xt,t)−∇xtlogpt∣0(xt∣x0)∥22]
जहां बोल्ट्जमान भार है:
w(E)=∑E(i)∈Bexp(−E(i)/T)exp(−E/T)
यह डिजाइन महत्व नमूनाकरण के माध्यम से वास्तविक बोल्ट्जमान वितरण से सीधे नमूना लेने की आवश्यकता से बचता है।
तापमान T को उच्च प्रारंभिक मान से निम्न अंतिम मान तक अनीलित किया जाता है, अन्वेषण और दोहन को संतुलित करता है:
- प्रारंभिक चरण: उच्च तापमान व्यापक अन्वेषण को प्रोत्साहित करता है
- अंतिम चरण: निम्न तापमान गहरे न्यूनतम में अभिसरण करता है
आमतौर पर ऊर्जा के साथ उपलब्ध परमाणु बलों का उपयोग करता है:
- स्कोर नेटवर्क के साझा प्रतिनिधित्व मेरुदंड पर बल भविष्यवाणी सिर संलग्न करता है
- भविष्य-सुधार नमूनाकरण योजना में भविष्यवाणी किए गए बलों का उपयोग करता है:
Δx=α(1−t)ζFθ(x)
- जैसे-जैसे विसरण समय t→0, सुधार पद अधिक निर्देशन प्रदान करता है
- प्रत्यक्ष बोल्ट्जमान भार: बल मूल्यांकन और मोंटे कार्लो अनुमान से बचता है, प्रत्यक्ष बोल्ट्जमान-भारित स्कोर मिलान हानि का उपयोग करता है
- स्व-पर्यवेक्षित शिक्षा: अपनी स्वयं की पीढ़ी से सीखता है, बाहरी डेटा की आवश्यकता नहीं
- मॉडल स्थानांतरण: संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल स्थानांतरण की क्षमता प्रदर्शित करता है
- भौतिकी-निर्देशित: अभिसरण को तेज करने के लिए बल क्षेत्र जानकारी को शामिल करता है
MACE-MP0 सार्वभौमिक संभावना का उपयोग करके दो परमाणु अनुकूलन कार्य:
- Pt सीढ़ी सतह पर Pt विज्ञापन-परमाणु अनुकूलन: 3D प्रणाली, सतह सामान्य के साथ प्रक्षेपण के माध्यम से 2D के रूप में दृश्यमान
- 6×6 Pt(111) सतह पर Pt हेप्टामर खोज: अधिक जटिल प्रणाली, बेंचमार्किंग और परिशोधित अनुकूलन सत्यापन के लिए
- लक्ष्य संरचना खोजने की सफलता दर
- लक्ष्य संरचना खोजने के लिए आवश्यक औसत ऊर्जा मूल्यांकन
- समय के साथ सर्वोत्तम ऊर्जा में परिवर्तन
- यादृच्छिक संरचना खोज (RSS): AGOX सॉफ्टवेयर पैकेज का उपयोग करके कार्यान्वित पारंपरिक विधि
- GO-Diff वेरिएंट: FFG के बिना, FFG के साथ, मॉडल स्थानांतरण के साथ
सार्वभौमिक हाइपरपैरामीटर:
- विसरण नमूनाकरण चरण: 500
- शोर अनुसूची: रैखिक (VE-SDE)
- स्कोर मॉडल आर्किटेक्चर: PaiNN GNN (4 ब्लॉक), 6Å कटऑफ
- अंतिम तापमान: 0.02
- सीखने की दर: 10^-4
- अनुकूलक: AdamW
विशिष्ट कार्य पैरामीटर:
- Pt विज्ञापन-परमाणु: बफर आकार 16, प्रति पुनरावृत्ति 32 नमूने, 10 पुनरावृत्तियां घातीय अनीलिंग
- Pt हेप्टामर: बफर आकार 64, प्रति पुनरावृत्ति 128 नमूने, 20 पुनरावृत्तियां घातीय अनीलिंग
- नमूनाकरण को क्रमिक रूप से निम्न-ऊर्जा बेसिन में केंद्रित दिखाया
- बोल्ट्जमान-भारित हानि और अनीलिंग अनुसूची की प्रभावशीलता सत्यापित की
| विधि | मूल्यांकन | सफलता दर | औसत सफल पुनरावृत्ति |
|---|
| RSS | 10,000 | 1/8 | 7,816 |
| GO-Diff | 2,560 | 5/8 | 1,667 |
| GO-Diff + FFG | 2,560 | 8/8 | 1,994 |
| GO-Diff + Transfer | 1,280 | 7/8 | 591 |
- नमूना दक्षता: GO-Diff काफी कम ऊर्जा मूल्यांकन के साथ बेहतर सफलता दर प्राप्त करता है
- बल क्षेत्र निर्देशन प्रभाव: FFG सफलता दर में सुधार करता है (5/8 से 8/8) और प्रदर्शन में
- स्थानांतरण शिक्षा लाभ: मॉडल स्थानांतरण आवश्यक मूल्यांकन को 2 गुना से अधिक कम करता है (1,667 से 591)
- मजबूती: विसरण प्रक्रिया की यादृच्छिकता GO-Diff को स्थानीय न्यूनतम से मजबूती से बचने में सक्षम बनाती है
स्थानांतरण शिक्षा का त्वरण अपेक्षित है, क्योंकि स्थानांतरित मॉडल पहले से ही बंधन वरीयताओं को पकड़ता है (जैसे सीढ़ी किनारे के नीचे खोखले साइटों की स्थिरता), अनुकूलन कार्य परमाणु अंतराल ज्यामिति को समायोजित करने तक कम हो जाता है, बजाय शुरुआत से बंधन सीखने के।
- यादृच्छिक संरचना खोज, बेसिन हॉपिंग, आनुवंशिक एल्गोरिदम, सिम्युलेटेड एनीलिंग
- मशीन लर्निंग परमाणु अंतराल संभावनाएं (पूर्व-प्रशिक्षित या ऑनलाइन शिक्षा)
- अणु और सामग्री विज्ञान में संरचना निर्माण
- ब्लैक-बॉक्स अनुकूलन के लिए विसरण मॉडल (DDOM)
- बोल्ट्जमान नमूनाकारी (iDEM, BNEM, Adjoint Sampling)
- मोंटे कार्लो अनुमान और बल लेबल से बचता है
- अधिक सरल और नमूना-कुशल प्रशिक्षण चक्र
- प्रणालियों के बीच स्थानांतरण शिक्षा क्षमता का पहली बार प्रदर्शन
- GO-Diff एक प्रभावी डेटा-मुक्त वैश्विक संरचना अनुकूलन ढांचा है
- बोल्ट्जमान-भारित स्कोर मिलान हानि निम्न-ऊर्जा विन्यास निर्माण को प्रभावी ढंग से निर्देशित कर सकती है
- परिशोधित अनुकूलन मॉडल स्थानांतरण के माध्यम से दक्षता में काफी सुधार करता है
- नमूना दक्षता और सफलता दर के मामले में पारंपरिक विधियों से बेहतर है
- हाइपरपैरामीटर संवेदनशीलता: नमूना संख्या, तापमान वक्र और प्रशिक्षण चरण महत्वपूर्ण हाइपरपैरामीटर हैं, जिन्हें सावधानीपूर्वक ट्यून करने की आवश्यकता है
- स्केलेबिलिटी सीमाएं: वर्तमान परमाणु विसरण मॉडल मुख्य रूप से <20 परमाणु की प्रणालियों पर सत्यापित हैं
- प्रणाली आकार: GO-Diff को बहुत बड़ी वास्तविक आकार की प्रणालियों के लिए उपयुक्त बनाने के लिए आगे के अनुसंधान की आवश्यकता है
- बहु-उद्देश्य या घटक डिजाइन अनुकूलन तक विस्तार
- गतिशील तापमान समायोजन और अनुकूली नमूनाकरण
- बड़ी प्रणालियों के लिए स्केलेबिलिटी में सुधार
- प्रॉक्सी त्वरण और बहु-उद्देश्य अनुकूलन
- विधि नवाचार: पहली बार विसरण मॉडल को डेटा-मुक्त वैश्विक संरचना अनुकूलन में सफलतापूर्वक लागू किया
- तकनीकी उन्नति: बोल्ट्जमान-भारित स्कोर मिलान हानि डिजाइन चतुर है, मौजूदा विधियों की जटिलता से बचता है
- व्यावहारिक मूल्य: परिशोधित अनुकूलन व्यावहारिक अनुप्रयोगों में महत्वपूर्ण लाभ प्रदर्शित करता है
- पर्याप्त प्रयोग: विभिन्न जटिलता की प्रणालियों पर व्यापक परीक्षण
- सैद्धांतिक आधार: महत्व नमूनाकरण पर आधारित सैद्धांतिक व्युत्पत्ति कठोर है
- प्रणाली आकार सीमा: केवल अपेक्षाकृत छोटी परमाणु प्रणालियों (≤20 परमाणु) पर सत्यापित
- हाइपरपैरामीटर ट्यूनिंग: विधि कई हाइपरपैरामीटर के प्रति संवेदनशील है, जो इसकी सामान्यता को सीमित कर सकता है
- सीमित बेंचमार्किंग: केवल RSS के साथ तुलना, अन्य आधुनिक विधियों के साथ तुलना की कमी
- अपर्याप्त सैद्धांतिक विश्लेषण: अभिसरण और नमूना जटिलता के लिए सैद्धांतिक गारंटी की कमी
- शैक्षणिक योगदान: वैश्विक अनुकूलन क्षेत्र में जनन मॉडलिंग का एक नया प्रतिमान प्रस्तुत करता है
- व्यावहारिक मूल्य: सामग्री खोज और उत्प्रेरक डिजाइन में संभावित अनुप्रयोग
- पुनरुत्पादनीयता: पूर्ण कोड और कार्यान्वयन विवरण प्रदान करता है
- प्रेरणादायक महत्व: अनुकूलन समस्याओं में विसरण मॉडल के अनुप्रयोग के लिए नई दिशाएं खोलता है
- सामग्री खोज: नए उत्प्रेरक और कार्यात्मक सामग्री की संरचना भविष्यवाणी
- सतह विज्ञान: अधिशोषण साइटों और सतह पुनर्निर्माण का अनुसंधान
- छोटे अणु अनुकूलन: आणविक विन्यास खोज और दवा डिजाइन
- मौजूदा संबंधित प्रणालियां: विशेष रूप से उन परिदृश्यों के लिए उपयुक्त जहां समान प्रणालियों के बीच कई अनुकूलन की आवश्यकता होती है
यह पेपर 38 संबंधित संदर्भों का हवाला देता है, जो वैश्विक अनुकूलन, विसरण मॉडल, मशीन लर्निंग संभावनाओं आदि प्रमुख क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो विधि के विकास के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है।