2025-11-14T19:19:11.421355

GO-Diff: Data-free and amortized global structure optimization

RÃ¸nne, Vegge, Bhowmik

We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.

academic

GO-Diff: डेटा-मुक्त और परिशोधित वैश्विक संरचना अनुकूलन

बुनियादी जानकारी

पेपर ID: 2510.13448
शीर्षक: GO-Diff: Data-free and amortized global structure optimization
लेखक: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (डेनमार्क की तकनीकी विश्वविद्यालय)
वर्गीकरण: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
प्रकाशन समय: 15 अक्टूबर 2025 (प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.13448

सारांश

यह पेपर GO-Diff प्रस्तुत करता है, जो विसरण मॉडल पर आधारित एक वैश्विक संरचना अनुकूलन विधि है जो पूर्व डेटा या स्पष्ट शिथिलीकरण के बिना सीधे निम्न-ऊर्जा परमाणु विन्यास का नमूना ले सकती है। GO-Diff बोल्ट्जमान-भारित स्कोर मिलान हानि का उपयोग करके शुरुआत से प्रशिक्षित है, केवल ज्ञात ऊर्जा फलन का उपयोग करके जनन प्रक्रिया को थर्मोडायनामिक रूप से अनुकूल क्षेत्रों की ओर निर्देशित करता है। यह विधि स्व-नमूनाकरण और मॉडल परिशोधन के दो-चरणीय चक्र को अपनाती है, जो क्रमिक रूप से निम्न-ऊर्जा संरचनाओं को लक्षित करने की क्षमता में सुधार करती है। पारंपरिक अनुकूलन प्रवाह की तुलना में, GO-Diff काफी कम ऊर्जा मूल्यांकन के साथ प्रतिस्पर्धी परिणाम प्राप्त करता है। इसके अलावा, संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल का पुनः उपयोग करके, GO-Diff परिशोधित अनुकूलन का समर्थन करता है — नए कार्यों पर तेजी से अभिसरण कर सकता है बिना शुरुआत से पुनः प्रशिक्षण के।

अनुसंधान पृष्ठभूमि और प्रेरणा

समाधान की जाने वाली समस्या

यह अनुसंधान परमाणु प्रणालियों की वैश्विक संरचना अनुकूलन समस्या को संबोधित करता है, अर्थात् संभावित ऊर्जा सतह (PES) पर निम्न-ऊर्जा स्थिर परमाणु विन्यास खोजना। संभावित ऊर्जा सतह एक उच्च-आयामी, गैर-उत्तल फलन है जो परमाणु स्थिति को संबंधित संभावित ऊर्जा में मैप करता है। इस सतह की खोज करके निम्न-ऊर्जा संरचनाओं की पहचान करना कम्प्यूटेशनल सामग्री विज्ञान, रसायन विज्ञान और उत्प्रेरण क्षेत्र में एक मौलिक चुनौती है।

समस्या की महत्ता

वैश्विक संरचना अनुकूलन उत्प्रेरक सतह की खोज से लेकर कार्यात्मक सामग्री डिजाइन तक के अनुप्रयोगों का आधार है, जो निम्नलिखित के लिए महत्वपूर्ण है:

नए उत्प्रेरक सतहों की खोज
कार्यात्मक सामग्री का डिजाइन
स्थिर परमाणु विन्यास की भविष्यवाणी
सामग्री गुणों की समझ

मौजूदा विधियों की सीमाएं

पारंपरिक वैश्विक अनुकूलन विधियों में निम्नलिखित समस्याएं हैं:

उच्च कम्प्यूटेशनल लागत: यादृच्छिक संरचना खोज (RSS), बेसिन हॉपिंग, आनुवंशिक एल्गोरिदम, सिम्युलेटेड एनीलिंग जैसी विधियां स्थानीय शिथिलीकरण और ढाल-आधारित अनुकूलकों पर निर्भर करती हैं, जिन्हें बड़ी संख्या में ऊर्जा और बल मूल्यांकन की आवश्यकता होती है
स्थानीय अनुकूलन तक सीमित: स्थानीय इष्टतम समाधान में फंसना आसान है, जो जटिल ऊर्जा परिदृश्य की खोज को सीमित करता है
डेटा निर्भरता: मशीन लर्निंग परमाणु अंतराल संभावनाओं को प्रासंगिक न्यूनतम को पकड़ने के लिए सावधानीपूर्वक चयनित प्रशिक्षण डेटा की आवश्यकता होती है, अन्यथा स्व-सुदृढ़ स्थानीय न्यूनतम में फंस सकते हैं
स्थानांतरणीयता की कमी: मौजूदा विधियों के लिए संबंधित प्रणालियों के बीच सीखे गए ज्ञान का पुनः उपयोग करना कठिन है

अनुसंधान प्रेरणा

विसरण मॉडल ने अणु और सामग्री विज्ञान में संरचना निर्माण में वादा दिखाया है, लेकिन इसे वैश्विक अनुकूलन कार्यों पर लागू करना चुनौतीपूर्ण है, क्योंकि लक्ष्य PES के वैश्विक न्यूनतम के अनुरूप दुर्लभ निम्न-ऊर्जा विन्यास का नमूना लेना है, लेकिन ऐसी संरचनाओं का डेटा वितरण आमतौर पर अज्ञात या अप्राप्य है।

मुख्य योगदान

डेटा-मुक्त जनन अनुकूलन विधि प्रस्तावित की: पूर्व डेटा या स्पष्ट शिथिलीकरण के बिना संभावित ऊर्जा सतह के न्यूनतम का सीधे नमूना लेता है
बोल्ट्जमान-भारित हानि फलन विकसित किया: अन्वेषण को बनाए रखते हुए नमूनाकरण को निम्न-ऊर्जा क्षेत्रों की ओर निर्देशित करने के लिए अनीलिंग रणनीति को जोड़ता है
परिशोधित अनुकूलन लागू किया: संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल स्थानांतरण के माध्यम से ज्ञान पुनः उपयोग को सक्षम करता है
उच्च नमूना दक्षता सत्यापित की: शास्त्रीय खोज विधियों की तुलना में बेहतर नमूना दक्षता

विधि विवरण

कार्य परिभाषा

इनपुट: परमाणु प्रणाली का ऊर्जा फलन E(x), जहां x परमाणु विन्यास को दर्शाता है आउटपुट: निम्न-ऊर्जा स्थिर परमाणु विन्यास उद्देश्य: बोल्ट्जमान वितरण से नमूना लेना: $\pi_T(x) = \frac{\exp(-E(x)/T)}{Z_T}$

मॉडल आर्किटेक्चर

प्रशिक्षण चक्र

GO-Diff स्व-नमूनाकरण चक्र संचालन को अपनाता है:

मॉडल विपरीत विसरण के माध्यम से परमाणु संरचनाएं उत्पन्न करता है
उत्पन्न संरचनाओं की ऊर्जा का मूल्यांकन करता है
परिणामी नमूनों का उपयोग करके मॉडल को परिशोधित करता है

एक रीप्ले बफर $B = \{(x_0^{(i)}, E^{(i)})\}$ बनाए रखता है जो उत्पन्न विन्यास और उनकी ऊर्जा को संग्रहीत करता है।

बोल्ट्जमान-भारित स्कोर मिलान

मुख्य नवाचार बोल्ट्जमान-भारित स्कोर मिलान हानि है:

$L_{\theta}^{Boltzmann} = E_{t\sim U(0,1)}\left[\lambda(t)E_{x_0\sim q, x_t\sim p_{t|0}(x_t|x_0)} w(E) \|s_\theta(x_t,t) - \nabla_{x_t}\log p_{t|0}(x_t|x_0)\|_2^2\right]$

जहां बोल्ट्जमान भार है: $w(E) = \frac{\exp(-E/T)}{\sum_{E^{(i)}\in B} \exp(-E^{(i)}/T)}$

यह डिजाइन महत्व नमूनाकरण के माध्यम से वास्तविक बोल्ट्जमान वितरण से सीधे नमूना लेने की आवश्यकता से बचता है।

अनीलिंग रणनीति

तापमान T को उच्च प्रारंभिक मान से निम्न अंतिम मान तक अनीलित किया जाता है, अन्वेषण और दोहन को संतुलित करता है:

प्रारंभिक चरण: उच्च तापमान व्यापक अन्वेषण को प्रोत्साहित करता है
अंतिम चरण: निम्न तापमान गहरे न्यूनतम में अभिसरण करता है

बल क्षेत्र निर्देशन (FFG)

आमतौर पर ऊर्जा के साथ उपलब्ध परमाणु बलों का उपयोग करता है:

स्कोर नेटवर्क के साझा प्रतिनिधित्व मेरुदंड पर बल भविष्यवाणी सिर संलग्न करता है
भविष्य-सुधार नमूनाकरण योजना में भविष्यवाणी किए गए बलों का उपयोग करता है: $\Delta x = \alpha(1-t)\zeta F_\theta(x)$
जैसे-जैसे विसरण समय t→0, सुधार पद अधिक निर्देशन प्रदान करता है

तकनीकी नवाचार बिंदु

प्रत्यक्ष बोल्ट्जमान भार: बल मूल्यांकन और मोंटे कार्लो अनुमान से बचता है, प्रत्यक्ष बोल्ट्जमान-भारित स्कोर मिलान हानि का उपयोग करता है
स्व-पर्यवेक्षित शिक्षा: अपनी स्वयं की पीढ़ी से सीखता है, बाहरी डेटा की आवश्यकता नहीं
मॉडल स्थानांतरण: संबंधित प्रणालियों के बीच पूर्व-प्रशिक्षित मॉडल स्थानांतरण की क्षमता प्रदर्शित करता है
भौतिकी-निर्देशित: अभिसरण को तेज करने के लिए बल क्षेत्र जानकारी को शामिल करता है

प्रायोगिक सेटअप

डेटासेट

MACE-MP0 सार्वभौमिक संभावना का उपयोग करके दो परमाणु अनुकूलन कार्य:

Pt सीढ़ी सतह पर Pt विज्ञापन-परमाणु अनुकूलन: 3D प्रणाली, सतह सामान्य के साथ प्रक्षेपण के माध्यम से 2D के रूप में दृश्यमान
6×6 Pt(111) सतह पर Pt हेप्टामर खोज: अधिक जटिल प्रणाली, बेंचमार्किंग और परिशोधित अनुकूलन सत्यापन के लिए

मूल्यांकन मेट्रिक्स

लक्ष्य संरचना खोजने की सफलता दर
लक्ष्य संरचना खोजने के लिए आवश्यक औसत ऊर्जा मूल्यांकन
समय के साथ सर्वोत्तम ऊर्जा में परिवर्तन

तुलना विधियां

यादृच्छिक संरचना खोज (RSS): AGOX सॉफ्टवेयर पैकेज का उपयोग करके कार्यान्वित पारंपरिक विधि
GO-Diff वेरिएंट: FFG के बिना, FFG के साथ, मॉडल स्थानांतरण के साथ

कार्यान्वयन विवरण

सार्वभौमिक हाइपरपैरामीटर:

विसरण नमूनाकरण चरण: 500
शोर अनुसूची: रैखिक (VE-SDE)
स्कोर मॉडल आर्किटेक्चर: PaiNN GNN (4 ब्लॉक), 6Å कटऑफ
अंतिम तापमान: 0.02
सीखने की दर: 10^-4
अनुकूलक: AdamW

विशिष्ट कार्य पैरामीटर:

Pt विज्ञापन-परमाणु: बफर आकार 16, प्रति पुनरावृत्ति 32 नमूने, 10 पुनरावृत्तियां घातीय अनीलिंग
Pt हेप्टामर: बफर आकार 64, प्रति पुनरावृत्ति 128 नमूने, 20 पुनरावृत्तियां घातीय अनीलिंग

प्रायोगिक परिणाम

मुख्य परिणाम

Pt विज्ञापन-परमाणु अनुकूलन

नमूनाकरण को क्रमिक रूप से निम्न-ऊर्जा बेसिन में केंद्रित दिखाया
बोल्ट्जमान-भारित हानि और अनीलिंग अनुसूची की प्रभावशीलता सत्यापित की

Pt हेप्टामर खोज

विधि	मूल्यांकन	सफलता दर	औसत सफल पुनरावृत्ति
RSS	10,000	1/8	7,816
GO-Diff	2,560	5/8	1,667
GO-Diff + FFG	2,560	8/8	1,994
GO-Diff + Transfer	1,280	7/8	591

मुख्य निष्कर्ष

नमूना दक्षता: GO-Diff काफी कम ऊर्जा मूल्यांकन के साथ बेहतर सफलता दर प्राप्त करता है
बल क्षेत्र निर्देशन प्रभाव: FFG सफलता दर में सुधार करता है (5/8 से 8/8) और प्रदर्शन में
स्थानांतरण शिक्षा लाभ: मॉडल स्थानांतरण आवश्यक मूल्यांकन को 2 गुना से अधिक कम करता है (1,667 से 591)
मजबूती: विसरण प्रक्रिया की यादृच्छिकता GO-Diff को स्थानीय न्यूनतम से मजबूती से बचने में सक्षम बनाती है

परिशोधित अनुकूलन विश्लेषण

स्थानांतरण शिक्षा का त्वरण अपेक्षित है, क्योंकि स्थानांतरित मॉडल पहले से ही बंधन वरीयताओं को पकड़ता है (जैसे सीढ़ी किनारे के नीचे खोखले साइटों की स्थिरता), अनुकूलन कार्य परमाणु अंतराल ज्यामिति को समायोजित करने तक कम हो जाता है, बजाय शुरुआत से बंधन सीखने के।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

GO-Diff एक प्रभावी डेटा-मुक्त वैश्विक संरचना अनुकूलन ढांचा है
बोल्ट्जमान-भारित स्कोर मिलान हानि निम्न-ऊर्जा विन्यास निर्माण को प्रभावी ढंग से निर्देशित कर सकती है
परिशोधित अनुकूलन मॉडल स्थानांतरण के माध्यम से दक्षता में काफी सुधार करता है
नमूना दक्षता और सफलता दर के मामले में पारंपरिक विधियों से बेहतर है

सीमाएं

हाइपरपैरामीटर संवेदनशीलता: नमूना संख्या, तापमान वक्र और प्रशिक्षण चरण महत्वपूर्ण हाइपरपैरामीटर हैं, जिन्हें सावधानीपूर्वक ट्यून करने की आवश्यकता है
स्केलेबिलिटी सीमाएं: वर्तमान परमाणु विसरण मॉडल मुख्य रूप से <20 परमाणु की प्रणालियों पर सत्यापित हैं
प्रणाली आकार: GO-Diff को बहुत बड़ी वास्तविक आकार की प्रणालियों के लिए उपयुक्त बनाने के लिए आगे के अनुसंधान की आवश्यकता है

भविष्य की दिशाएं

बहु-उद्देश्य या घटक डिजाइन अनुकूलन तक विस्तार
गतिशील तापमान समायोजन और अनुकूली नमूनाकरण
बड़ी प्रणालियों के लिए स्केलेबिलिटी में सुधार
प्रॉक्सी त्वरण और बहु-उद्देश्य अनुकूलन

गहन मूल्यांकन

लाभ

विधि नवाचार: पहली बार विसरण मॉडल को डेटा-मुक्त वैश्विक संरचना अनुकूलन में सफलतापूर्वक लागू किया
तकनीकी उन्नति: बोल्ट्जमान-भारित स्कोर मिलान हानि डिजाइन चतुर है, मौजूदा विधियों की जटिलता से बचता है
व्यावहारिक मूल्य: परिशोधित अनुकूलन व्यावहारिक अनुप्रयोगों में महत्वपूर्ण लाभ प्रदर्शित करता है
पर्याप्त प्रयोग: विभिन्न जटिलता की प्रणालियों पर व्यापक परीक्षण
सैद्धांतिक आधार: महत्व नमूनाकरण पर आधारित सैद्धांतिक व्युत्पत्ति कठोर है

कमियां

प्रणाली आकार सीमा: केवल अपेक्षाकृत छोटी परमाणु प्रणालियों (≤20 परमाणु) पर सत्यापित
हाइपरपैरामीटर ट्यूनिंग: विधि कई हाइपरपैरामीटर के प्रति संवेदनशील है, जो इसकी सामान्यता को सीमित कर सकता है
सीमित बेंचमार्किंग: केवल RSS के साथ तुलना, अन्य आधुनिक विधियों के साथ तुलना की कमी
अपर्याप्त सैद्धांतिक विश्लेषण: अभिसरण और नमूना जटिलता के लिए सैद्धांतिक गारंटी की कमी

प्रभाव

शैक्षणिक योगदान: वैश्विक अनुकूलन क्षेत्र में जनन मॉडलिंग का एक नया प्रतिमान प्रस्तुत करता है
व्यावहारिक मूल्य: सामग्री खोज और उत्प्रेरक डिजाइन में संभावित अनुप्रयोग
पुनरुत्पादनीयता: पूर्ण कोड और कार्यान्वयन विवरण प्रदान करता है
प्रेरणादायक महत्व: अनुकूलन समस्याओं में विसरण मॉडल के अनुप्रयोग के लिए नई दिशाएं खोलता है

लागू परिदृश्य

सामग्री खोज: नए उत्प्रेरक और कार्यात्मक सामग्री की संरचना भविष्यवाणी
सतह विज्ञान: अधिशोषण साइटों और सतह पुनर्निर्माण का अनुसंधान
छोटे अणु अनुकूलन: आणविक विन्यास खोज और दवा डिजाइन
मौजूदा संबंधित प्रणालियां: विशेष रूप से उन परिदृश्यों के लिए उपयुक्त जहां समान प्रणालियों के बीच कई अनुकूलन की आवश्यकता होती है

संदर्भ

यह पेपर 38 संबंधित संदर्भों का हवाला देता है, जो वैश्विक अनुकूलन, विसरण मॉडल, मशीन लर्निंग संभावनाओं आदि प्रमुख क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो विधि के विकास के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है।