We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
- معرّف الورقة: 2510.13448
- العنوان: GO-Diff: Data-free and amortized global structure optimization
- المؤلفون: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (جامعة الدنمارك التقنية)
- التصنيف: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
- تاريخ النشر: 15 أكتوبر 2025 (نسخة أولية)
- رابط الورقة: https://arxiv.org/abs/2510.13448
تقدم هذه الورقة GO-Diff، وهي طريقة لتحسين البنية العالمية قائمة على نماذج الانتشار، قادرة على أخذ عينات مباشرة من التكوينات الذرية منخفضة الطاقة دون الحاجة إلى بيانات سابقة أو استرخاء صريح. يتم تدريب GO-Diff من الصفر باستخدام خسارة مطابقة النقاط المرجحة بـ Boltzmann، مستفيدة فقط من دالة الطاقة المعروفة لتوجيه عملية التوليد نحو المناطق الديناميكية الحرارية المواتية. تستخدم الطريقة حلقة دورية من مرحلتين تتضمن أخذ عينات ذاتية وتحسين النموذج، مما يحسن تدريجياً قدرتها على استهداف البنى منخفضة الطاقة. بالمقارنة مع خطوط سير العمل التقليدية، تحقق GO-Diff نتائج تنافسية مع عدد أقل بكثير من تقييمات الطاقة. علاوة على ذلك، من خلال إعادة استخدام النماذج المدربة مسبقاً عبر الأنظمة ذات الصلة، تدعم GO-Diff التحسين المطفأ — القدرة على التقارب بشكل أسرع على المهام الجديدة دون الحاجة إلى إعادة التدريب من الصفر.
يهدف هذا البحث إلى حل مشكلة تحسين البنية العالمية للأنظمة الذرية، أي البحث عن التكوينات الذرية المستقرة منخفضة الطاقة على سطح الطاقة الكامنة (PES). سطح الطاقة الكامنة هو دالة عالية الأبعاد وغير محدبة تربط المواضع الذرية بالطاقة الكامنة المقابلة، واستكشاف هذا السطح لتحديد البنى منخفضة الطاقة يمثل تحدياً أساسياً في علوم المواد الحسابية والكيمياء والحفز.
يعتبر تحسين البنية العالمية أساساً للتطبيقات التي تتراوح من اكتشاف الأسطح الحفازة إلى تصميم المواد الوظيفية، وهو حاسم لـ:
- اكتشاف أسطح حفازة جديدة
- تصميم المواد الوظيفية
- التنبؤ بالتكوينات الذرية المستقرة
- فهم خصائص المواد
تعاني الطرق التقليدية للتحسين العالمي من المشاكل التالية:
- التكلفة الحسابية العالية: تعتمد طرق مثل البحث العشوائي عن البنى (RSS) والقفز بين الأحواض والخوارزميات الجينية والتلدين المحاكى على الاسترخاء المحلي والمحسّنات القائمة على التدرج، مما يتطلب عدداً كبيراً من تقييمات الطاقة والقوة
- الاقتصار على التحسين المحلي: تميل إلى الوقوع في الحد الأدنى المحلي، مما يحد من استكشاف المناظر الطبيعية المعقدة للطاقة
- الاعتماد على البيانات: تتطلب الجهود الكامنة بين الذرات المستندة إلى التعلم الآلي بيانات تدريب مختارة بعناية لالتقاط الحد الأدنى ذي الصلة، وإلا قد تقع في حد أدنى محلي معزز ذاتياً
- نقص القابلية للنقل: يصعب على الطرق الموجودة إعادة استخدام المعرفة المكتسبة عبر الأنظمة ذات الصلة
أظهرت نماذج الانتشار وعوداً في توليد البنى في علوم الجزيئات والمواد، لكن تطبيقها على مهام التحسين العالمي يشكل تحدياً، لأن الهدف هو أخذ عينات من التكوينات النادرة منخفضة الطاقة المقابلة للحد الأدنى العالمي لـ PES، لكن توزيع البيانات لهذه البنى عادة ما يكون غير معروف أو غير متاح.
- اقتراح طريقة توليد تحسين خالية من البيانات: أخذ عينات مباشرة من الحد الأدنى لسطح الطاقة الكامنة دون الحاجة إلى بيانات سابقة أو استرخاء صريح
- تطوير دالة خسارة مرجحة بـ Boltzmann: دمج استراتيجية التلدين لتوجيه أخذ العينات نحو المناطق منخفضة الطاقة مع الحفاظ على الاستكشاف
- تحقيق التحسين المطفأ: إعادة استخدام المعرفة من خلال نقل النماذج المدربة مسبقاً عبر الأنظمة ذات الصلة
- التحقق من كفاءة العينات العليا: كفاءة عينات أعلى مقارنة بطرق البحث الكلاسيكية
الإدخال: دالة الطاقة E(x) للنظام الذري، حيث تمثل x التكوين الذري
الإخراج: التكوينات الذرية المستقرة منخفضة الطاقة
الهدف: أخذ عينات من توزيع Boltzmann: πT(x)=ZTexp(−E(x)/T)
تستخدم GO-Diff عملية حلقة أخذ عينات ذاتية:
- يولد النموذج البنى الذرية من خلال الانتشار العكسي
- تقييم الطاقة للبنى المولدة
- استخدام عينات النتائج لتحسين النموذج
يتم الحفاظ على مخزن مؤقت للإعادة B={(x0(i),E(i))} يخزن التكوينات المولدة وطاقاتها.
الابتكار الأساسي هو خسارة مطابقة النقاط المرجحة بـ Boltzmann:
LθBoltzmann=Et∼U(0,1)[λ(t)Ex0∼q,xt∼pt∣0(xt∣x0)w(E)∥sθ(xt,t)−∇xtlogpt∣0(xt∣x0)∥22]
حيث يكون وزن Boltzmann:
w(E)=∑E(i)∈Bexp(−E(i)/T)exp(−E/T)
يتجنب هذا التصميم الحاجة إلى أخذ عينات مباشرة من توزيع Boltzmann الحقيقي من خلال أخذ العينات ذات الأهمية.
يتم تلدين درجة الحرارة T من قيمة أولية عالية إلى قيمة نهائية منخفضة، مما يوازن بين الاستكشاف والاستغلال:
- في المراحل المبكرة: درجة حرارة عالية تشجع الاستكشاف الواسع
- في المراحل المتأخرة: درجة حرارة منخفضة تتقارب نحو الحد الأدنى العميق
الاستفادة من القوى الذرية التي عادة ما تكون متاحة مع الطاقة:
- إرفاق رأس تنبؤ القوة على العمود الفقري للتمثيل المشترك لشبكة الرسم البياني العصبية
- استخدام القوى المتنبأ بها في مخطط أخذ العينات التنبؤي-التصحيحي:
Δx=α(1−t)ζFθ(x)
- مع اقتراب وقت الانتشار t→0، يلعب حد التصحيح دوراً أكبر في التوجيه
- الترجيح المباشر بـ Boltzmann: تجنب تقييمات القوة وتقديرات مونت كارلو، باستخدام خسارة مطابقة النقاط المرجحة بـ Boltzmann مباشرة
- التعلم ذاتي الإشراف: التعلم من توليداتها الخاصة، بدون الحاجة إلى بيانات خارجية
- نقل النموذج: إظهار القدرة على نقل النماذج المدربة مسبقاً عبر الأنظمة ذات الصلة
- التوجيه الفيزيائي: دمج معلومات حقل القوة لتسريع التقارب
استخدام جهد MACE-MP0 العام لمهمتي تحسين ذريتين:
- تحسين ذرة إضافية من Pt على سطح درجة Pt: نظام ثلاثي الأبعاد، يمكن تصوره كـ 2D من خلال الإسقاط على طول الخط الطبيعي للسطح
- اكتشاف سباعي Pt على سطح Pt(111) 6×6: نظام أكثر تعقيداً، يستخدم للمقارنة والتحقق من صحة التحسين المطفأ
- معدل النجاح في اكتشاف البنية المستهدفة
- متوسط عدد تقييمات الطاقة المطلوبة للعثور على البنية المستهدفة
- أفضل طاقة بمرور الوقت
- البحث العشوائي عن البنى (RSS): طريقة تقليدية تم تنفيذها باستخدام حزمة AGOX
- متغيرات GO-Diff: بدون FFG، مع FFG، مع نقل النموذج
المعاملات الفائقة العامة:
- خطوات أخذ عينات الانتشار: 500
- جدول الضوضاء: خطي (VE-SDE)
- معمارية نموذج النقاط: PaiNN GNN (4 كتل)، قطع 6Å
- درجة الحرارة النهائية: 0.02
- معدل التعلم: 10^-4
- المحسّن: AdamW
معاملات المهام المحددة:
- ذرة إضافية من Pt: حجم المخزن المؤقت 16، 32 عينة لكل تكرار، 10 تكرارات تلدين أسي
- سباعي Pt: حجم المخزن المؤقت 64، 128 عينة لكل تكرار، 20 تكرار تلدين أسي
- أظهرت بنجاح أن أخذ العينات يتركز تدريجياً في أحواض الطاقة المنخفضة
- تحقق من فعالية خسارة الترجيح بـ Boltzmann وجدول التلدين
| الطريقة | عدد التقييمات | معدل النجاح | متوسط التكرار الناجح |
|---|
| RSS | 10,000 | 1/8 | 7,816 |
| GO-Diff | 2,560 | 5/8 | 1,667 |
| GO-Diff + FFG | 2,560 | 8/8 | 1,994 |
| GO-Diff + Transfer | 1,280 | 7/8 | 591 |
- كفاءة العينات: تحقق GO-Diff معدل نجاح أفضل مع عدد أقل بكثير من تقييمات الطاقة
- تأثير التوجيه بحقل القوة: يحسن FFG معدل النجاح (من 5/8 إلى 8/8) والأداء
- مزايا التعلم بالنقل: يقلل نقل النموذج عدد التقييمات المطلوبة بأكثر من مرتين (من 1,667 إلى 591)
- الاستتباب: عشوائية عملية الانتشار تمكن GO-Diff من الهروب بقوة من الحد الأدنى المحلي
يتوقع تسريع التعلم بالنقل، لأن النموذج المنقول قد التقط بالفعل التفضيلات الترابطية (مثل استقرار مواقع التجويف أسفل حافة الدرجة)، مما يقلل مهمة التحسين إلى ضبط الهندسة الذرية بدلاً من تعلم الترابط من الصفر.
- البحث العشوائي عن البنى والقفز بين الأحواض والخوارزميات الجينية والتلدين المحاكى
- جهود الذرات بين الذرات المستندة إلى التعلم الآلي (مدربة مسبقاً أو متعلمة عبر الإنترنت)
- توليد البنى في علوم الجزيئات والمواد
- نماذج الانتشار للتحسين ذي الصندوق الأسود (DDOM)
- أخذ عينات Boltzmann (iDEM و BNEM و Adjoint Sampling)
- تجنب تقديرات مونت كارلو وتسميات القوة
- حلقة تدريب أبسط وأكثر كفاءة في العينات
- أول عرض توضيحي لقدرة التعلم بالنقل عبر الأنظمة
- GO-Diff هو إطار عمل فعال للتحسين الهيكلي العالمي الخالي من البيانات
- يمكن لخسارة مطابقة النقاط المرجحة بـ Boltzmann توجيه توليد التكوينات منخفضة الطاقة بشكل فعال
- يحسن التحسين المطفأ من خلال نقل النموذج الكفاءة بشكل كبير
- يتفوق على الطرق التقليدية من حيث كفاءة العينات ومعدل النجاح
- حساسية المعاملات الفائقة: عدد العينات ومنحنى درجة الحرارة وخطوات التدريب هي معاملات فائقة حاسمة تتطلب ضبطاً دقيقاً
- قيود قابلية التوسع: تم التحقق من نماذج الانتشار الذري الحالية بشكل أساسي على الأنظمة التي تحتوي على <20 ذرة
- حجم النظام: يتطلب مزيد من البحث لجعل GO-Diff قابلة للتطبيق على الأنظمة الحقيقية الكبيرة جداً
- التوسع إلى تحسين متعدد الأهداف أو متعدد المكونات
- تعديل درجة الحرارة الديناميكي وأخذ العينات التكيفي
- تحسين قابلية التوسع للأنظمة الكبيرة
- التسريع بالوكيل والتحسين متعدد الأهداف
- ابتكار الطريقة: أول تطبيق ناجح لنماذج الانتشار على التحسين الهيكلي العالمي الخالي من البيانات
- التقدم التقني: تصميم خسارة مطابقة النقاط المرجحة بـ Boltzmann ذكي، يتجنب تعقيد الطرق الموجودة
- القيمة العملية: يظهر التحسين المطفأ مزايا كبيرة في التطبيقات العملية
- التجارب الشاملة: اختبار شامل على أنظمة بدرجات تعقيد مختلفة
- الأساس النظري: الاشتقاق النظري القائم على أخذ العينات ذات الأهمية صارم
- قيود حجم النظام: التحقق فقط على الأنظمة الذرية الصغيرة نسبياً (≤20 ذرة)
- ضبط المعاملات الفائقة: الطريقة حساسة لعدة معاملات فائقة، مما قد يحد من عموميتها
- المقارنات المحدودة: مقارنة فقط مع RSS، تفتقد المقارنة مع الطرق الحديثة الأخرى
- نقص التحليل النظري: نقص الضمانات النظرية للتقارب وتعقيد العينات
- المساهمة الأكاديمية: تقديم نموذج توليد جديد لمجال التحسين العالمي
- القيمة العملية: تطبيقات محتملة في اكتشاف المواد وتصميم الحفازات
- قابلية التكرار: توفير تفاصيل الكود والتنفيذ الكاملة
- الأهمية الإرشادية: فتح اتجاهات جديدة لتطبيق نماذج الانتشار على مشاكل التحسين
- اكتشاف المواد: التنبؤ بالبنية للحفازات الجديدة والمواد الوظيفية
- علم سطح المواد: دراسة مواقع الامتزاز وإعادة بناء السطح
- تحسين الجزيئات الصغيرة: البحث عن التوافقيات الجزيئية وتصميم الأدوية
- الأنظمة ذات الصلة الموجودة: مناسبة بشكل خاص للسيناريوهات التي تتطلب تحسينات متعددة عبر أنظمة متشابهة
تستشهد هذه الورقة بـ 38 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات التحسين العالمي ونماذج الانتشار والجهود الكامنة المستندة إلى التعلم الآلي، مما يوفر أساساً نظرياً قوياً لتطوير الطريقة.