The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
- معرّف الورقة: 2405.09494
- العنوان: تكييف التماثل لحسابات الأجسام المتعددة ذاتية التوافق
- المؤلفون: Xinyang Dong (معهد الذكاء الاصطناعي للعلوم، بكين وجامعة ميشيغان)، Emanuel Gull (جامعة ميشيغان)
- التصنيف: physics.comp-ph
- تاريخ النشر: 16 مايو 2024 (مسودة مقدمة إلى مجلة الفيزياء الحاسوبية)
- رابط الورقة: https://arxiv.org/abs/2405.09494
تبحث هذه الورقة عن استخدام تماثل المجموعة الفضائية لتسريع الحسابات وتوفير رؤى فيزيائية في الحسابات الرقمية للمواد الصلبة البلورية الدورية. يطبق المؤلفون تكييف تماثل المجموعة الفضائية في حسابات البنية الإلكترونية لطريقة GW ذاتية التوافق عند درجات حرارة محدودة، ويقترحون مخطط توازي فعال على المسرعات. يعتمد التطبيق على طريقة التقطير المتزامن لخصائص Dirac في التمثيل المداري. تُظهر النتائج أن تكييف التماثل في أكواد الأجسام المتعددة ذاتية التوافق يحسّن بشكل كبير من وقت التشغيل، حيث يوفر الحجب القطري على أساس الإسفين غير القابل للاختزال تسريعاً إضافياً.
- المشكلة المراد حلها: تواجه حسابات نظرية الأجسام المتعددة الحديثة (مثل طريقة GW ذاتية التوافق) عبئاً حسابياً ضخماً عند التعامل مع مواد بلورية دورية، مما يتطلب حسابات متكررة للناشرات المعتمدة على التردد والدوال الرأسية والتفاعلات المحجوبة وغيرها من الأجسام المعقدة.
- أهمية المشكلة:
- تماثل المجموعة الفضائية هو مفتاح فهم مواد البلورات ويوفر رؤى فيزيائية
- يمكن لاستخدام التماثل أن يسرع بشكل كبير من الحسابات الرقمية
- يمكن للعمارات الحاسوبية الحديثة مثل وحدات معالجة الرسومات أن تستفيد بفعالية من التوازي الذي يكشفه هيكل المجموعة
- قيود الطرق الموجودة:
- تعتمد أكواد البنية الإلكترونية القياسية (Hartree-Fock و DFT و GW غير ذاتي التوافق) بشكل أساسي على مصفوفة الكثافة أحادية الجسيم، وقد نضجت أشكال تكييف التماثل
- لكن تقنيات الأجسام المتعددة الحديثة تتطلب حساب أجسام تتجاوز مصفوفة الكثافة، مما يفتقر إلى الصيغة الكافية لتكييف التماثل
- الدافع البحثي: تعميم صيغة تكييف التماثل التي أسسها Dovesi وآخرون في نظرية Hartree-Fock و DFT على طريقة GW ذاتية التوافق، وتطبيقها بكفاءة على معمارية GPU الحديثة.
- توسيع الطريقة: توسيع طريقة تكييف التماثل المستندة إلى التقطير المتزامن لخصائص Dirac من النظرية أحادية الجسم إلى حسابات GW متعددة الأجسام ذاتية التوافق
- التطبيق الفعال: تطوير مخطط توازي فعال على مسرعات GPU، مع تحقيق توازي هجين من MPI و CUDA
- تحسين الأداء: إثبات أن تكييف التماثل مع الحجب القطري يمكن أن يحقق تقليلاً بحوالي رتبة واحدة من حيث العمليات الحسابية ذات النقطة العائمة
- تحسين الخوارزمية: اقتراح خوارزمية رقمية كاملة للتعامل مع المجموعات الفضائية غير المتجانسة والتمثيلات الإسقاطية
تبحث هذه الورقة عن كيفية استخدام تماثل المجموعة الفضائية لتسريع الحسابات في حسابات البنية الإلكترونية للمواد الصلبة البلورية الدورية عند درجات حرارة محدودة، خاصة في طريقة GW ذاتية التوافق. المدخلات هي البنية البلورية والهاملتونيان، والمخرجات هي دالة جرين والطاقة الذاتية ذاتية التوافق.
- عمليات المجموعة الفضائية: تُمثل كـ α^={α∣v(α)}، حيث α هي عملية المجموعة النقطية و v(α) هي الترجمة
- تحويل المدارات: تأثير عملية التماثل على المدارات:
α^g(xj)k(r)=exp[−ik~⋅vαx]×[O(α)g(xj)k~(r)]
لزخم معين k، يتم تعريف مصفوفة التمثيل الإسقاطي:
Dk(α)=exp[ik⋅v(α)]Ok(α^)λk(α,β)=exp{ik⋅[v(β)−αv(β)]}
- تعريف خصائص Dirac:
Ωc=hnc∑β∈GD(α)⋅D(γ)⋅D(β)−1
- التقطير المتزامن: الحصول على مصفوفة التحويل Uk من خلال التقطير المتزامن لجميع خصائص Dirac ذات الصلة
- التوسيع إلى نظرية الأجسام المتعددة: التطبيق الأول المنهجي لطريقة التقطير المتزامن لخصائص Dirac على حسابات GW ذاتية التوافق
- تحويل الموتر: تطوير صيغ تحويل التماثل لموتر التفاعل ثلاثي الفهرس:
Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj†(α^)
- تحسين GPU: تصميم مخطط معالجة تدفق غير متزامن واستدعاءات ZGEMM الجماعية لتسريع GPU
تم اختبار أربعة مركبات من فئة III-V والفئة IV:
- Si (المجموعة الفضائية 227، غير متجانسة)
- BN (المجموعة الفضائية 194، غير متجانسة)
- AlP (المجموعة الفضائية 216، متجانسة)
- GaAs (المجموعة الفضائية 216، متجانسة)
- مجموعة الأساس: مجموعة gthdzvp ومجموعة def2-svp-ri المساعدة
- شبكة درجة الحرارة: 114 نقطة زمن وهمي، 103 نقاط تردد بوز
- شبكة الزخم: nk×nk×nk (nk=1,2,4,6)
- عدد العمليات الحسابية ذات النقطة العائمة (FLOP)
- نسبة تسريع GPU
- استخدام الذاكرة
- حساب منطقة بريليوان الكاملة (Full)
- دوران الإسفين غير القابل للاختزال فقط (Rotation)
- الدوران + الحجب القطري (Block Diag)
مثال على Si، مقارنة FLOP عند قيم nk مختلفة:
| nk | nik | Full | Rotation | Block Diag | نسبة التسريع |
|---|
| 1 | 1 | 1.31×1010 | 1.31×1010 | 1.50×109 | 8.7× |
| 2 | 3 | 1.73×1012 | 1.01×1012 | 2.24×1011 | 7.7× |
| 4 | 8 | 1.10×1014 | 2.13×1013 | 8.55×1012 | 12.9× |
| 6 | 16 | 1.25×1015 | 1.43×1014 | 6.87×1013 | 18.2× |
- تحقيق نسبة تسريع خطية تقريباً مثالية على 16 وحدة معالجة رسومات V100
- تُظهر نوى حساب P0 و Σ̃ قابلية توسع ممتازة
- تأثير عدد نقاط k: تصبح مزايا الدوران بين النقاط أكثر وضوحاً مع زيادة العدد الإجمالي لنقاط k
- مزايا الحجب القطري: يكون تأثير الحجب القطري أكثر وضوحاً عندما يكون عدد نقاط k أقل، لأن المزيد من النقاط تقع على سطح الإسفين غير القابل للاختزال
- مزايا المجموعات غير المتجانسة: تُظهر المجموعات الفضائية غير المتجانسة (مثل Si و BN) نسب تسريع أكبر مقارنة بالمجموعات المتجانسة
- تكييف التماثل التقليدي: العمل الرائد لـ Dovesi وآخرين في كود CRYSTAL
- نظرية الأجسام المتعددة: طريقة GW لـ Hedin وتطبيقاتها ذاتية التوافق
- الحوسبة على GPU: تحسين المسرعات لحسابات البنية الإلكترونية
- أول توسيع منهجي لتكييف التماثل إلى حسابات متعددة الأجسام ذاتية التوافق
- توفير حل كامل للتعامل مع المجموعات الفضائية غير المتجانسة
- تطبيق توازي فعال على GPU
- يحقق تكييف التماثل في أكواد الأجسام المتعددة ذاتية التوافق تحسناً كبيراً في وقت التشغيل
- يوفر الحجب القطري على أساس الإسفين غير القابل للاختزال تسريعاً إضافياً
- يمكن لمعمارية GPU أن تستفيد بفعالية من التوازي الذي يكشفه التماثل
- ينحصر التطبيق الحالي في المجموعات الفضائية القياسية، ولا يشمل المجموعات الفضائية المغناطيسية
- بالنسبة للأنظمة التي تحتوي على عدد كبير جداً من نقاط k، تتضاءل مزايا الحجب القطري
- يتطلب ذاكرة GPU كافية لتخزين هياكل البيانات الحرجة
- المجموعات الفضائية المغناطيسية: التوسيع إلى مجموعات Shubnikov للتعامل مع الأنظمة المغناطيسية والنسبية
- الاستجابة البصرية: استخدام معرفة التماثل لتفسير دوال الاستجابة البصرية
- الطرق ذات الرتبة الأعلى: التطبيق على طرق محاكاة أكثر دقة تتضمن دوال رأسية
- الصرامة النظرية: مستندة إلى أساس نظرية المجموعات الناضج، مع اشتقاقات رياضية كاملة
- القيمة العملية: تحقيق تسريع حسابي بحوالي رتبة واحدة، ذو أهمية كبيرة للحسابات واسعة النطاق
- الاكتمال التقني: توفير حل كامل من النظرية إلى التطبيق
- التحقق من الأداء: التحقق من فعالية الطريقة من خلال أنظمة مواد متعددة
- نطاق التطبيق: ينطبق حالياً فقط على الأنظمة الدورية، والقابلية للتوسع إلى الأنظمة السطحية أو المعيبة غير معروفة
- متطلبات الذاكرة: يتطلب التطبيق على GPU ذاكرة عالية، مما قد يحد من تطبيق الأنظمة الكبيرة
- استقرار الخوارزمية: قد يواجه التقطير المتزامن مشاكل استقرار رقمي لمصفوفات التمثيل المداري الكبيرة
- المساهمة الأكاديمية: توفير نموذج قياسي لاستخدام التماثل في حسابات الأجسام المتعددة
- القيمة العملية: تقليل كبير في تكلفة حسابات GW ذاتية التوافق، مما يجعل حساب الأنظمة الأكبر ممكناً
- قابلية التكرار: مطبقة على أساس برمجيات مفتوحة المصدر، مما يسهل اعتماد المجتمع والتحسينات
- مواد بلورية دورية ذات تماثل عالي
- حسابات البنية الإلكترونية التي تتطلب وصفاً دقيقاً لتأثيرات الأجسام المتعددة
- بيئات الحوسبة المتوازية واسعة النطاق، خاصة مجموعات GPU
تستند هذه الورقة بشكل أساسي على الأعمال الرئيسية التالية:
- نظرية تكييف التماثل لـ Dovesi وآخرين (Int. J. Quantum Chem. 1986, 1998)
- طريقة GW لـ Hedin (Phys. Rev. 1965)
- النظرية الرياضية لتماثل المواد الصلبة لـ Bradley و Cracknell
- مبادئ التماثل في فيزياء المواد الصلبة والجزيئات لـ Lax
تمثل هذه الورقة مساهمة مهمة في مجال الفيزياء الحاسوبية، حيث تجمع بنجاح بين نظرية التماثل وحسابات الأجسام المتعددة الحديثة وتقنيات تسريع GPU، مما يوفر حلاً جديداً للحسابات الفعالة للبنية الإلكترونية.