The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
- ID de l'article: 2405.09494
- Titre: Adaptation de symétrie pour les calculs auto-cohérents à plusieurs corps
- Auteurs: Xinyang Dong (AI for Science Institute Beijing & University of Michigan), Emanuel Gull (University of Michigan)
- Classification: physics.comp-ph
- Date de publication: 16 mai 2024 (Prépublication soumise à Computer Physics Communications)
- Lien de l'article: https://arxiv.org/abs/2405.09494
Cet article étudie l'utilisation des symétries de groupe spatial pour accélérer les calculs numériques et fournir des perspectives physiques dans les calculs de solides cristallins périodiques. Les auteurs implémentent l'adaptation de symétrie de groupe spatial dans les calculs de structure électronique utilisant la méthode GW auto-cohérente à température finie, et proposent un schéma de parallélisation efficace sur accélérateurs. L'implémentation utilise la méthode de diagonalisation simultanée des caractères de Dirac en représentation orbitale. Les résultats montrent que l'adaptation de symétrie dans les codes multi-corps auto-cohérents améliore significativement le temps d'exécution, avec une accélération supplémentaire fournie par la bloc-diagonalisation sur la base du coin irréductible.
- Problème à résoudre: Les calculs modernes de théorie à plusieurs corps (tels que la méthode GW auto-cohérente) font face à une charge computationnelle énorme lors du traitement de matériaux cristallins périodiques, nécessitant le calcul répété d'objets complexes tels que les propagateurs dépendant de la fréquence, les fonctions de sommet et les interactions écrantées.
- Importance du problème:
- La symétrie de groupe spatial est essentielle pour comprendre les matériaux cristallins et fournir des perspectives physiques
- L'exploitation de la symétrie peut accélérer significativement les calculs numériques
- Les architectures informatiques modernes comme les GPU peuvent exploiter efficacement le parallélisme exposé par la structure de groupe
- Limitations des méthodes existantes:
- Les codes de structure électronique standard (Hartree-Fock, DFT, GW non auto-cohérent) sont principalement basés sur la matrice de densité à une particule, pour laquelle la formalisation de l'adaptation de symétrie est mature
- Cependant, les techniques multi-corps modernes nécessitent le calcul d'objets au-delà de la matrice de densité, pour lesquels la formalisation de l'adaptation de symétrie est insuffisante
- Motivation de la recherche: Généraliser la formalisation de l'adaptation de symétrie pionnière par Dovesi et al. dans les théories Hartree-Fock et DFT à la méthode GW auto-cohérente, et implémenter une parallélisation efficace sur les architectures GPU modernes.
- Extension méthodologique: Extension de la méthode d'adaptation de symétrie basée sur la diagonalisation simultanée des caractères de Dirac des théories à un corps aux calculs GW multi-corps auto-cohérents
- Implémentation efficace: Développement d'un schéma de parallélisation efficace sur accélérateurs GPU, réalisant un parallélisme hybride MPI et CUDA
- Amélioration des performances: Démonstration que l'adaptation de symétrie combinée à la bloc-diagonalisation peut réduire les opérations en virgule flottante d'environ un ordre de grandeur
- Optimisation algorithmique: Proposition d'un algorithme numérique complet pour traiter les groupes spatiaux non isomorphes et les représentations projectives
Cet article étudie comment exploiter la symétrie de groupe spatial pour accélérer les calculs de structure électronique de solides cristallins périodiques à température finie, en particulier dans la méthode GW auto-cohérente. L'entrée est la structure cristalline et l'hamiltonien, la sortie étant la fonction de Green auto-cohérente et l'auto-énergie.
- Opérations de groupe spatial: Représentées comme α^={α∣v(α)}, où α est l'opération de groupe ponctuel et v(α) est la translation
- Transformation orbitale: L'action de l'opération de symétrie sur les orbitales est:
α^g(xj)k(r)=exp[−ik~⋅vαx]×[O(α)g(xj)k~(r)]
Pour le moment k, les matrices de représentation projective sont définies comme:
Dk(α)=exp[ik⋅v(α)]Ok(α^)λk(α,β)=exp{ik⋅[v(β)−αv(β)]}
- Définition des caractères de Dirac:
Ωc=hnc∑β∈GD(α)⋅D(γ)⋅D(β)−1
- Diagonalisation simultanée: Obtention de la matrice de transformation Uk par diagonalisation simultanée de tous les caractères de Dirac pertinents
- Extension à la théorie multi-corps: Application systématique pour la première fois de la méthode de diagonalisation simultanée des caractères de Dirac aux calculs GW auto-cohérents
- Transformation tensorielle: Développement des formules de transformation de symétrie pour les tenseurs d'interaction à trois indices:
Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj†(α^)
- Optimisation GPU: Conception d'un schéma d'accélération GPU avec traitement asynchrone par flux et appels ZGEMM par lots
Test sur quatre composés III-V et IV:
- Si (groupe spatial 227, non isomorphe)
- BN (groupe spatial 194, non isomorphe)
- AlP (groupe spatial 216, isomorphe)
- GaAs (groupe spatial 216, isomorphe)
- Ensemble de base: ensemble gthdzvp et ensemble auxiliaire def2-svp-ri
- Grille de température: 114 points de temps imaginaire, 103 points de fréquence bosonique
- Grille de moment: nk×nk×nk (nk=1,2,4,6)
- Nombre d'opérations en virgule flottante (FLOP)
- Accélération GPU
- Utilisation de la mémoire
- Calcul de la zone de Brillouin complète (Full)
- Rotation du coin irréductible uniquement (Rotation)
- Rotation + bloc-diagonalisation (Block Diag)
Comparaison des FLOP pour Si à différentes valeurs de nk:
| nk | nik | Full | Rotation | Block Diag | Accélération |
|---|
| 1 | 1 | 1.31×1010 | 1.31×1010 | 1.50×109 | 8.7× |
| 2 | 3 | 1.73×1012 | 1.01×1012 | 2.24×1011 | 7.7× |
| 4 | 8 | 1.10×1014 | 2.13×1013 | 8.55×1012 | 12.9× |
| 6 | 16 | 1.25×1015 | 1.43×1014 | 6.87×1013 | 18.2× |
- Réalisation d'une accélération quasi-linéaire idéale sur 16 GPU V100
- Les noyaux de calcul P0 et Σ̃ montrent une excellente scalabilité
- Effet du nombre de points k: L'avantage de la rotation entre points devient plus apparent avec l'augmentation du nombre total de points k
- Avantage de la bloc-diagonalisation: L'effet de la bloc-diagonalisation est plus significatif avec moins de points k, car plus de points se situent à la surface de la zone irréductible
- Avantage des groupes non isomorphes: Les groupes spatiaux non isomorphes (tels que Si, BN) montrent des accélérations plus importantes que les groupes isomorphes
- Adaptation de symétrie traditionnelle: Travaux pionniers de Dovesi et al. dans le code CRYSTAL
- Théorie multi-corps: Méthode GW de Hedin et ses implémentations auto-cohérentes
- Calcul GPU: Optimisation des accélérateurs pour les calculs de structure électronique
- Extension systématique pour la première fois de l'adaptation de symétrie aux calculs multi-corps auto-cohérents
- Fourniture d'une solution complète pour le traitement des groupes spatiaux non isomorphes
- Implémentation d'une parallélisation GPU efficace
- L'adaptation de symétrie apporte une amélioration significative du temps d'exécution dans les codes multi-corps auto-cohérents
- La bloc-diagonalisation fournit une accélération supplémentaire sur la base de la restriction au coin irréductible
- L'architecture GPU peut exploiter efficacement le parallélisme exposé par la symétrie
- L'implémentation actuelle est limitée aux groupes spatiaux standard, n'incluant pas les groupes spatiaux magnétiques
- Pour les systèmes avec un très grand nombre de points k, l'avantage de la bloc-diagonalisation s'affaiblit
- Une mémoire GPU suffisante est nécessaire pour stocker les structures de données critiques
- Groupes spatiaux magnétiques: Extension aux groupes de Shubnikov pour traiter les systèmes magnétiques et relativistes
- Réponse optique: Utilisation des connaissances de symétrie pour interpréter les fonctions de réponse optique
- Méthodes d'ordre supérieur: Application à des méthodes de simulation plus précises incluant les fonctions de sommet
- Rigueur théorique: Basée sur des fondements de théorie des groupes matures, avec dérivations mathématiques complètes
- Valeur pratique: Réalisation d'une accélération computationnelle d'environ un ordre de grandeur, d'une importance majeure pour les calculs à grande échelle
- Complétude technique: Fourniture d'une solution complète de la théorie à l'implémentation
- Vérification des performances: Validation de l'efficacité de la méthode sur plusieurs systèmes matériels
- Portée d'application: Actuellement applicable uniquement aux systèmes périodiques, l'extensibilité aux systèmes de surface ou défectueux est inconnue
- Exigences de mémoire: L'implémentation GPU a des exigences élevées en mémoire, pouvant limiter l'application aux grands systèmes
- Stabilité algorithmique: Pour les grandes matrices de représentation orbitale, la diagonalisation simultanée peut rencontrer des problèmes de stabilité numérique
- Contribution académique: Fourniture d'un paradigme standard pour l'exploitation de la symétrie dans les calculs multi-corps
- Valeur pratique: Réduction significative du coût des calculs GW auto-cohérents, rendant possible le calcul de systèmes plus grands
- Reproductibilité: Implémentation basée sur des logiciels libres, facilitant l'adoption et l'amélioration par la communauté
- Matériaux cristallins périodiques avec haute symétrie
- Calculs de structure électronique nécessitant une description précise des effets multi-corps
- Environnements de calcul parallèle à grande échelle, en particulier les grappes GPU
Cet article s'appuie principalement sur les travaux clés suivants:
- Théorie de l'adaptation de symétrie de Dovesi et al. (Int. J. Quantum Chem. 1986, 1998)
- Méthode GW de Hedin (Phys. Rev. 1965)
- Théorie mathématique de la symétrie des solides de Bradley & Cracknell
- Principes de symétrie en physique des solides et moléculaire de Lax
Cet article constitue une contribution importante au domaine de la physique computationnelle, combinant avec succès la théorie de la symétrie avec les calculs multi-corps modernes et la technologie d'accélération GPU, fournissant une nouvelle solution pour les calculs de structure électronique efficaces.