The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
- ID del Artículo: 2405.09494
- Título: Symmetry adaptation for self-consistent many-body calculations
- Autores: Xinyang Dong (AI for Science Institute Beijing & University of Michigan), Emanuel Gull (University of Michigan)
- Clasificación: physics.comp-ph
- Fecha de Publicación: 16 de mayo de 2024 (Preimpresión enviada a Computer Physics Communications)
- Enlace del Artículo: https://arxiv.org/abs/2405.09494
Este artículo investiga la utilización de simetrías de grupos espaciales para acelerar cálculos y proporcionar perspectivas físicas en simulaciones numéricas de sólidos cristalinos periódicos. Los autores implementan la adaptación de simetría de grupos espaciales en cálculos de estructura electrónica mediante el método GW autoconsistente a temperatura finita, y proponen esquemas eficientes de paralelización en aceleradores. La implementación utiliza el método de diagonalización simultánea de características de Dirac en representación orbital. Los resultados demuestran que la adaptación de simetría en códigos autoconsistentes de muchos cuerpos mejora significativamente el tiempo de ejecución, proporcionando aceleración adicional mediante la bloquediagonalización basada en la cuña irreducible.
- Problema a Resolver: Los cálculos modernos de teoría de muchos cuerpos (como el método GW autoconsistente) enfrentan una carga computacional enorme al procesar materiales cristalinos periódicos, requiriendo cálculos repetidos de propagadores dependientes de frecuencia, funciones de vértice e interacciones apantalladas complejas.
- Importancia del Problema:
- La simetría de grupos espaciales es fundamental para comprender materiales cristalinos y proporciona perspectivas físicas
- La utilización de simetría puede acelerar significativamente cálculos numéricos
- Las arquitecturas computacionales modernas como GPUs pueden explotar efectivamente el paralelismo expuesto por estructuras de grupo
- Limitaciones de Métodos Existentes:
- Los códigos estándar de estructura electrónica (Hartree-Fock, DFT, GW no autoconsistente) se basan principalmente en matrices de densidad de una partícula, con formalismo de adaptación de simetría ya maduro
- Sin embargo, las técnicas modernas de muchos cuerpos requieren calcular objetos más allá de matrices de densidad, con formalismo de adaptación de simetría insuficientemente desarrollado
- Motivación de Investigación: Generalizar el formalismo de adaptación de simetría pionero de Dovesi et al. en teoría Hartree-Fock y DFT al método GW autoconsistente, e implementar paralelización eficiente en arquitecturas GPU modernas.
- Extensión de Método: Extender el método de adaptación de simetría basado en diagonalización simultánea de características de Dirac desde teoría de una partícula a cálculos GW autoconsistentes de muchos cuerpos
- Implementación Eficiente: Desarrollar esquemas eficientes de paralelización en aceleradores GPU, implementando paralelización híbrida MPI y CUDA
- Mejora de Rendimiento: Demostrar que la adaptación de simetría combinada con bloquediagonalización puede lograr reducción de operaciones de punto flotante de aproximadamente un orden de magnitud
- Optimización de Algoritmos: Proponer algoritmos numéricos completos para manejar grupos espaciales no isomorfos y representaciones proyectivas
Este artículo investiga cómo utilizar simetrías de grupos espaciales para acelerar cálculos de estructura electrónica en sólidos cristalinos periódicos a temperatura finita, particularmente en el método GW autoconsistente. La entrada es la estructura cristalina y el hamiltoniano, y la salida es la función de Green autoconsistente y la autoenergía.
- Operaciones de Grupo Espacial: Representadas como α^={α∣v(α)}, donde α es la operación de grupo puntual y v(α) es la traslación
- Transformación Orbital: La acción de la operación de simetría en orbitales es:
α^g(xj)k(r)=exp[−ik~⋅vαx]×[O(α)g(xj)k~(r)]
Para el momento k, se define la matriz de representación proyectiva:
Dk(α)=exp[ik⋅v(α)]Ok(α^)λk(α,β)=exp{ik⋅[v(β)−αv(β)]}
- Definición de Características de Dirac:
Ωc=hnc∑β∈GD(α)⋅D(γ)⋅D(β)−1
- Diagonalización Simultánea: Obtener la matriz de transformación Uk mediante diagonalización simultánea de todas las características de Dirac relevantes
- Extensión a Teoría de Muchos Cuerpos: Primera aplicación sistemática del método de diagonalización simultánea de características de Dirac a cálculos GW autoconsistentes
- Transformación de Tensores: Desarrollo de fórmulas de transformación de simetría para tensores de interacción de tres índices:
Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj†(α^)
- Optimización GPU: Diseño de esquema de aceleración GPU con procesamiento de flujos asincrónico y llamadas ZGEMM por lotes
Se probaron cuatro compuestos de familias III-V y IV:
- Si (grupo espacial 227, no isomorfo)
- BN (grupo espacial 194, no isomorfo)
- AlP (grupo espacial 216, isomorfo)
- GaAs (grupo espacial 216, isomorfo)
- Conjunto de bases: conjunto de bases gthdzvp y conjunto de bases auxiliar def2-svp-ri
- Malla de temperatura: 114 puntos de tiempo imaginario, 103 puntos de frecuencia bosónica
- Malla de momento: nk×nk×nk (nk=1,2,4,6)
- Número de operaciones de punto flotante (FLOP)
- Factor de aceleración GPU
- Uso de memoria
- Cálculo de zona de Brillouin completa (Full)
- Solo rotaciones de cuña irreducible (Rotation)
- Rotación + bloquediagonalización (Block Diag)
Comparación de FLOP para Si con diferentes valores de nk:
| nk | nik | Full | Rotation | Block Diag | Factor de Aceleración |
|---|
| 1 | 1 | 1.31×1010 | 1.31×1010 | 1.50×109 | 8.7× |
| 2 | 3 | 1.73×1012 | 1.01×1012 | 2.24×1011 | 7.7× |
| 4 | 8 | 1.10×1014 | 2.13×1013 | 8.55×1012 | 12.9× |
| 6 | 16 | 1.25×1015 | 1.43×1014 | 6.87×1013 | 18.2× |
- Se logró factor de aceleración lineal aproximadamente ideal en 16 GPUs V100
- Los núcleos de cálculo P0 y Σ̃ muestran excelente escalabilidad
- Efecto del Número de Puntos k: La ventaja de rotación entre puntos se vuelve más evidente con el aumento del número total de puntos k
- Ventaja de Bloquediagonalización: La bloquediagonalización es más efectiva con menos puntos k, ya que más puntos se encuentran en la superficie de la zona irreducible
- Ventaja de Grupos No Isomorfos: Los grupos espaciales no isomorfos (como Si, BN) muestran factores de aceleración mayores que los grupos isomorfos
- Adaptación de Simetría Tradicional: Trabajo pionero de Dovesi et al. en el código CRYSTAL
- Teoría de Muchos Cuerpos: Método GW de Hedin e implementaciones autoconsistentes
- Computación GPU: Optimización de aceleradores para cálculos de estructura electrónica
- Primera extensión sistemática de adaptación de simetría a cálculos autoconsistentes de muchos cuerpos
- Proporciona esquema completo de manejo de grupos espaciales no isomorfos
- Implementa paralelización GPU eficiente
- La adaptación de simetría en códigos autoconsistentes de muchos cuerpos proporciona mejoras significativas en tiempo de ejecución
- La bloquediagonalización proporciona aceleración adicional basada en la limitación de cuña irreducible
- La arquitectura GPU puede explotar efectivamente el paralelismo expuesto por simetría
- La implementación actual se limita a grupos espaciales estándar, sin incluir grupos espaciales magnéticos
- Para sistemas con número muy grande de puntos k, la ventaja de bloquediagonalización se debilita
- Se requiere memoria GPU suficiente para almacenar estructuras de datos críticas
- Grupos Espaciales Magnéticos: Extensión a grupos de Shubnikov para manejar sistemas magnéticos y relativistas
- Respuesta Óptica: Utilizar conocimiento de simetría para interpretar funciones de respuesta óptica
- Métodos de Orden Superior: Aplicación a métodos de simulación más precisos que incluyen funciones de vértice
- Rigor Teórico: Basado en fundamentos maduros de teoría de grupos, con derivaciones matemáticas completas
- Valor Práctico: Implementa aceleración computacional de aproximadamente un orden de magnitud, significativa para cálculos a gran escala
- Completitud Técnica: Proporciona esquema completo desde teoría hasta implementación
- Verificación de Rendimiento: Valida la efectividad del método mediante múltiples sistemas de materiales
- Rango de Aplicabilidad: Actualmente solo aplicable a sistemas periódicos; la extensibilidad a sistemas de superficie o con defectos es desconocida
- Requisitos de Memoria: La implementación GPU tiene requisitos de memoria elevados, que pueden limitar aplicaciones a sistemas grandes
- Estabilidad de Algoritmos: Para matrices de representación orbital grandes, la diagonalización simultánea puede encontrar problemas de estabilidad numérica
- Contribución Académica: Proporciona paradigma estándar para la utilización de simetría en cálculos de muchos cuerpos
- Valor Práctico: Reduce significativamente el costo de cálculos GW autoconsistentes, haciendo posible cálculos de sistemas más grandes
- Reproducibilidad: Implementado basado en software de código abierto, facilitando adopción y mejora por la comunidad
- Materiales cristalinos periódicos con alta simetría
- Cálculos de estructura electrónica que requieren descripción precisa de efectos de muchos cuerpos
- Entornos de computación paralela a gran escala, particularmente clusters GPU
Este artículo se basa principalmente en los siguientes trabajos clave:
- Teoría de adaptación de simetría de Dovesi et al. (Int. J. Quantum Chem. 1986, 1998)
- Método GW de Hedin (Phys. Rev. 1965)
- Teoría matemática de simetría en sólidos de Bradley & Cracknell
- Principios de simetría en física de sólidos y moléculas de Lax
Este artículo representa una contribución importante al campo de la física computacional, combinando exitosamente teoría de simetría con cálculos modernos de muchos cuerpos y tecnología de aceleración GPU, proporcionando nuevas soluciones para cálculos eficientes de estructura electrónica.