The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
- ID articolo: 2405.09494
- Titolo: Symmetry adaptation for self-consistent many-body calculations
- Autori: Xinyang Dong (AI for Science Institute Beijing & University of Michigan), Emanuel Gull (University of Michigan)
- Classificazione: physics.comp-ph
- Data di pubblicazione: 16 maggio 2024 (Preprint sottomesso a Computer Physics Communications)
- Link articolo: https://arxiv.org/abs/2405.09494
Questo articolo indaga l'utilizzo della simmetria del gruppo spaziale per accelerare i calcoli e fornire intuizioni fisiche nei calcoli numerici di solidi cristallini periodici. Gli autori implementano l'adattamento della simmetria del gruppo spaziale nel metodo GW autoconsistente a temperatura finita per i calcoli della struttura elettronica e propongono uno schema di parallelizzazione efficiente su acceleratori. L'implementazione utilizza il metodo di diagonalizzazione simultanea dei caratteri di Dirac nella rappresentazione orbitale. I risultati dimostrano che l'adattamento della simmetria nel codice autoconsistente a molti corpi migliora significativamente il tempo di esecuzione, con la blocco-diagonalizzazione sulla base del cuneo irriducibile che fornisce ulteriore accelerazione.
- Problema da risolvere: I calcoli moderni della teoria a molti corpi (come il metodo GW autoconsistente) affrontano un enorme carico computazionale nel trattamento di materiali cristallini periodici, richiedendo il calcolo ripetuto di oggetti complessi come propagatori dipendenti dalla frequenza, funzioni vertice e interazioni schermate.
- Importanza del problema:
- La simmetria del gruppo spaziale è fondamentale per comprendere i materiali cristallini e fornisce intuizioni fisiche
- L'utilizzo della simmetria può accelerare significativamente i calcoli numerici
- Le architetture di calcolo moderne come le GPU possono sfruttare efficacemente il parallelismo esposto dalla struttura di gruppo
- Limitazioni dei metodi esistenti:
- I codici standard di struttura elettronica (Hartree-Fock, DFT, GW non autoconsistente) si basano principalmente sulla matrice di densità a singola particella, per la quale la formalizzazione dell'adattamento della simmetria è già matura
- Tuttavia, le tecniche moderne a molti corpi richiedono il calcolo di oggetti al di là della matrice di densità, per i quali la formalizzazione dell'adattamento della simmetria è insufficiente
- Motivazione della ricerca: Estendere la formalizzazione dell'adattamento della simmetria sviluppata da Dovesi e altri nella teoria di Hartree-Fock e DFT al metodo GW autoconsistente, e implementare un'efficiente parallelizzazione su architetture GPU moderne.
- Estensione del metodo: Estensione del metodo di adattamento della simmetria basato sulla diagonalizzazione simultanea dei caratteri di Dirac dalla teoria a singolo corpo ai calcoli GW autoconsistenti a molti corpi
- Implementazione efficiente: Sviluppo di uno schema di parallelizzazione efficiente su acceleratori GPU, realizzando parallelizzazione ibrida MPI e CUDA
- Miglioramento delle prestazioni: Dimostrazione che l'adattamento della simmetria combinato con la blocco-diagonalizzazione può portare a una riduzione di circa un ordine di grandezza delle operazioni in virgola mobile
- Ottimizzazione algoritmica: Proposta di un algoritmo numerico completo per il trattamento di gruppi spaziali non isomorfi e rappresentazioni proiettive
Questo articolo studia come utilizzare la simmetria del gruppo spaziale per accelerare i calcoli della struttura elettronica di solidi cristallini periodici a temperatura finita, in particolare nel metodo GW autoconsistente. L'input è la struttura cristallina e l'hamiltoniana, mentre l'output è la funzione di Green e l'auto-energia autoconsistenti.
- Operazioni del gruppo spaziale: Rappresentate come α^={α∣v(α)}, dove α è l'operazione del gruppo puntuale e v(α) è la traslazione
- Trasformazione orbitale: L'azione dell'operazione di simmetria sugli orbitali è:
α^g(xj)k(r)=exp[−ik~⋅vαx]×[O(α)g(xj)k~(r)]
Per il momento k, si definisce la matrice di rappresentazione proiettiva:
Dk(α)=exp[ik⋅v(α)]Ok(α^)λk(α,β)=exp{ik⋅[v(β)−αv(β)]}
- Definizione dei caratteri di Dirac:
Ωc=hnc∑β∈GD(α)⋅D(γ)⋅D(β)−1
- Diagonalizzazione simultanea: Ottenimento della matrice di trasformazione Uk attraverso la diagonalizzazione simultanea di tutti i caratteri di Dirac rilevanti
- Estensione alla teoria a molti corpi: Prima applicazione sistematica del metodo di diagonalizzazione simultanea dei caratteri di Dirac ai calcoli GW autoconsistenti
- Trasformazione tensoriale: Sviluppo di formule di trasformazione della simmetria per tensori di interazione a tre indici:
Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj†(α^)
- Ottimizzazione GPU: Progettazione di uno schema di accelerazione GPU con elaborazione asincrona di flussi e chiamate batch ZGEMM
Sono stati testati quattro composti della famiglia III-V e IV:
- Si (gruppo spaziale 227, non isomorfo)
- BN (gruppo spaziale 194, non isomorfo)
- AlP (gruppo spaziale 216, isomorfo)
- GaAs (gruppo spaziale 216, isomorfo)
- Base: base gthdzvp e base ausiliaria def2-svp-ri
- Griglia di temperatura: 114 punti di tempo immaginario, 103 punti di frequenza bosonica
- Griglia di momento: nk×nk×nk (nk=1,2,4,6)
- Numero di operazioni in virgola mobile (FLOP)
- Rapporto di accelerazione GPU
- Utilizzo della memoria
- Calcolo della zona di Brillouin completa (Full)
- Solo rotazioni del cuneo irriducibile (Rotation)
- Rotazione + blocco-diagonalizzazione (Block Diag)
Confronto FLOP per Si con diversi valori di nk:
| nk | nik | Full | Rotation | Block Diag | Rapporto di accelerazione |
|---|
| 1 | 1 | 1.31×1010 | 1.31×1010 | 1.50×109 | 8.7× |
| 2 | 3 | 1.73×1012 | 1.01×1012 | 2.24×1011 | 7.7× |
| 4 | 8 | 1.10×1014 | 2.13×1013 | 8.55×1012 | 12.9× |
| 6 | 16 | 1.25×1015 | 1.43×1014 | 6.87×1013 | 18.2× |
- Realizzazione di un rapporto di accelerazione quasi lineare ideale su 16 GPU V100
- Entrambi i kernel di calcolo P0 e Σ̃ mostrano eccellente scalabilità
- Effetto del numero di punti k: Il vantaggio della rotazione tra punti diventa più evidente con l'aumento del numero totale di punti k
- Vantaggio della blocco-diagonalizzazione: L'effetto della blocco-diagonalizzazione è più significativo con pochi punti k, poiché più punti si trovano sulla superficie dell'IBZ
- Vantaggio dei gruppi non isomorfi: I gruppi spaziali non isomorfi (come Si, BN) mostrano rapporti di accelerazione maggiori rispetto ai gruppi isomorfi
- Adattamento della simmetria tradizionale: Lavoro pionieristico di Dovesi e altri nel codice CRYSTAL
- Teoria a molti corpi: Metodo GW di Hedin e sua implementazione autoconsistente
- Calcolo su GPU: Ottimizzazione dell'acceleratore per calcoli di struttura elettronica
- Prima estensione sistematica dell'adattamento della simmetria ai calcoli autoconsistenti a molti corpi
- Fornitura di uno schema completo di trattamento dei gruppi spaziali non isomorfi
- Implementazione di un'efficiente parallelizzazione GPU
- L'adattamento della simmetria nei codici autoconsistenti a molti corpi porta a miglioramenti significativi del tempo di esecuzione
- La blocco-diagonalizzazione fornisce accelerazione aggiuntiva sulla base del cuneo irriducibile
- L'architettura GPU può sfruttare efficacemente il parallelismo esposto dalla simmetria
- L'implementazione attuale è limitata ai gruppi spaziali standard, non include gruppi spaziali magnetici
- Per sistemi con un numero molto grande di punti k, il vantaggio della blocco-diagonalizzazione si riduce
- È necessaria una memoria GPU sufficiente per memorizzare le strutture dati critiche
- Gruppi spaziali magnetici: Estensione ai gruppi di Shubnikov per il trattamento di sistemi magnetici e relativistici
- Risposta ottica: Utilizzo della conoscenza della simmetria per interpretare le funzioni di risposta ottica
- Metodi di ordine superiore: Applicazione a metodi di simulazione più accurati che includono funzioni vertice
- Rigore teorico: Basato su fondamenti consolidati della teoria dei gruppi, con derivazioni matematiche complete
- Valore pratico: Realizzazione di accelerazione computazionale di circa un ordine di grandezza, di significato rilevante per calcoli su larga scala
- Completezza tecnica: Fornitura di uno schema completo dalla teoria all'implementazione
- Verifica delle prestazioni: Validazione del metodo attraverso diversi sistemi di materiali
- Ambito di applicabilità: Attualmente applicabile solo a sistemi periodici, l'estendibilità a sistemi di superficie o difetti è sconosciuta
- Requisiti di memoria: L'implementazione GPU ha requisiti di memoria elevati, che potrebbero limitare l'applicazione a sistemi grandi
- Stabilità algoritmica: Per matrici di rappresentazione orbitale grandi, la diagonalizzazione simultanea potrebbe incontrare problemi di stabilità numerica
- Contributo accademico: Fornitura di un paradigma standard per l'utilizzo della simmetria nei calcoli a molti corpi
- Valore pratico: Riduzione significativa del costo dei calcoli GW autoconsistenti, rendendo possibili calcoli di sistemi più grandi
- Riproducibilità: Implementazione basata su software open-source, facilitando l'adozione e il miglioramento della comunità
- Materiali cristallini periodici con alta simmetria
- Calcoli di struttura elettronica che richiedono descrizione accurata degli effetti a molti corpi
- Ambienti di calcolo parallelo su larga scala, in particolare cluster GPU
Questo articolo si basa principalmente sui seguenti lavori chiave:
- Teoria dell'adattamento della simmetria di Dovesi e altri (Int. J. Quantum Chem. 1986, 1998)
- Metodo GW di Hedin (Phys. Rev. 1965)
- Teoria matematica della simmetria nei solidi di Bradley & Cracknell
- Principi di simmetria nella fisica dei solidi e molecolare di Lax
Questo articolo rappresenta un contributo importante nel campo della fisica computazionale, combinando con successo la teoria della simmetria con i calcoli moderni a molti corpi e la tecnologia di accelerazione GPU, fornendo una nuova soluzione per calcoli efficienti della struttura elettronica.