2025-11-18T23:52:13.733274

Symmetry adaptation for self-consistent many-body calculations

Dong, Gull
The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
academic

Adattamento della simmetria per calcoli autoconsistenti a molti corpi

Informazioni di base

  • ID articolo: 2405.09494
  • Titolo: Symmetry adaptation for self-consistent many-body calculations
  • Autori: Xinyang Dong (AI for Science Institute Beijing & University of Michigan), Emanuel Gull (University of Michigan)
  • Classificazione: physics.comp-ph
  • Data di pubblicazione: 16 maggio 2024 (Preprint sottomesso a Computer Physics Communications)
  • Link articolo: https://arxiv.org/abs/2405.09494

Riassunto

Questo articolo indaga l'utilizzo della simmetria del gruppo spaziale per accelerare i calcoli e fornire intuizioni fisiche nei calcoli numerici di solidi cristallini periodici. Gli autori implementano l'adattamento della simmetria del gruppo spaziale nel metodo GW autoconsistente a temperatura finita per i calcoli della struttura elettronica e propongono uno schema di parallelizzazione efficiente su acceleratori. L'implementazione utilizza il metodo di diagonalizzazione simultanea dei caratteri di Dirac nella rappresentazione orbitale. I risultati dimostrano che l'adattamento della simmetria nel codice autoconsistente a molti corpi migliora significativamente il tempo di esecuzione, con la blocco-diagonalizzazione sulla base del cuneo irriducibile che fornisce ulteriore accelerazione.

Contesto e motivazione della ricerca

  1. Problema da risolvere: I calcoli moderni della teoria a molti corpi (come il metodo GW autoconsistente) affrontano un enorme carico computazionale nel trattamento di materiali cristallini periodici, richiedendo il calcolo ripetuto di oggetti complessi come propagatori dipendenti dalla frequenza, funzioni vertice e interazioni schermate.
  2. Importanza del problema:
    • La simmetria del gruppo spaziale è fondamentale per comprendere i materiali cristallini e fornisce intuizioni fisiche
    • L'utilizzo della simmetria può accelerare significativamente i calcoli numerici
    • Le architetture di calcolo moderne come le GPU possono sfruttare efficacemente il parallelismo esposto dalla struttura di gruppo
  3. Limitazioni dei metodi esistenti:
    • I codici standard di struttura elettronica (Hartree-Fock, DFT, GW non autoconsistente) si basano principalmente sulla matrice di densità a singola particella, per la quale la formalizzazione dell'adattamento della simmetria è già matura
    • Tuttavia, le tecniche moderne a molti corpi richiedono il calcolo di oggetti al di là della matrice di densità, per i quali la formalizzazione dell'adattamento della simmetria è insufficiente
  4. Motivazione della ricerca: Estendere la formalizzazione dell'adattamento della simmetria sviluppata da Dovesi e altri nella teoria di Hartree-Fock e DFT al metodo GW autoconsistente, e implementare un'efficiente parallelizzazione su architetture GPU moderne.

Contributi principali

  1. Estensione del metodo: Estensione del metodo di adattamento della simmetria basato sulla diagonalizzazione simultanea dei caratteri di Dirac dalla teoria a singolo corpo ai calcoli GW autoconsistenti a molti corpi
  2. Implementazione efficiente: Sviluppo di uno schema di parallelizzazione efficiente su acceleratori GPU, realizzando parallelizzazione ibrida MPI e CUDA
  3. Miglioramento delle prestazioni: Dimostrazione che l'adattamento della simmetria combinato con la blocco-diagonalizzazione può portare a una riduzione di circa un ordine di grandezza delle operazioni in virgola mobile
  4. Ottimizzazione algoritmica: Proposta di un algoritmo numerico completo per il trattamento di gruppi spaziali non isomorfi e rappresentazioni proiettive

Dettagli del metodo

Definizione del compito

Questo articolo studia come utilizzare la simmetria del gruppo spaziale per accelerare i calcoli della struttura elettronica di solidi cristallini periodici a temperatura finita, in particolare nel metodo GW autoconsistente. L'input è la struttura cristallina e l'hamiltoniana, mentre l'output è la funzione di Green e l'auto-energia autoconsistenti.

Architettura del modello

1. Fondamenti teorici della simmetria

  • Operazioni del gruppo spaziale: Rappresentate come α^={αv(α)}\hat{\alpha} = \{\alpha|v(\alpha)\}, dove α\alpha è l'operazione del gruppo puntuale e v(α)v(\alpha) è la traslazione
  • Trasformazione orbitale: L'azione dell'operazione di simmetria sugli orbitali è: α^g(xj)k(r)=exp[ik~vαx]×[O(α)g(xj)k~(r)]\hat{\alpha}g^k_{(xj)}(r) = \exp[-i\tilde{k} \cdot v_{\alpha x}] \times [O(\alpha)g^{\tilde{k}}_{(xj)}(r)]

2. Rappresentazioni proiettive

Per il momento kk, si definisce la matrice di rappresentazione proiettiva: Dk(α)=exp[ikv(α)]Ok(α^)D^k(\alpha) = \exp[ik \cdot v(\alpha)]O^k(\hat{\alpha})λk(α,β)=exp{ik[v(β)αv(β)]}\lambda^k(\alpha, \beta) = \exp\{ik \cdot [v(\beta) - \alpha v(\beta)]\}

3. Diagonalizzazione simultanea dei caratteri di Dirac

  • Definizione dei caratteri di Dirac: Ωc=nchβGD(α)D(γ)D(β)1\Omega_c = \frac{n_c}{h} \sum_{\beta \in G} D(\alpha) \cdot D(\gamma) \cdot D(\beta)^{-1}
  • Diagonalizzazione simultanea: Ottenimento della matrice di trasformazione UkU^k attraverso la diagonalizzazione simultanea di tutti i caratteri di Dirac rilevanti

Punti di innovazione tecnica

  1. Estensione alla teoria a molti corpi: Prima applicazione sistematica del metodo di diagonalizzazione simultanea dei caratteri di Dirac ai calcoli GW autoconsistenti
  2. Trasformazione tensoriale: Sviluppo di formule di trasformazione della simmetria per tensori di interazione a tre indici: Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj(α^)V^{\tilde{k}_i\tilde{k}_j} = \bar{O}^q(\hat{\alpha})O^{k_i}(\hat{\alpha})V^{k_ik_j} O^{k_j\dagger}(\hat{\alpha})
  3. Ottimizzazione GPU: Progettazione di uno schema di accelerazione GPU con elaborazione asincrona di flussi e chiamate batch ZGEMM

Configurazione sperimentale

Dataset

Sono stati testati quattro composti della famiglia III-V e IV:

  • Si (gruppo spaziale 227, non isomorfo)
  • BN (gruppo spaziale 194, non isomorfo)
  • AlP (gruppo spaziale 216, isomorfo)
  • GaAs (gruppo spaziale 216, isomorfo)

Parametri di calcolo

  • Base: base gthdzvp e base ausiliaria def2-svp-ri
  • Griglia di temperatura: 114 punti di tempo immaginario, 103 punti di frequenza bosonica
  • Griglia di momento: nk×nk×nkn_k \times n_k \times n_k (nk=1,2,4,6n_k = 1,2,4,6)

Metriche di valutazione

  • Numero di operazioni in virgola mobile (FLOP)
  • Rapporto di accelerazione GPU
  • Utilizzo della memoria

Metodi di confronto

  • Calcolo della zona di Brillouin completa (Full)
  • Solo rotazioni del cuneo irriducibile (Rotation)
  • Rotazione + blocco-diagonalizzazione (Block Diag)

Risultati sperimentali

Risultati principali

Effetto di riduzione delle operazioni in virgola mobile

Confronto FLOP per Si con diversi valori di nkn_k:

nkn_knikn_{ik}FullRotationBlock DiagRapporto di accelerazione
111.31×10101.31 \times 10^{10}1.31×10101.31 \times 10^{10}1.50×1091.50 \times 10^98.7×
231.73×10121.73 \times 10^{12}1.01×10121.01 \times 10^{12}2.24×10112.24 \times 10^{11}7.7×
481.10×10141.10 \times 10^{14}2.13×10132.13 \times 10^{13}8.55×10128.55 \times 10^{12}12.9×
6161.25×10151.25 \times 10^{15}1.43×10141.43 \times 10^{14}6.87×10136.87 \times 10^{13}18.2×

Prestazioni di accelerazione GPU

  • Realizzazione di un rapporto di accelerazione quasi lineare ideale su 16 GPU V100
  • Entrambi i kernel di calcolo P0 e Σ̃ mostrano eccellente scalabilità

Risultati sperimentali

  1. Effetto del numero di punti k: Il vantaggio della rotazione tra punti diventa più evidente con l'aumento del numero totale di punti k
  2. Vantaggio della blocco-diagonalizzazione: L'effetto della blocco-diagonalizzazione è più significativo con pochi punti k, poiché più punti si trovano sulla superficie dell'IBZ
  3. Vantaggio dei gruppi non isomorfi: I gruppi spaziali non isomorfi (come Si, BN) mostrano rapporti di accelerazione maggiori rispetto ai gruppi isomorfi

Lavori correlati

Principali direzioni di ricerca

  1. Adattamento della simmetria tradizionale: Lavoro pionieristico di Dovesi e altri nel codice CRYSTAL
  2. Teoria a molti corpi: Metodo GW di Hedin e sua implementazione autoconsistente
  3. Calcolo su GPU: Ottimizzazione dell'acceleratore per calcoli di struttura elettronica

Vantaggi di questo articolo

  • Prima estensione sistematica dell'adattamento della simmetria ai calcoli autoconsistenti a molti corpi
  • Fornitura di uno schema completo di trattamento dei gruppi spaziali non isomorfi
  • Implementazione di un'efficiente parallelizzazione GPU

Conclusioni e discussione

Conclusioni principali

  1. L'adattamento della simmetria nei codici autoconsistenti a molti corpi porta a miglioramenti significativi del tempo di esecuzione
  2. La blocco-diagonalizzazione fornisce accelerazione aggiuntiva sulla base del cuneo irriducibile
  3. L'architettura GPU può sfruttare efficacemente il parallelismo esposto dalla simmetria

Limitazioni

  1. L'implementazione attuale è limitata ai gruppi spaziali standard, non include gruppi spaziali magnetici
  2. Per sistemi con un numero molto grande di punti k, il vantaggio della blocco-diagonalizzazione si riduce
  3. È necessaria una memoria GPU sufficiente per memorizzare le strutture dati critiche

Direzioni future

  1. Gruppi spaziali magnetici: Estensione ai gruppi di Shubnikov per il trattamento di sistemi magnetici e relativistici
  2. Risposta ottica: Utilizzo della conoscenza della simmetria per interpretare le funzioni di risposta ottica
  3. Metodi di ordine superiore: Applicazione a metodi di simulazione più accurati che includono funzioni vertice

Valutazione approfondita

Punti di forza

  1. Rigore teorico: Basato su fondamenti consolidati della teoria dei gruppi, con derivazioni matematiche complete
  2. Valore pratico: Realizzazione di accelerazione computazionale di circa un ordine di grandezza, di significato rilevante per calcoli su larga scala
  3. Completezza tecnica: Fornitura di uno schema completo dalla teoria all'implementazione
  4. Verifica delle prestazioni: Validazione del metodo attraverso diversi sistemi di materiali

Carenze

  1. Ambito di applicabilità: Attualmente applicabile solo a sistemi periodici, l'estendibilità a sistemi di superficie o difetti è sconosciuta
  2. Requisiti di memoria: L'implementazione GPU ha requisiti di memoria elevati, che potrebbero limitare l'applicazione a sistemi grandi
  3. Stabilità algoritmica: Per matrici di rappresentazione orbitale grandi, la diagonalizzazione simultanea potrebbe incontrare problemi di stabilità numerica

Impatto

  1. Contributo accademico: Fornitura di un paradigma standard per l'utilizzo della simmetria nei calcoli a molti corpi
  2. Valore pratico: Riduzione significativa del costo dei calcoli GW autoconsistenti, rendendo possibili calcoli di sistemi più grandi
  3. Riproducibilità: Implementazione basata su software open-source, facilitando l'adozione e il miglioramento della comunità

Scenari di applicazione

  • Materiali cristallini periodici con alta simmetria
  • Calcoli di struttura elettronica che richiedono descrizione accurata degli effetti a molti corpi
  • Ambienti di calcolo parallelo su larga scala, in particolare cluster GPU

Riferimenti bibliografici

Questo articolo si basa principalmente sui seguenti lavori chiave:

  1. Teoria dell'adattamento della simmetria di Dovesi e altri (Int. J. Quantum Chem. 1986, 1998)
  2. Metodo GW di Hedin (Phys. Rev. 1965)
  3. Teoria matematica della simmetria nei solidi di Bradley & Cracknell
  4. Principi di simmetria nella fisica dei solidi e molecolare di Lax

Questo articolo rappresenta un contributo importante nel campo della fisica computazionale, combinando con successo la teoria della simmetria con i calcoli moderni a molti corpi e la tecnologia di accelerazione GPU, fornendo una nuova soluzione per calcoli efficienti della struttura elettronica.