2025-11-18T23:52:13.733274

Symmetry adaptation for self-consistent many-body calculations

Dong, Gull
The exploitation of space group symmetries in numerical calculations of periodic crystalline solids accelerates calculations and provides physical insight. We present results for a space-group symmetry adaptation of electronic structure calculations within the finite-temperature self-consistent GW method along with an efficient parallelization scheme on accelerators. Our implementation employs the simultaneous diagonalization of the Dirac characters of the orbital representation. Results show that symmetry adaptation in self-consistent many-body codes results in substantial improvements of the runtime, and that block diagonalization on top of a restriction to the irreducible wedge results in additional speedup.
academic

Адаптация симметрии для самосогласованных многотельных расчётов

Основная информация

  • ID статьи: 2405.09494
  • Название: Symmetry adaptation for self-consistent many-body calculations
  • Авторы: Синьян Дун (Институт искусственного интеллекта для науки, Пекин и Университет Мичигана), Эмануэль Гулль (Университет Мичигана)
  • Категория: physics.comp-ph
  • Дата публикации: 16 мая 2024 г. (препринт, направлен в Computer Physics Communications)
  • Ссылка на статью: https://arxiv.org/abs/2405.09494

Аннотация

В данной работе исследуется использование пространственной групповой симметрии для ускорения численных расчётов и получения физических закономерностей при изучении периодических кристаллических твёрдых тел. Авторы реализовали адаптацию пространственной групповой симметрии в расчётах электронной структуры методом самосогласованного GW при конечной температуре и предложили эффективную схему параллелизации на ускорителях. Реализация использует метод одновременной диагонализации характеров Дирака в орбитальном представлении. Результаты показывают, что адаптация симметрии в самосогласованных многотельных кодах значительно улучшает время выполнения, а блочная диагонализация на основе неприводимого клина обеспечивает дополнительное ускорение.

Научный контекст и мотивация

  1. Решаемая проблема: Современные расчёты многотельной теории (такие как самосогласованный метод GW) при работе с периодическими кристаллическими материалами сталкиваются с огромными вычислительными затратами, требующими повторного вычисления сложных объектов, зависящих от частоты: пропагаторов, вершинных функций и экранированного взаимодействия.
  2. Значимость проблемы:
    • Пространственная групповая симметрия является ключевой для понимания кристаллических материалов и обеспечивает физические закономерности
    • Использование симметрии может значительно ускорить численные расчёты
    • Современные вычислительные архитектуры (GPU) могут эффективно использовать параллелизм, выявляемый групповой структурой
  3. Ограничения существующих методов:
    • Стандартные коды электронной структуры (Hartree-Fock, DFT, несамосогласованный GW) основаны главным образом на матрице плотности одной частицы, и формализм адаптации симметрии уже хорошо развит
    • Однако современные многотельные методы требуют вычисления объектов, выходящих за рамки матрицы плотности, и формализм адаптации симметрии недостаточно развит
  4. Научная мотивация: Обобщить формализм адаптации симметрии, разработанный Довеси и соавторами в теории Hartree-Fock и DFT, на самосогласованный метод GW и реализовать эффективную параллелизацию на современных архитектурах GPU.

Основные вклады

  1. Расширение метода: Распространение метода адаптации симметрии, основанного на одновременной диагонализации характеров Дирака, с однотельной теории на самосогласованные многотельные расчёты GW
  2. Эффективная реализация: Разработка эффективной схемы параллелизации на ускорителях GPU с гибридным параллелизмом MPI и CUDA
  3. Повышение производительности: Демонстрация того, что адаптация симметрии в сочетании с блочной диагонализацией обеспечивает сокращение операций с плавающей точкой примерно на порядок величины
  4. Оптимизация алгоритма: Предложение полного численного алгоритма для обработки неизоморфных пространственных групп и проективных представлений

Подробное описание метода

Постановка задачи

Работа посвящена расчётам электронной структуры периодических кристаллических твёрдых тел при конечной температуре, в частности тому, как использовать пространственную групповую симметрию для ускорения расчётов в самосогласованном методе GW. Входные данные: кристаллическая структура и гамильтониан; выходные данные: самосогласованные функция Грина и собственная энергия.

Архитектура модели

1. Теоретические основы симметрии

  • Операции пространственной группы: Представляются как α^={αv(α)}\hat{\alpha} = \{\alpha|v(\alpha)\}, где α\alpha — операция точечной группы, v(α)v(\alpha) — трансляция
  • Преобразование орбиталей: Действие операции симметрии на орбитали: α^g(xj)k(r)=exp[ik~vαx]×[O(α)g(xj)k~(r)]\hat{\alpha}g^k_{(xj)}(r) = \exp[-i\tilde{k} \cdot v_{\alpha x}] \times [O(\alpha)g^{\tilde{k}}_{(xj)}(r)]

2. Проективные представления

Для импульса kk определяются матрицы проективного представления: Dk(α)=exp[ikv(α)]Ok(α^)D^k(\alpha) = \exp[ik \cdot v(\alpha)]O^k(\hat{\alpha})λk(α,β)=exp{ik[v(β)αv(β)]}\lambda^k(\alpha, \beta) = \exp\{ik \cdot [v(\beta) - \alpha v(\beta)]\}

3. Одновременная диагонализация характеров Дирака

  • Определение характера Дирака: Ωc=nchβGD(α)D(γ)D(β)1\Omega_c = \frac{n_c}{h} \sum_{\beta \in G} D(\alpha) \cdot D(\gamma) \cdot D(\beta)^{-1}
  • Одновременная диагонализация: Получение матрицы преобразования UkU^k путём одновременной диагонализации всех релевантных характеров Дирака

Технические инновации

  1. Расширение на многотельную теорию: Первое систематическое применение метода одновременной диагонализации характеров Дирака к самосогласованным расчётам GW
  2. Преобразование тензоров: Разработка формул преобразования симметрии для трёхиндексного тензора взаимодействия: Vk~ik~j=Oˉq(α^)Oki(α^)VkikjOkj(α^)V^{\tilde{k}_i\tilde{k}_j} = \bar{O}^q(\hat{\alpha})O^{k_i}(\hat{\alpha})V^{k_ik_j} O^{k_j\dagger}(\hat{\alpha})
  3. Оптимизация для GPU: Разработка схемы ускорения GPU с асинхронной обработкой потоков и пакетными вызовами ZGEMM

Экспериментальная установка

Набор данных

Тестирование проведено на четырёх соединениях III-V и IV групп:

  • Si (пространственная группа 227, неизоморфная)
  • BN (пространственная группа 194, неизоморфная)
  • AlP (пространственная группа 216, изоморфная)
  • GaAs (пространственная группа 216, изоморфная)

Параметры расчёта

  • Базисный набор: gthdzvp и вспомогательный базис def2-svp-ri
  • Сетка температур: 114 точек мнимого времени, 103 точки бозонной частоты
  • Сетка импульсов: nk×nk×nkn_k \times n_k \times n_k (nk=1,2,4,6n_k = 1,2,4,6)

Метрики оценки

  • Количество операций с плавающей точкой (FLOP)
  • Ускорение на GPU
  • Использование памяти

Методы сравнения

  • Расчёт по полой зоне Бриллюэна (Full)
  • Только ротация неприводимого клина (Rotation)
  • Ротация + блочная диагонализация (Block Diag)

Результаты экспериментов

Основные результаты

Эффект сокращения операций с плавающей точкой

На примере Si при различных значениях nkn_k:

nkn_knikn_{ik}FullRotationBlock DiagУскорение
111.31×10101.31 \times 10^{10}1.31×10101.31 \times 10^{10}1.50×1091.50 \times 10^98.7×
231.73×10121.73 \times 10^{12}1.01×10121.01 \times 10^{12}2.24×10112.24 \times 10^{11}7.7×
481.10×10141.10 \times 10^{14}2.13×10132.13 \times 10^{13}8.55×10128.55 \times 10^{12}12.9×
6161.25×10151.25 \times 10^{15}1.43×10141.43 \times 10^{14}6.87×10136.87 \times 10^{13}18.2×

Производительность GPU

  • На 16 GPU V100 достигнута близкая к идеальной линейная масштабируемость
  • Оба вычислительных ядра P0 и Σ̃ демонстрируют отличную масштабируемость

Экспериментальные находки

  1. Эффект количества k-точек: Преимущество ротации между точками становится более выраженным с увеличением общего числа k-точек
  2. Преимущество блочной диагонализации: Эффект блочной диагонализации более значителен при меньшем числе k-точек, так как больше точек находится на поверхности неприводимого клина
  3. Преимущество неизоморфных групп: Неизоморфные пространственные группы (Si, BN) показывают большее ускорение по сравнению с изоморфными

Связанные работы

Основные направления исследований

  1. Традиционная адаптация симметрии: Пионерские работы Довеси и соавторов в коде CRYSTAL
  2. Многотельная теория: Метод GW Хедина и его самосогласованная реализация
  3. Вычисления на GPU: Оптимизация расчётов электронной структуры на ускорителях

Преимущества данной работы

  • Первое систематическое расширение адаптации симметрии на самосогласованные многотельные расчёты
  • Полное решение для обработки неизоморфных пространственных групп
  • Эффективная параллелизация на GPU

Заключение и обсуждение

Основные выводы

  1. Адаптация симметрии в самосогласованных многотельных кодах обеспечивает значительное улучшение времени выполнения
  2. Блочная диагонализация обеспечивает дополнительное ускорение на основе ограничения неприводимым клином
  3. Архитектура GPU может эффективно использовать параллелизм, выявляемый симметрией

Ограничения

  1. Текущая реализация ограничена стандартными пространственными группами, не включает магнитные пространственные группы
  2. Для систем с очень большим числом k-точек преимущество блочной диагонализации снижается
  3. Требуется достаточный объём памяти GPU для хранения критических структур данных

Направления будущих исследований

  1. Магнитные пространственные группы: Расширение на группы Шубникова для обработки магнитных и релятивистских систем
  2. Оптические отклики: Использование знаний о симметрии для интерпретации функций оптического отклика
  3. Методы высшего порядка: Применение к более точным методам моделирования, включающим вершинные функции

Глубокая оценка

Достоинства

  1. Теоретическая строгость: Основана на зрелых основах теории групп, математические выводы полны
  2. Практическая ценность: Реализовано ускорение примерно на порядок величины, что имеет большое значение для крупномасштабных расчётов
  3. Полнота технического решения: Предоставляет полное решение от теории к реализации
  4. Проверка производительности: Метод верифицирован на различных материальных системах

Недостатки

  1. Область применения: В настоящее время применим только к периодическим системам; расширяемость на поверхностные или дефектные системы неизвестна
  2. Требования к памяти: Реализация на GPU предъявляет высокие требования к памяти, что может ограничить применение к большим системам
  3. Численная стабильность алгоритма: Для больших матриц орбитального представления одновременная диагонализация может столкнуться с проблемами численной стабильности

Влияние

  1. Научный вклад: Предоставляет стандартную парадигму использования симметрии в многотельных расчётах
  2. Практическая ценность: Значительно снижает стоимость самосогласованных расчётов GW, делая возможным расчёты для более крупных систем
  3. Воспроизводимость: Реализована на основе открытого программного обеспечения, что облегчает принятие и улучшение сообществом

Области применения

  • Периодические кристаллические материалы с высокой симметрией
  • Расчёты электронной структуры, требующие точного описания многотельных эффектов
  • Крупномасштабные параллельные вычислительные среды, особенно GPU-кластеры

Библиография

Данная работа основана на следующих ключевых исследованиях:

  1. Теория адаптации симметрии Довеси и соавторов (Int. J. Quantum Chem. 1986, 1998)
  2. Метод GW Хедина (Phys. Rev. 1965)
  3. Математическая теория симметрии твёрдых тел Брэдли и Крэкнелла
  4. Принципы симметрии в физике твёрдого тела и молекулярной физике Лакса

Данная статья представляет собой важный вклад в область вычислительной физики, успешно объединяя теорию симметрии с современными многотельными расчётами и технологией ускорения GPU, предоставляя новое решение для эффективных расчётов электронной структуры.