2025-11-25T09:40:24.560688

"Best" iterative coupled-cluster triples model: More evidence for 3CC

Teke, Melekamburath, Gaudel et al.
To follow up on the unexpectedly-good performance of several coupled-cluster models with approximate inclusion of 3-body clusters [J. Chem. Phys. 151, 064102 (2019)] we performed a more complete assessment of the 3CC method [J. Chem. Phys. 125, 204105 (2006)] for accurate computational thermochemistry in the standard HEAT framework. New spin-integrated implementation of the 3CC method applicable to closed- and open-shell systems utilizes a new automated toolchain for derivation, optimization, and evaluation of operator algebra in many-body electronic structure. We found that with a double-zeta basis set the 3CC correlation energies and their atomization energy contributions are almost always more accurate (with respect to the CCSDTQ reference) than the CCSDT model as well as the standard CCSD(T) model. The mean absolute errors in cc-pVDZ {3CC, CCSDT, and CCSD(T)} electronic (per valence electron) and atomization energies relative to the CCSDTQ reference for the HEAT dataset [J. Chem. Phys. 121, 11599 (2004)], were {24, 70, 122} $μE_h/e$ and {0.46, 2.00, 2.58} kJ/mol, respectively. The mean absolute errors in the complete-basis-set limit {3CC, CCSDT, and CCSD(T)} atomization energies relative to the HEAT model reference, were {0.52, 2.00, and 1.07} kJ/mol, The significant and systematic reduction of the error by the 3CC method and its lower cost than CCSDT suggests it as a viable candidate for post-CCSD(T) thermochemistry applications, as well as the preferred alternative to CCSDT in general.
academic

"Лучшая" итеративная модель связанных кластеров с тройками: дополнительные доказательства для 3CC

Основная информация

  • ID статьи: 2407.08859
  • Название: "Best" iterative coupled-cluster triples model: More evidence for 3CC
  • Авторы: Накул К. Теке, Аджай Мелекамбурат, Бимал Гаудел, Эдвард Ф. Валеев
  • Учреждение: Кафедра химии, Политехнический институт Вирджинии, Блэксбург, Вирджиния 24061
  • Классификация: physics.chem-ph (химическая физика)
  • Дата публикации: 11 июля 2024 г.
  • Ссылка на статью: https://arxiv.org/abs/2407.08859

Аннотация

В данной работе проведена более полная оценка метода 3CC (трёхчастичный связанный кластер) для оценки его производительности при точном расчёте термохимии в стандартной схеме HEAT. Исследование реализовало новый метод спин-интегрированного 3CC, применимый к замкнутооболочечным и открытооболочечным системам, с использованием новой автоматизированной цепочки инструментов для вывода, оптимизации и оценки операторной алгебры в многочастичной электронной структуре. Исследование показало, что при базисном наборе двойной дзета корреляционная энергия 3CC и вклады в энергию атомизации почти всегда более точны, чем модели CCSDT и стандартный CCSD(T). На наборе данных HEAT, относительно эталонных значений CCSDTQ, средние абсолютные ошибки {3CC, CCSDT, CCSD(T)} составляют {24, 70, 122} μEh/e и {0.46, 2.00, 2.58} кДж/моль соответственно.

Предпосылки и мотивация исследования

Контекст проблемы

Метод связанных кластеров (Coupled-Cluster, CC) является золотым стандартом теории электронной структуры молекул и находит всё более широкое применение в материаловедении и ядерной физике. Он позволяет компактно и систематически улучшить описание электронной корреляции, доминируемое одноопределительным состоянием.

Ограничения существующих методов

  1. Недостатки CCSD(T): несмотря на то, что CCSD(T) называют "золотым стандартом" квантовой химии, он недостаточен для случаев, требующих высокой точности или когда одноопределительное состояние больше не является хорошей отправной точкой
  2. Проблема стоимости CCSDT: полный метод CCSDT, хотя и более строгий, имеет вычислительную сложность O(N⁸) и обычно менее точен, чем CCSD(T)
  3. Необходимость методов после CCSD(T): для высокоточных приложений, таких как предсказательная химическая термохимия, требуются методы, выходящие за пределы CCSD(T)

Мотивация исследования

Авторы в предыдущих исследованиях обнаружили неожиданно превосходную производительность метода 3CC на небольшом наборе молекул, с корреляционной энергией, значительно ближе к эталонным значениям CCSDTQ. Данное исследование направлено на более полную оценку метода 3CC на большем наборе замкнутооболочечных и открытооболочечных систем.

Основные вклады

  1. Реализация нового метода спин-интегрированного 3CC: применимого к замкнутооболочечным и открытооболочечным системам, основанного на новой автоматизированной цепочке инструментов
  2. Комплексное тестирование: систематическая оценка метода 3CC на стандартном наборе термохимических данных HEAT
  3. Проверка преимуществ производительности: доказательство того, что 3CC обеспечивает лучший баланс между точностью и вычислительной стоимостью по сравнению с CCSDT
  4. Технологические инновации: разработка символического тензорного алгебраического движка SeQuant и связанной с ним автоматизированной схемы реализации

Описание методологии

Теоретические основы модели 3CC

Метод 3CC принадлежит семейству методов nCC и является одним из внутренне исправленных методов связанных кластеров. Его цель — обеспечить точность для n-электронных систем путём удаления вторичных вкладов двухчастичных и многочастичных кластеров с структурой без дырочно-частичной сопряжённости (NHCJ) из уравнений амплитуд CC.

Основное математическое выражение

Волновая функция связанного кластера определяется как: ΨCCexp(T^)0|Ψ_{CC}⟩ ≡ \exp(\hat{T}) |0⟩

где оператор кластера содержит k-частичные коррелятивные подоператоры: T^=k=1KT^k\hat{T} = \sum_{k=1}^K \hat{T}_k

Метод 3CC реализуется путём исключения определённых членов из уравнения амплитуд тройных возбуждений CCSDT:

Для уравнения двойных возбуждений исключаемый вклад NHCJ имеет вид: A^i1i2a1a2(12gˉi3i4a3a4ti1i3a1a3ti2i4a2a414gˉi3i4a3a4ti3i4a1a3ti1i2a2a4)\hat{A}_{i_1i_2}^{a_1a_2}\left(\frac{1}{2}\bar{g}_{i_3i_4}^{a_3a_4}t_{i_1i_3}^{a_1a_3}t_{i_2i_4}^{a_2a_4} - \frac{1}{4}\bar{g}_{i_3i_4}^{a_3a_4}t_{i_3i_4}^{a_1a_3}t_{i_1i_2}^{a_2a_4}\right)

Технологические инновации реализации

Символический алгебраический движок SeQuant

  • Символическая операторная алгебра: эффективная обработка тензорных алгебраических выражений на скалярных и операторных полях
  • Спин-интегрирование: символическая обработка спина для повышения вычислительной эффективности
  • Оптимизация тензорной сети: автоматическое определение оптимального порядка свёртки для обеспечения правильной асимптотической масштабируемости

Характеристики автоматизированной цепочки инструментов

  1. Символическое преобразование в режиме реального времени: символические операции выполняются во время выполнения, а не во время генерации кода
  2. Интерпретатор тензорной алгебры: прямая интерпретация тензорных выражений с поддержкой платформ с распределённой памятью
  3. DSL молекулярных орбитальных интегралов: упрощение реализации молекулярных орбитальных интегралов

Экспериментальная установка

Наборы данных

Использован эталонный набор данных HEAT (High accuracy Extrapolated Ab initio Thermochemistry), включающий все типы молекул из набора данных HEAT, кроме H и H₂.

Определение модели HEAT

Определение энтальпии при 0 K для модели HEAT: EHEATEHFCBS+δECCSD(T)CBS+δECCSDTCBS+δECCSDTQ+δEZPVE+δEREL+δESO+δEDBOCE_{HEAT} ≡ E_{HF}^{CBS} + δE_{CCSD(T)}^{CBS} + δE_{CCSDT}^{CBS} + δE_{CCSDTQ} + δE_{ZPVE} + δE_{REL} + δE_{SO} + δE_{DBOC}

Показатели оценки

  • Абсолютная ошибка корреляционной энергии: относительно эталонных значений CCSDTQ и CCSDTQP
  • Ошибка энергии атомизации: точность предсказания энергии образования/разрыва химических связей
  • Средняя абсолютная ошибка (MAE): основной показатель производительности системы
  • Ошибка на валентный электрон: нормализованный показатель энергетической ошибки

Методы сравнения

  • CCSD(T): стандартный метод одно-двойных возбуждений с возмущённой коррекцией тройных возбуждений
  • CCSDT: полный метод одно-двойных-тройных возбуждений связанного кластера
  • CCSDTQ: включающий невозмущённую коррекцию четвёрных возбуждений
  • CCSDT(Q): возмущённая коррекция четвёрных возбуждений

Результаты экспериментов

Основные результаты

Абсолютная ошибка корреляционной энергии при базисном наборе cc-pVDZ

Средняя абсолютная ошибка (мEh) относительно эталонных значений CCSDTQ:

  • CCSD(T): 1.216 (на валентный электрон: 0.122)
  • CCSDT: 0.750 (на валентный электрон: 0.070)
  • 3CC: 0.261 (на валентный электрон: 0.024)
  • CCSDTQ: 0.186 (на валентный электрон: 0.017)
  • CCSDT(Q): 0.114 (на валентный электрон: 0.011)

Ошибка энергии атомизации

Средняя абсолютная ошибка (кДж/моль) относительно эталонных значений CCSDTQ:

  • CCSD(T): 2.58
  • CCSDT: 2.00
  • 3CC: 0.46
  • CCSDTQ: 0.53
  • CCSDT(Q): 0.37

Результаты при полном базисном пределе (CBS)

Ошибка энергии атомизации (кДж/моль) относительно эталонных электронных энергий HEAT:

  • CCSD(T): 1.07 (MAE)
  • CCSDT: 2.00 (MAE)
  • 3CC: 0.52 (MAE)

Ключевые выводы

  1. Систематическое улучшение: 3CC значительно превосходит CCSD(T) и CCSDT как по абсолютной корреляционной энергии, так и по энергии атомизации
  2. Преимущество для открытооболочечных систем: для открытооболочечных систем преимущество 3CC перед CCSD(T) и CCSDT ещё более выражено
  3. Эффективность затрат: 3CC имеет ту же сложность O(N⁸), что и CCSDT, но значительно выше точность
  4. Близость к методам высокого порядка: точность энергии атомизации 3CC близка к более дорогостоящему методу CCSDTQ

Анализ ошибок

Производительность для конкретных молекул:

  • Молекула CN: ошибка 3CC относительно CCSDTQ составляет всего 0.024 мEh, тогда как CCSDT — 1.405 мEh
  • Молекула CO₂: ошибка энергии атомизации 3CC составляет 2.57 кДж/моль, значительно лучше, чем CCSDT с 4.12 кДж/моль
  • Фторидные системы: 3CC показывает исключительную производительность при работе с сильно коррелированными фторидными системами

Связанные работы

Семейство методов nCC

3CC принадлежит семейству методов nCC, предложенному Бартлеттом и Мусялом, которые улучшают традиционные методы CC путём удаления определённых вкладов без дырочно-частичной сопряжённости.

Внутренне исправленные методы CC

  • Методы ACP-D45/ACCD: ранние подобные идеи, удаляющие определённые члены из уравнений двойных возбуждений CCD
  • Метод pCCSD: параметризованный метод CCSD Хантингтона и Нойена
  • Приближение различающихся кластеров: метод DCSD Катса и Манби и его расширения

Протоколы высокоточной термохимии

  • Протокол HEAT: высокоточная экстраполированная ab initio термохимия
  • Теория W3/W4: взвешенная теория Мартина и соавторов
  • Метод ccCA: метод коррелированно-согласованных композитных подходов

Заключение и обсуждение

Основные выводы

  1. 3CC — оптимальный итеративный метод с тройными возбуждениями: при одинаковой стоимости O(N⁸) 3CC обеспечивает значительно более высокую точность, чем CCSDT
  2. Рекомендуемый метод после CCSD(T): для приложений, требующих точности выше CCSD(T), 3CC является идеальным выбором
  3. Систематическое улучшение: 3CC обеспечивает последовательное улучшение как для замкнутооболочечных, так и для открытооболочечных систем

Практическое значение

  • Высокоточная термохимия: 3CC может заменить CCSDT в качестве основы протокола высокоточной термохимии
  • Отправная точка для четвёрных возбуждений: 3CC должен служить начальным методом для включения коррекций четвёрных возбуждений (например, CCSDT(Q))
  • Соотношение точность-стоимость: 3CC обеспечивает хороший баланс между точностью и стоимостью по сравнению с полным CCSDTQ

Ограничения

  1. Сходимость базисного набора: различие между CCSDT и CCSD(T) в зависимости от базисного набора не следует игнорировать, требуется оценка с более крупными базисными наборами
  2. Эффективность реализации: хотя формальная сложность одинакова, практическая реализация 3CC может быть дополнительно оптимизирована
  3. Более крупные системы: необходимо разработать методы редукции порядка для применения 3CC к более крупным молекулярным системам

Направления будущих исследований

  1. Оптимизация алгоритмов: использование тензорной декомпозиции и методов локализации для снижения практической вычислительной стоимости
  2. Явная корреляция: комбинирование с технологией F12 для ускорения сходимости базисного набора
  3. Адаптивные методы: разработка адаптивных методов CC для контроля точности и стоимости
  4. Расширенные эталоны: расширение тестирования на более крупные молекулярные системы

Глубокая оценка

Преимущества

  1. Строгое теоретическое обоснование: метод 3CC имеет чёткую теоретическую мотивацию и математическое обоснование
  2. Комплексное тестирование: систематическая оценка с использованием стандартного набора данных HEAT
  3. Технологические инновации: цепочка инструментов SeQuant представляет важный прогресс в разработке программного обеспечения для квантовой химии
  4. Практическая ценность: предоставляет новый практический выбор для высокоточных расчётов квантовой химии

Недостатки

  1. Ограничение размера системы: текущая реализация применима только к малым и средним молекулам (максимум 10 атомов)
  2. Зависимость от базисного набора: требуется более систематическое исследование свойств сходимости базисного набора
  3. Анализ открытооболочечных систем: требуется более глубокий теоретический анализ специального поведения открытооболочечных систем

Влияние

  1. Академический вклад: предоставляет важные доказательства для развития теории связанных кластеров
  2. Влияние на программное обеспечение: цепочка инструментов SeQuant может повлиять на будущую разработку программного обеспечения для квантовой химии
  3. Перспективы применения: предоставляет новый инструмент для химических приложений, требующих высокой точности

Сценарии применения

  • Расчёты термохимии, требующие химической точности (1 ккал/моль) или выше
  • Системы, такие как соединения переходных металлов, требующие точного описания электронной корреляции
  • Использование в качестве базового метода для методов более высокого порядка (например, включающих четвёрные возбуждения)
  • Эталонные расчёты и исследования развития методов

Библиография

Статья цитирует 93 связанные работы, включая в основном:

  • Фундаментальные работы по теории связанных кластеров (Кёстер, Чижек, Палдус и др.)
  • Связанные работы по протоколу термохимии HEAT
  • Оригинальные статьи семейства методов nCC (Бартлетт и Мусял)
  • Развитие современного программного обеспечения и алгоритмов квантовой химии

Общая оценка: это высококачественная статья по вычислительной химии, которая путём строгого тестирования доказывает превосходство метода 3CC и обеспечивает важный методологический вклад в высокоточные расчёты квантовой химии. Инновации в технической реализации и комплексная численная верификация делают её важным прогрессом в этой области.