Adapting Atmospheric Chemistry Components for Efficient GPU Accelerators
Ruiz, Dawson, Acosta et al.
Atmospheric models demand a lot of computational power and solving the chemical processes is one of its most computationally intensive components. This work shows how to improve the computational performance of the Multiscale Online Nonhydrostatic AtmospheRe CHemistry model (MONARCH), a chemical weather prediction system developed by the Barcelona Supercomputing Center. The model implements the new flexible external package Chemistry Across Multiple Phases (CAMP) for the solving of gas- and aerosol-phase chemical processes, that allows multiple chemical processes to be solved simultaneously as a single system. We introduce a novel strategy to simultaneously solve multiple instances of a chemical mechanism, represented in the model as grid-cells, obtaining a speedup up to 9x using thousands of cells. In addition, we present a GPU strategy for the most time-consuming function of CAMP. The GPU version achieves up to 1.2x speedup compared to CPU. Also, we optimize the memory access in the GPU to increase its speedup up to 1.7x.
academic
Адаптация компонентов атмосферной химии для эффективных GPU-ускорителей
Атмосферные модели требуют огромных вычислительных мощностей, при этом решение химических процессов является одним из наиболее вычислительно интенсивных компонентов. В данном исследовании демонстрируется, как улучшить производительность многомасштабной онлайн-модели атмосферной химии без гидростатического приближения (MONARCH), разработанной в Барселонском суперкомпьютерном центре. Модель реализует новый гибкий внешний пакет "Кросс-фазная химия" (CAMP) для решения газофазных и аэрозольных химических процессов, позволяя одновременно решать несколько химических процессов как единую систему. В исследовании предложена новая стратегия одновременного решения нескольких экземпляров химического механизма (представленных как ячейки сетки), достигающая ускорения до 9 раз при использовании тысяч ячеек. Кроме того, предложены GPU-стратегии для наиболее затратных по времени функций CAMP, при этом GPU-версия достигает ускорения до 1,2 раза по сравнению с CPU-реализацией, а оптимизация доступа к памяти GPU дополнительно повышает ускорение до 1,7 раза.
Вычислительные вызовы: Атмосферные модели являются математическим представлением динамики атмосферы, физики, химии и радиационных процессов, что приводит к огромным вычислительным затратам из-за сложности
Узкое место химических процессов: Решение химических процессов может занимать 80% времени выполнения модели, являясь узким местом производительности
Требования к параллелизму: Существующие модели используют параллелизм через декомпозицию области, но отдельный химический решатель остаётся последовательным
CPU-базированные решатели: Параллелизм через декомпозицию области требует тысяч ячеек сетки для значительного ускорения
GPU-специфические методы: Хотя они показывают лучшую производительность (например, 59-кратное ускорение), их сложно адаптировать к атмосферным моделям, обычно они работают только с определёнными типами химических уравнений
Накладные расходы на передачу данных: Передача данных между CPU и GPU становится узким местом производительности в GPU-реализациях
Стратегия Multi-cells: Предложен новый метод одновременного решения нескольких ячеек сетки, избегающий повторной инициализации решателя ОДУ, достигающий ускорения до 9 раз
GPU-решение химических уравнений: Разработана GPU-реализация функции Derivative в фреймворке CAMP, достигающая 1,2-кратного ускорения
Оптимизация доступа к памяти: Переорганизация структур данных реакций для улучшения паттернов доступа к памяти GPU, повышающая ускорение до 1,7 раза
Гибридная стратегия параллелизма: Комбинированный подход, объединяющий CPU-базированный решатель и GPU-специфические техники
Статья цитирует 12 связанных работ, включающих в основном:
Техническую документацию фреймворка CAMP и модели MONARCH
Предыдущие исследования GPU-ускорения химической кинетики
Фундаментальную литературу по атмосферному моделированию и параллельным вычислениям
Техническую документацию численных библиотек решателей, таких как CVODE
Общая оценка: Это высококачественная техническая статья, ориентированная на практические приложения. Предложенная стратегия Multi-cells проста и эффективна, GPU-реализация, хотя и ограничена передачей данных, демонстрирует хороший вычислительный потенциал. Исследование предоставляет ценный технологический путь для оптимизации производительности атмосферно-химических моделей и имеет важное практическое значение.