Adapting Atmospheric Chemistry Components for Efficient GPU Accelerators
Ruiz, Dawson, Acosta et al.
Atmospheric models demand a lot of computational power and solving the chemical processes is one of its most computationally intensive components. This work shows how to improve the computational performance of the Multiscale Online Nonhydrostatic AtmospheRe CHemistry model (MONARCH), a chemical weather prediction system developed by the Barcelona Supercomputing Center. The model implements the new flexible external package Chemistry Across Multiple Phases (CAMP) for the solving of gas- and aerosol-phase chemical processes, that allows multiple chemical processes to be solved simultaneously as a single system. We introduce a novel strategy to simultaneously solve multiple instances of a chemical mechanism, represented in the model as grid-cells, obtaining a speedup up to 9x using thousands of cells. In addition, we present a GPU strategy for the most time-consuming function of CAMP. The GPU version achieves up to 1.2x speedup compared to CPU. Also, we optimize the memory access in the GPU to increase its speedup up to 1.7x.
academic
Adaptation des Composants de Chimie Atmosphérique pour les Accélérateurs GPU Efficaces
Les modèles atmosphériques nécessitent une puissance de calcul considérable, dont la résolution des processus chimiques constitue l'un des composants les plus intensifs en calcul. Cette étude démontre comment améliorer les performances de calcul du modèle de chimie atmosphérique non-hydrostatique multiéchelle en ligne (MONARCH) développé par le Centre de Superordinateurs de Barcelone. Le modèle implémente un nouveau paquet externe flexible « Chimie Multi-phase Croisée » (CAMP) pour résoudre les processus chimiques en phase gazeuse et aérosol, permettant la résolution simultanée de multiples processus chimiques en tant que système unique. L'étude propose une stratégie novatrice pour résoudre simultanément plusieurs instances du mécanisme chimique (représentées comme des cellules de grille dans le modèle), obtenant une accélération jusqu'à 9 fois avec des milliers de cellules. De plus, des stratégies GPU sont proposées pour les fonctions les plus coûteuses de CAMP, la version GPU réalisant une accélération jusqu'à 1,2 fois par rapport à l'implémentation CPU, avec une accélération supplémentaire de 1,7 fois grâce à l'optimisation de l'accès mémoire GPU.
Défis computationnels: Les modèles atmosphériques sont des représentations mathématiques de la dynamique atmosphérique, de la physique, de la chimie et des processus radiatifs, entraînant des coûts de calcul énormes en raison de leur complexité
Goulot d'étranglement des processus chimiques: La résolution des processus chimiques peut consommer 80% du temps d'exécution du modèle, constituant un goulot d'étranglement de performance
Besoin de parallélisation: Les modèles existants utilisent la décomposition de domaine pour la parallélisation, mais le solveur chimique individuel reste séquentiel
La modélisation de la chimie atmosphérique est cruciale pour les applications scientifiques telles que la prévision climatique et la prévision de la qualité de l'air
L'amélioration de l'efficacité computationnelle peut soutenir des simulations de chimie atmosphérique à plus haute résolution et plus complexes
L'accélération GPU peut réduire considérablement le temps de calcul et les coûts
Solveurs basés sur CPU: Parallélisés par décomposition de domaine, nécessitant des milliers de cellules de grille pour une accélération significative
Méthodes dédiées GPU: Bien que plus performantes (par exemple, accélération 59 fois), difficiles à adapter aux modèles atmosphériques, généralement ciblant uniquement des types spécifiques d'équations chimiques
Surcharge de transfert de données: Le transfert de données CPU-GPU devient un goulot d'étranglement de performance dans les implémentations GPU
Stratégie Multi-cellules: Propose une nouvelle méthode pour résoudre simultanément plusieurs cellules de grille, évitant l'initialisation répétée du solveur ODE, obtenant une accélération jusqu'à 9 fois
Résolution chimique GPU: Développe une implémentation GPU de la fonction Derivative dans le framework CAMP, réalisant une accélération 1,2 fois
Optimisation de l'accès mémoire: Réorganise les structures de données de réaction pour améliorer les modèles d'accès mémoire GPU, augmentant l'accélération à 1,7 fois
Stratégie parallèle hybride: Combine les solveurs basés sur CPU et les techniques spécifiques GPU
Documentation technique du framework CAMP et du modèle MONARCH
Recherches antérieures sur l'accélération GPU de la cinétique chimique
Littérature fondamentale sur la modélisation atmosphérique et le calcul parallèle
Documentation technique des bibliothèques de résolution numérique telles que CVODE
Évaluation Globale: Cet article est un document technique de haute qualité ciblant les applications pratiques. La stratégie Multi-cellules proposée est simple et efficace. Bien que l'implémentation GPU soit limitée par le transfert de données, elle démontre un bon potentiel de calcul. La recherche fournit une voie technique précieuse pour l'optimisation de performance des modèles de chimie atmosphérique, possédant une importance pratique significative.