Adapting Atmospheric Chemistry Components for Efficient GPU Accelerators
Ruiz, Dawson, Acosta et al.
Atmospheric models demand a lot of computational power and solving the chemical processes is one of its most computationally intensive components. This work shows how to improve the computational performance of the Multiscale Online Nonhydrostatic AtmospheRe CHemistry model (MONARCH), a chemical weather prediction system developed by the Barcelona Supercomputing Center. The model implements the new flexible external package Chemistry Across Multiple Phases (CAMP) for the solving of gas- and aerosol-phase chemical processes, that allows multiple chemical processes to be solved simultaneously as a single system. We introduce a novel strategy to simultaneously solve multiple instances of a chemical mechanism, represented in the model as grid-cells, obtaining a speedup up to 9x using thousands of cells. In addition, we present a GPU strategy for the most time-consuming function of CAMP. The GPU version achieves up to 1.2x speedup compared to CPU. Also, we optimize the memory access in the GPU to increase its speedup up to 1.7x.
academic
Anpassung von Atmosphärenchemikomponenten für effiziente GPU-Beschleuniger
Atmosphärenmodelle erfordern erhebliche Rechenleistung, wobei die Lösung chemischer Prozesse eine der rechenintensivsten Komponenten darstellt. Diese Forschung zeigt, wie die Rechenleistung des multiskaligen Online-Nicht-hydrostatischen Atmosphärenchemimodells (MONARCH), das vom Barcelona Supercomputing Center entwickelt wurde, verbessert werden kann. Das Modell implementiert das neue flexible externe Paket „Cross-phase Chemistry" (CAMP) zur Lösung von Gas- und Aerosolphasenchemieprozessen, das es ermöglicht, mehrere chemische Prozesse als einzelnes System gleichzeitig zu lösen. Die Forschung schlägt eine neuartige Strategie vor, um mehrere Instanzen chemischer Mechanismen gleichzeitig zu lösen (im Modell als Gitterzellen dargestellt), wobei mit Tausenden von Zellen eine Beschleunigung von bis zu 9-fach erreicht wird. Darüber hinaus werden GPU-Strategien für die zeitaufwändigsten Funktionen von CAMP vorgeschlagen, wobei die GPU-Version gegenüber der CPU-Implementierung eine Beschleunigung von bis zu 1,2-fach erreicht und durch Optimierung des GPU-Speicherzugriffs auf 1,7-fach gesteigert wird.
Rechnerische Herausforderungen: Atmosphärenmodelle sind mathematische Darstellungen atmosphärischer Dynamik, Physik, Chemie und Strahlungsprozesse, deren Komplexität zu enormen Rechenkosten führt
Chemischer Prozess-Engpass: Die Lösung chemischer Prozesse kann bis zu 80% der Modellausführungszeit in Anspruch nehmen und stellt einen Leistungsengpass dar
Parallelisierungsbedarf: Bestehende Modelle werden durch Domänendekomposition parallelisiert, aber einzelne chemische Löser bleiben seriell
Atmosphärische Chemiemodellerstellung ist für Klimavorhersagen, Luftqualitätsprognosen und andere wissenschaftliche Anwendungen von entscheidender Bedeutung
Verbesserte Recheneffizienz ermöglicht höher aufgelöste und komplexere atmosphärische Chemiesimulationen
GPU-Beschleunigung kann Rechenzeit und Kosten erheblich reduzieren
CPU-basierte Löser: Parallelisierung durch Domänendekomposition erfordert Tausende von Gitterzellen für signifikante Beschleunigung
GPU-spezifische Methoden: Obwohl leistungsfähiger (z. B. 59-fache Beschleunigung), schwer an Atmosphärenmodelle anpassbar, normalerweise nur für spezifische Arten von chemischen Gleichungen
Datenübertragungsaufwand: CPU-GPU-Datenübertragung wird zum Leistungsengpass in GPU-Implementierungen
Multi-Zellen-Strategie: Vorschlag einer neuen Methode zur gleichzeitigen Lösung mehrerer Gitterzellen, Vermeidung wiederholter ODE-Löser-Initialisierung, Erreichung von bis zu 9-facher Beschleunigung
GPU-Chemiclösung: Entwicklung einer GPU-Implementierung der Derivative-Funktion im CAMP-Framework, Erreichung von 1,2-facher Beschleunigung
Speicherzugriffsoptimierung: Umstrukturierung von Reaktionsdatenstrukturen zur Verbesserung von GPU-Speicherzugriffsmustern, Steigerung der Beschleunigung auf 1,7-fach
Hybride Parallelisierungsstrategie: Kombinierte Methode aus CPU-basierten Lösern und GPU-spezifischen Techniken
Das Papier zitiert 12 verwandte Arbeiten, hauptsächlich umfassend:
Technische Dokumentation von CAMP-Framework und MONARCH-Modell
Frühere Forschung zur GPU-Beschleunigung von Chemikinetik
Grundlagenliteratur zu Atmosphärenmodellierung und Parallelrechnen
Technische Ressourcen zu numerischen Löserbibliotheken wie CVODE
Gesamtbewertung: Dies ist ein hochqualitatives technisches Papier mit praktischer Anwendungsorientierung. Die vorgeschlagene Multi-Zellen-Strategie ist einfach und wirksam. Obwohl die GPU-Implementierung durch Datenübertragung begrenzt ist, zeigt sie gutes Rechenpotenzial. Die Forschung bietet einen wertvollen technischen Weg für die Leistungsoptimierung von Atmosphärenchemimodellen mit bedeutendem praktischen Wert.