Die simultane Berechnung von Komponenten erhöht die parallele Effizienz von Erdsystemmodellen

In einer kürzlich in der Zeitschrift Geoscientific Model Development veröffentlichten Studie zeigen Leonidas Linardakis und seine Kolleg*innen, wie grobskalige Parallelisierung von Komponenten die parallele Arbeitslast von Erdsystemmodellen erhöht und dazu führt, dass eine größere Anzahl von Rechenknoten effizient parallel genutzt werden kann. Die zusätzliche Dimension der Parallelität ermöglicht es den Wissenschaftler*innen, die Skalierbarkeit über die Grenzen etablierter Parallelisierungstechniken hinaus zu erweitern. Sie bietet außerdem eine Möglichkeit, die Performance aufrechtzuerhalten (indem mehr Rechenleistung genutzt wird), wenn die Komplexität des Modells durch Hinzufügen von Komponenten, wie z. B. der Biogeochemie oder Eisschildmodellen, erhöht wird. Darüber hinaus ermöglicht die Parallelisierung auf Komponentenebene, dass jede Komponente auf einer anderen Hardware läuft, so dass die Nutzung heterogener Hardwarekonfigurationen möglich ist.

Unsere derzeitigen Modellparallelisierungstechniken, wie z. B. die Domänenzerlegung und die Parallelisierung auf Schleifenebene, zerlegen den Datenraum, in der Regel durch Zerlegung des 2-dimensionalen Gitters. Dadurch wird die Verfügbarkeit von Parallelität auf die Verfügbarkeit von genügend Gitterpunkten beschränkt. Eine Ausnahme von diesem Ansatz ist die Ausführung des gekoppelten Modells, bei dem die Modelle für Atmosphäre und Ozean parallel laufen. Dies ist ein Beispiel für Parallelisierung auf Komponentenebene, bei der große Teile des Modells während eines Zeitschritts parallel laufen und jeden Zeitschritt (oder seltener) miteinander gekoppelt werden.

Die Parallelisierung von Komponenten zerlegt den algorithmischen Raum und bietet eine zusätzliche Parallelitätsdimension zu den Techniken der Datenzerlegung. Dadurch erhöht sich die parallele Arbeitslast, d. h. die Menge der in einem beliebigen parallelen Bereich verfügbaren Operationen. Dadurch können wiederum mehr Rechenressourcen effizient genutzt werden. Darüber hinaus sind datenparallele Ansätze nicht hilfreich, wenn mehr Prozesse und Details des Erdsystemmodells eingeführt werden, wie z. B. die Kryosphäre, die Atmosphärenchemie und die Mikrophysik der Partikel. Hier kann die Parallelisierung auf Komponentenebene einen Teil der zusätzlichen Rechenkosten auffangen. Eine Anwendung auf das Ozeanbiogeochemiemodell HAMOCC, das parallel zum Ozeanmodell ICON-O läuft, zeigt, dass wir die parallele Effizienz auf dem Hochleistungsrechner „Levante“ am Deutschen Klimarechenzentrum (DKRZ) verdoppeln können.

Die Parallelisierung auf Komponentenebene wird noch wichtiger, wenn man zu massiv-parallelen Rechnern übergeht. Diese Rechner benötigen mehrere Millionen 3D-Gitterpunkte pro Knoten, um effizient zu arbeiten. Dies begrenzt die Anzahl der Knoten, die wir durch datenparallele Ansätze effizient nutzen können, und im Gegenzug wird die Simulationszeit komprimiert. Im Rahmen des Projekts IFCES2 (Intra-model Functional Concurrency towards efficient Exascale Earth System prediction) zielt eine Aufgabe darauf ab, das HAMOCC-Modell auf GPUs zu portieren, so dass es im Hybridmodus parallel zum ICON-O-Modell laufen kann. Die Forscher*innen erwarten, dass die Vorteile der Parallelisierung auf Komponentenebene in dieser Konfiguration noch ausgeprägter sein werden. 

Originalveröffentlichung

L. Linardakis, I. Stemmler, M. Hanke, L. Ramme, F. Chegini, T. Ilyina, and P. Korn (2022) Improving scalability of Earth system models through coarse-grained component concurrency – a case study with the ICON v2.6.5 modelling system. Geosci. Model Dev., 15, 9157–9176, doi.org/10.5194/gmd-15-9157-2022

Kontakt:

Dr. Leonidas Linardakis
Max-Planck-Institut für Meteorologie
E-Mail: leonidas.linardakis@we dont want spammpimet.mpg.de