11:00 〜 13:00
[MGI33-P04] 富岳上での FDPS の性能評価とチューニング
キーワード:計算科学、スーパーコンピューター富岳、粒子法
FDPS は粒子法シミュレーションコードを領域分割によりMPI並列化するためのアプリケーション開発フレームワークであり、アプリケーション開発者はMPI の知識を必要とせず、領域分割や粒子交換のための複雑アルゴリズムを自分で実装しなくても自分のプログラムをMPI並列化し、さらにOpenMP によりハイブリッド並列化もすることができる。
富岳上で、惑星リング系のシミュレーションコードを対象に、FDPS の性能評価とチューニングをおこなった。当初、1024ノード、 2M粒子で1ステップ 105ms であったが、最終的には 7.2ms まで短縮された。具体的な修正点については講演で詳細を述べる。
FDPS is an application development framework for MPI parallelization of particle-based simulation codes by domain decomposition. It allows application developers to parallelize their programs in MPI without requiring knowledge of MPI and without implementing complex algorithms for domain decomposition and particle exchange. FDPS can also parallelize the user program using OpenMP, resulting in efficient hybrid parallel code.
We evaluated the performance of FDPS and tuned it for a simulation code of a planetary ring system on Fugaku. Initially, it took 105ms per step with 1024 nodes and 2M particles, but finally the time per step was reduced to 7.2ms. Specific modifications will be described in detail in the talk.
富岳上で、惑星リング系のシミュレーションコードを対象に、FDPS の性能評価とチューニングをおこなった。当初、1024ノード、 2M粒子で1ステップ 105ms であったが、最終的には 7.2ms まで短縮された。具体的な修正点については講演で詳細を述べる。
FDPS is an application development framework for MPI parallelization of particle-based simulation codes by domain decomposition. It allows application developers to parallelize their programs in MPI without requiring knowledge of MPI and without implementing complex algorithms for domain decomposition and particle exchange. FDPS can also parallelize the user program using OpenMP, resulting in efficient hybrid parallel code.
We evaluated the performance of FDPS and tuned it for a simulation code of a planetary ring system on Fugaku. Initially, it took 105ms per step with 1024 nodes and 2M particles, but finally the time per step was reduced to 7.2ms. Specific modifications will be described in detail in the talk.