[L28] Optimized Kernel of Preconditioned Iterative Solver for Unstructured Mesh
Effect of Matrix Format, Blocking and Ordering
京をはじめ、近年の計算機アーキテクチャにおいては、階層的メモリ、ネットワーク構造に配慮した実装が必須となっている。本講演では、非構造格子の代表的な解法である有限要素法における、プログラミングの留意点、実効性能に対する効果について、京ないしは東京大学のFX10での単体ノード性能評価に基づき発表する。京においては8コア使用時において、最大7.7倍の加速が得られている。演算性能予測方法についても触れる。