[L28] 非構造格子における前処理付き反復法ソルバーの最適化カーネル
行列格納形式,ブロッキング,リオーダリングの効果
京をはじめ、近年の計算機アーキテクチャにおいては、階層的メモリ、ネットワーク構造に配慮した実装が必須となっている。本講演では、非構造格子の代表的な解法である有限要素法における、プログラミングの留意点、実効性能に対する効果について、京ないしは東京大学のFX10での単体ノード性能評価に基づき発表する。京においては8コア使用時において、最大7.7倍の加速が得られている。演算性能予測方法についても触れる。