13:45 〜 14:00
[SSS12-01] マッチドフィルター解析のためのオープンソースソフトウェアの性能評価
キーワード:マッチドフィルター解析、波形相関法、イベント検知、並列計算、オープンソースソフトウェア、信号処理
イベント検知は地震学の重要なルーチンであり、観測ネットワークの拡大とともに検出のための信号処理が発展してきた。 特に小規模なイベント検知には、マッチドフィルター解析 (MFA)、すなわち既知の地震波形と連続波形記録とのネットワーク相互相関係数 (NCC) を計算し、比較的大きな値を抽出する方法[Gibbons & Ringdal, 2006, GJI]が頻繁に用いられる。 大規模データセットに対する NCC の計算にはコストがかかるため、計算アルゴリズムの改良が期待される。 その代表的なものが、Mueen[2015] のアルゴリズムに基づく Matlab コードの SEC_C[Senobari et al., 2018, SRL]である。 SEC_C は単一スレッドで高速に動作し、正確な NCC を出力するものの、その複雑なループ構造のため並列計算には適さない。 Senobari et al. は、 SEC_C を複数プロセスで同時に実行することで並列化する方法を提案しているが、大規模データセットにおいてはメモリ消費が大きすぎるため、現実的でない。 したがって、 NCC 計算における速度、メモリ使用量、および精度のバランスを取ることは依然として課題である。
我々は、 NCC を近似計算するための高効率で並列計算可能なアルゴリズム DiallelX を開発した[Hirano & Naoi, 査読中]。 DiallelX はデスクトップ PC やワークステーションの CPU 上で動作する、モダン Fortran で書かれたオープンソースソフトウェアでもあり、テラバイト規模のデータセットに対する MFA に貢献しつつある。 例えば、能登半島における17年間の連続記録と1万のテンプレートイベント[Sasaki et al., 2024, AGU]、および数千のテンプレートを含む複数の岩石実験での 10 MHzサンプリング記録[Naoi et al., 査読中]などに適用されている。
本研究では、実行時間、メモリ消費量、および精度の観点から、 64コア CPU 上での DiallelX のベンチマーク結果を紹介する。 DiallelX の実行時には精度パラメータをユーザーが選択可能であり、その値とテンプレート波形のシグナル対ノイズ比に応じて、 NCC 計算の実行時間と精度のトレードオフを統計的に推定できる。 また、 CPU を用いた並列効率を調査した結果、物理コア数の約半分までのスレッド数で高い並列効率を維持できることが分かった(Fig.)。 例えば、64コアのCPUを用いた場合、100 Hz サンプリングの1年分の連続データ15チャンネル分 (例: 5観測点×3成分) と1,000個のテンプレートイベントに対する MFA を約20分で実行できる(Fig.)。 最後に、今後の DiallelX の開発計画として、 GPU 対応の可能性、観測点ごとの独立した遅延時間の考慮、より効率的な入出力フォーマットについて議論する。
我々は、 NCC を近似計算するための高効率で並列計算可能なアルゴリズム DiallelX を開発した[Hirano & Naoi, 査読中]。 DiallelX はデスクトップ PC やワークステーションの CPU 上で動作する、モダン Fortran で書かれたオープンソースソフトウェアでもあり、テラバイト規模のデータセットに対する MFA に貢献しつつある。 例えば、能登半島における17年間の連続記録と1万のテンプレートイベント[Sasaki et al., 2024, AGU]、および数千のテンプレートを含む複数の岩石実験での 10 MHzサンプリング記録[Naoi et al., 査読中]などに適用されている。
本研究では、実行時間、メモリ消費量、および精度の観点から、 64コア CPU 上での DiallelX のベンチマーク結果を紹介する。 DiallelX の実行時には精度パラメータをユーザーが選択可能であり、その値とテンプレート波形のシグナル対ノイズ比に応じて、 NCC 計算の実行時間と精度のトレードオフを統計的に推定できる。 また、 CPU を用いた並列効率を調査した結果、物理コア数の約半分までのスレッド数で高い並列効率を維持できることが分かった(Fig.)。 例えば、64コアのCPUを用いた場合、100 Hz サンプリングの1年分の連続データ15チャンネル分 (例: 5観測点×3成分) と1,000個のテンプレートイベントに対する MFA を約20分で実行できる(Fig.)。 最後に、今後の DiallelX の開発計画として、 GPU 対応の可能性、観測点ごとの独立した遅延時間の考慮、より効率的な入出力フォーマットについて議論する。