17:15 〜 18:45
[SSS04-P05] DiallelX: ネットワーク相関法のための fortran コード
キーワード:イベント検知、マッチドフィルター解析、ネットワーク相関法
連続波形とテンプレート波形との相互相関を複数観測点間で平均したネットワーク相関係数 (NCC)[Gibbons & Ringdal, 2006 GJI] は、微小地震検知のために広く用いられている。しかしながら、長期間の連続波形と多数のテンプレート波形との NCC を計算する負荷は高く、微小地震検知の場合には卓越周波数が10Hzを超えるため、計算量を大幅に削減しうるダウンサンプリングも有効ではない。実例として、Ross et al.[2019 Science] は10年間分もの50Hz波形と、4点以上で観測された284,000個のテンプレートイベントを用いた解析を実施したが、それは多数の、高価なGPUアレイを用いて可能になったものである。一方で、中規模のデータセットに対し、手頃なCPUで解析を実施することは、多くの研究者にとって今なお需要があるだろう。それに応えるものとして、MASS アルゴリズム[Mueen et al., 2016 IEEE ICDM] に基づく SEC-C[Senobari et al., 2019 SRL] というコードが公開されているが、並列化効率の観点から、更なる改良が求められる。
上記の需要に鑑みて、我々は DiallelX と称し、連続波形と多数のテンプレートとの NCC を近似的に計算可能なモダン fortran コードを開発した。DiallelX は、完全な相互相関関数を計算するのではなく、連続波形を相互に重複する断片に分割し、それら断片とテンプレートとの相互相関関数を計算する。重複する波形断片であれば、隣接するいずれかの内部にはイベント波形の主要部が完全に含まれるであろうという狙いである。このアルゴリズムでは、 Fourier 領域にて相互相関関数を計算後、相互相関関数の全チャンネル平均値を、離散 Fourier 逆変換の実行前に計算する。これは上記のように波形が断片化されていることで可能になる方法であり、本来は逆変換の回数がチャンネル数に等しかったところ、1回で済み、高速化を可能にしている。他にも、出力データサイズを削減しつつ見逃しを防ぐよう、新規イベントの候補を選択的に出力する効率化を図った。
DiallelX における最新の実装では、15チャンネル×100Hz×24時間相当の連続データと、1000個のテンプレートイベントがあるとき、12コアの AMD 製 CPU を用いてNCCを5秒以内に求めることができる。また、そのために必要なメモリは2GB以下であった。より巨大なデータセットに対する処理時間は概ねデータ量に線形に依存する (例えば、同条件で1年間の連続波形データを処理するには約30分かかると推定される)。 このアルゴリズムを約6TBの岩石実験データに適用し、実験の供試体によっては微小破壊イベントの検知数が10倍近くに増加する場合もあることが確認できた。
このように、数千のテンプレートがある場合にも、テラバイト級の連続波形データから微小イベントを検知することが可能になった。本発表では、 DiallelX の実行速度、並列化効率、および精度を示し、従来法と比較する。また、大規模データを用いてNCCを計算した経験を持つ研究者からのフィードバックを歓迎する。
上記の需要に鑑みて、我々は DiallelX と称し、連続波形と多数のテンプレートとの NCC を近似的に計算可能なモダン fortran コードを開発した。DiallelX は、完全な相互相関関数を計算するのではなく、連続波形を相互に重複する断片に分割し、それら断片とテンプレートとの相互相関関数を計算する。重複する波形断片であれば、隣接するいずれかの内部にはイベント波形の主要部が完全に含まれるであろうという狙いである。このアルゴリズムでは、 Fourier 領域にて相互相関関数を計算後、相互相関関数の全チャンネル平均値を、離散 Fourier 逆変換の実行前に計算する。これは上記のように波形が断片化されていることで可能になる方法であり、本来は逆変換の回数がチャンネル数に等しかったところ、1回で済み、高速化を可能にしている。他にも、出力データサイズを削減しつつ見逃しを防ぐよう、新規イベントの候補を選択的に出力する効率化を図った。
DiallelX における最新の実装では、15チャンネル×100Hz×24時間相当の連続データと、1000個のテンプレートイベントがあるとき、12コアの AMD 製 CPU を用いてNCCを5秒以内に求めることができる。また、そのために必要なメモリは2GB以下であった。より巨大なデータセットに対する処理時間は概ねデータ量に線形に依存する (例えば、同条件で1年間の連続波形データを処理するには約30分かかると推定される)。 このアルゴリズムを約6TBの岩石実験データに適用し、実験の供試体によっては微小破壊イベントの検知数が10倍近くに増加する場合もあることが確認できた。
このように、数千のテンプレートがある場合にも、テラバイト級の連続波形データから微小イベントを検知することが可能になった。本発表では、 DiallelX の実行速度、並列化効率、および精度を示し、従来法と比較する。また、大規模データを用いてNCCを計算した経験を持つ研究者からのフィードバックを歓迎する。