The 2023 SSJ Fall Meeting

Presentation information

Poster session (Sept. 17th)

Special session » S21. Acceleration of seismological research through integration with information science

[S21P] PM-P

Wed. Nov 1, 2023 5:00 PM - 6:30 PM Room P3 (F205 and 6 side foyer) (Hall Annex)

[S21P-02] AE Catalog development by a deep hashing method and network correlation analysis

*Makoto NAOI1, Shiro HIRANO2, Youqing CHEN1 (1. Kyoto University, 2. Ritsumeikan University)

既知のイベント波形をテンプレートとして,連続記録から高い相互相関係数を持つ窓を探索するテンプレートマッチングは検出イベント数を10倍に増加させることもあり,高い分解能で地震活動を解析するための重要なツールとなっている.しかし,波形相関に基づく方法は計算コストが大きく,大規模データへの適用が難しいため,前震活動など限られたシークエンスを対象として解析を行うのが一般的である.この問題を効率的に解く方法として,直井・平野(2023;JpGU)は,近年音声・画像認識分野で用いられている,深層学習モデルによるHashing(深層Hashing)を利用した類似波形探索技術を,室内水圧破砕実験で得たAcoustic Emission連続波形データに適用した.約30分(100 Hz換算にすると約5.8年分のデータポイント数に対応)16チャネル分のデータに対し,古典的手法の組み合わせで作成した6057イベントからなるカタログの波形を用いて深層Hashingによるテンプレートマッチングを行い,得られた候補窓内の波形に対して,Double Difference法によって,25,692個の震源を得ることに成功している.
 このように直井・平野(2023)は,深層Hash法でカタログの質を向上させられることを示したが,波形相関に基づくテンプレートマッチング法との性能比較は不十分であった.本研究では,同じテンプレートと連続波形の組み合わせに対して,Network Cross Correlation(NCC)による類似波形探索を実施し,性能の比較を行った.我々のコードは深層Hash法がGPUを用いて.NCC法は並列CPUを用いて演算するように実装しているため単純な比較が不可能だが,連続波形から1024 サンプルの窓を50%重複させて切り出した計35,128,124個の窓に対して,全Hashコードを取得するために要する時間は3.5時間(NVIDIA製A40x2利用時), 6057個のテンプレートと上記の全窓との間のNCCを計算するのに要する時間(AMD Ryzen Threadripper 3990Xによる120スレッド並列化下での評価)は12時間であった.これらの演算は,いずれも全ての連続波形をメモリに読み込むプロセスが発生し,O(N)オーダーの計算時間を必要とするが,全てのテンプレート波形がメモリに載らない規模の問題では,NCCを評価する方法では同じデータに対して繰り返しswap-in/swap-outを行う必要が生じるため,所要時間の乖離が大きくなる(この極端なケースが全ての窓同士の類似度判定を行うAuto correlation法である).なお,深層Hash法では,テンプレート波形と連続波形との間の類似度をHamming距離の16チャネル平均値(dhav)で評価するため,類似波形の同定には追加演算が必要だが,この計算コストは同じ波形ペアのNCC計算の1/1000で済むことがわかっており,上記の問題設定(6057個のテンプレート)においては連続波形に対するHash値取得にかかるコストに比べて十分に小さい.
 得られたNCCの分布から,その形状が変わるNCC=0.2(標準偏差の7.25倍に対応)の値を閾値としてイベント候補の窓を選び,Double Difference法を適用して震源を求めた所,深層Hash法による解析結果の2.5倍の数(63,702個)の震源が得られた.得られた震源分布の観察では,従来の解析結果では,雲状に広がって見えたAEの分布が,実際はAE密度が高い3 mm程度以下の大きさのクラスタが多数集まって形成されていることがわかった.岩石供試体中の鉱物分布等との関連が疑われる.
 次に,深層Hash法の解析で得られたテンプレート波形と全窓の間のdhavとNCC値の関係を調べた所,dhav = 20–35かつNCC = 0–0.2の領域に全体の99.9%のペアが集中するピークが存在することがわかった.これは関係のない波形同士の組み合わせによるものと考えられ,このピークを避けて解析しないと,大量の偽陽性が発生して処理効率が大きく低減する.NCCによる解析では閾値を0.2に設定するとこのピークをうまく避けられる一方,dhav値に例えば20の閾値を設定すると,NCC値が0.75程度と比較的高い値のペアが多数残り,大量の偽陰性が発生する,このことが深層Hashing法に基づく解析の質を低下させているとみられる.深層Hash法をより効果的に使用するためには,偽陰性率を低減させるためのHashingの能力改善が必要である.