Enhancement of Phase Picking Models Using Deep Learning by Addressing the Label Imbalance Problem

Shinya KATOH

9:30 AM - 9:45 AM

[S21-03] Enhancement of Phase Picking Models Using Deep Learning by Addressing the Label Imbalance Problem

*Shinya KATOH¹, Hiromichi NAGAO¹, Masaaki IMAIZUMI², Yoshihisa IIO³ (1. Earthquake Research Institute,The University of Tokyo, 2. Department of Basic Science, Graduate School of Arts and Sciences, The University of Tokyo, 3. ABUYAMA Seismological MUSEUM)

近年、様々な深層学習を用いた地震波の走時読み取りモデルが開発されている。深層学習を用いた走時読み取りモデルでは、人が読み取ったP波とS波の走時位置を学習させる。現在、よく使用されているモデル(PhaseNet; Zhu and Beroza, 2019)は走時読み取りタスクをSemantic Segmentationタスクとみなし、入力は地震波を含む3成分波形データであり、正解ラベルはP, S波の走時時刻を頂点かつ高さ1とし、標準偏差0.1 sとしたガウス分布の形状をしたP,Sラベルとそれら以外を1としたノイズ(N)ラベルである。そして、モデルが推論する走時は出力確率分布が最大となる点である。　

深層学習を用いた地震波走時読み取りモデルが高精度とされる一方で、トレース内に複数の地震波が存在する場合、全ての地震波の走時検出が困難という問題がある(Park et al., 2023)。この問題は定常的な地震活動のモニタリングなどでは大きな問題にならないが、大地震後の余震活動や注水実験による活発な誘発地震活動などでは大きな問題となる。余震活動や誘発地震活動は時間あたりの地震数が増えるため深層学習による自動化が求められる状況である。そのため一つのトレースに複数の地震波が含まれている場合でも読み取りができるようにする必要がある。

本研究では、この問題をラベル不均衡(Saini and Susan, 2023)によって生じている可能性があると考えた。PhaseNetの学習時に与えるラベルの面積比はPラベルとSラベルがそれぞれ1 %でNラベルが98 %である。そのため、大部分がNラベルであり、走時読み取りに重要なP波やS波を示すラベルはごくわずかである。これにより、モデルの学習時の損失値に影響を与えるのは主にNラベルであり、P波やS波ラベルの影響は限定的となる。そのため、Nラベルが多い状況は、モデルがP波やS波の信号を見逃しやすくなり、地震波の走時時刻を検出する際の感度が低下する可能性がある。このため、モデルのP波やS波への感度を向上させるために、ラベル不均衡に対処する必要がある。

そこで、本研究ではラベル不均衡を解消するために、損失関数に対する重み付けを行った。損失関数にはクロスエントロピー誤差を使用した。走時読み取りを行うモデルには、Vision Transformerを階層的に使用したSegPhase (Katoh et al., 2024)を用いた。PhaseNetと同様に走時読み取りタスクをSemantic Segmentationタスクとしており、正解ラベルはP,S,Nラベルとなっている。その結果が図である。図(d)が重み付けしたクロスエントロピー誤差を用いて学習したモデルの結果で、図(e)が通常のクロスエントロピー誤差を用いたモデルである。重み付けを行ったことで検出能力が大幅に向上していることがわかる。通常のクロスエントロピー誤差を用いたモデルではほとんどの波形が検出できていない。これは、学習データに日本の通常地震のものを使用しており、推論した地震波形はOklahomaの注水実験によって生じた地震のもので、学習と推論におけるデータの特徴が異なるためだと考えられる。しかし、それでも重み付けをすることで検出ができるようになっている。これは、重み付けによって地震波の本質的な特徴を効率よく学習できているからかもしれない。

本発表では、この手法の詳細と連続波形に適応した結果を紹介する

Presentation information

[S21] AM-1

[S21-03] Enhancement of Phase Picking Models Using Deep Learning by Addressing the Label Imbalance Problem