09:00 〜 09:15
[SCG50-01] 一元化震源データによる深層学習検測器の再学習
キーワード:気象庁一元化震源カタログ、深層学習、深層学習検測器
近年,深層学習を用いた走時検測器が多数作成されており,主に日本国外のデータを用いた訓練済みモデルが公表されている(例えば,Zhu and Beroza 2019; Mousavi et al. 2020).これらはしばしば再学習なしで他の地域の地震カタログ作成に用いられ,多くの論文が出版されるようになっているが,実際に使用するデータセットを用いて再訓練や転移学習を行えば,より高いパフォーマンスが発揮できることが知られている(e.g., Kim et al. 2023).従って,日本の気象庁一元化震源のような,ユーザー数が多いデータに関しては,それらをもとに学習したモデルが公開・共有されることが望ましく,これによって関連研究が促進されると考えられる.そこで本研究では,気象庁一元化検測値をもとに,広く利用されている深層学習検測器PhaseNet(Zhu and Beroza 2019)の再訓練を実施し,カリフォルニアのデータで訓練されたオリジナルモデルとの性能を比較した.
訓練には,2018–2020の3年分のデータを使用し,気象庁が公開している検測値情報をもとに訓練を行った.2020年9月1日からはS-net記録の検測値がカタログ作成に利用されはじめており,これらのデータも訓練に含まれている.S-net波形についてはTakagi et al. (2019)の方位情報をもとにして,NS, EW, UD成分にRotationしてから使用した.この期間に得られた10,546,390 個の各点における観測データについて,1) PとS両方の読み取り値が存在する,2) 3成分の波形記録が存在している,3) P波, S波両方で手動チェックが行われている,の3つの条件を満たす3成分波形1,295,195個を選別して訓練に使用した.このうち,80%をネットワークの訓練データ,20%を検証データとして使用した.
上記の手順で一元化検測値と波形をもとに訓練したPhaseNetモデル,並びにZhu and Beroza (2019)がカリフォルニアのデータで訓練・公表しているオリジナルモデルを,訓練に使用していない2021年のデータに適用して,Precision-recall curveを作成して性能を評価したところ,顕著に性能が向上したことが確認された.向上の度合いはHi-net観測点のデータに対しては限定的で,S-netやDONET点のデータに対して大きかった.また,走時残差分布からは,Zhu and Beroza (2019)のオリジナルモデルを利用した場合には気象庁検測値に比べてやや後ろを読む傾向がある一方で,再訓練したモデルではこのバイアスが軽減したことが確認できた.
訓練には,2018–2020の3年分のデータを使用し,気象庁が公開している検測値情報をもとに訓練を行った.2020年9月1日からはS-net記録の検測値がカタログ作成に利用されはじめており,これらのデータも訓練に含まれている.S-net波形についてはTakagi et al. (2019)の方位情報をもとにして,NS, EW, UD成分にRotationしてから使用した.この期間に得られた10,546,390 個の各点における観測データについて,1) PとS両方の読み取り値が存在する,2) 3成分の波形記録が存在している,3) P波, S波両方で手動チェックが行われている,の3つの条件を満たす3成分波形1,295,195個を選別して訓練に使用した.このうち,80%をネットワークの訓練データ,20%を検証データとして使用した.
上記の手順で一元化検測値と波形をもとに訓練したPhaseNetモデル,並びにZhu and Beroza (2019)がカリフォルニアのデータで訓練・公表しているオリジナルモデルを,訓練に使用していない2021年のデータに適用して,Precision-recall curveを作成して性能を評価したところ,顕著に性能が向上したことが確認された.向上の度合いはHi-net観測点のデータに対しては限定的で,S-netやDONET点のデータに対して大きかった.また,走時残差分布からは,Zhu and Beroza (2019)のオリジナルモデルを利用した場合には気象庁検測値に比べてやや後ろを読む傾向がある一方で,再訓練したモデルではこのバイアスが軽減したことが確認できた.