1:30 PM - 4:00 PM
[S21P-01] Automatic detection of S-wave later phase by 1D convolutional neural network
はじめに
近年,機械学習を活用した直達波の検知および検測技術の開発が精力的に行われている(e.g., Zhu & Beroza; 2019).これらは過去数十年にわたり蓄積された多量の地震波形データと,熟練した検測者によるラベル付き検測値に基づいた学習により,STA/LTA法などの従来法よりも高精度かつ網羅的なイベント検出を可能にした.一方,地下の顕著な速度コントラストに起因する反射波などの直達波以外の波(後続波)についても機械学習に基づく高精度な自動検出・検測が試みられている(Ding et al., 2022)が,研究例は少ない.
後続波からはその発生源である地下の不均質構造に関する情報を抽出できる(e.g., Matsumoto & Hasegawa, 1996).ゆえに,膨大な地震波形記録に蓄積された後続波の情報を活用することで,地下の不均質構造を詳細かつ網羅的に解析することができる.そのためには,後続波の検出・検測を自動化することが重要である.そこで本研究では,日本域における後続波解析自動化の端緒として,上部地殻内で発生した地震の地震波形記録に観測されるS波後続波(e.g., 堀・他, 2004)を対象に,その自動検出を試みた.
データ・手法
本研究では,東北地方北部の森吉山地域の群発地震について,その近傍のHi-net阿仁観測点(N.ANIH)で観測された地震波形記録を使用した.本地域では2011年から群発地震活動が継続しており,その地震波形記録のTransverse成分に顕著なS波後続波が報告されている(e.g., Kosuga 2014).また,本地域におけるS波後続波の波形形状は時間変化しており(Amezawa et al., 2019),同一の定常観測点において,後続波を含む波形と含まない波形を多数取得できるという利点がある.
まず,森吉山北方の群発地震クラスター内で発生した5,000個の地震について,N.ANIHで観測された地震波形記録の水平2成分からTransverse成分を合成して,6–24 Hzの帯域通過フィルタを適用し,S波最大振幅で規格化した上で,S波後続波を含むもの(3,935個)と含まないもの(1,065個)に目視分類した.これらを学習データ(80%)とテストデータ(20%)に分割し,さらに学習データの20%を検証データとして使用した.次に,1次元畳み込みニューラルネットワークに基づくS波後続波自動検知モデルを次のように作成した.畳み込み層とプーリング層の繰り返しに続き,全結合層を設定し,最後は softmax 関数を用いて和が1となる非負の2つの数値を出力する.2つの出力は,それぞれS波後続波を含む場合と含まない場合の確率に対応させ,閾値を0.5としてS波後続波の有無を判断させた.モデルへの入力データは,目視分類を行った地震波形記録について,気象庁S波検測時の0.2秒前から5.12秒間の時間窓で切り出したS-coda部分とした.
結果・議論
本研究で作成したモデルをテストデータに適用した結果,正解率は0.89であった.モデルの評価のために,偽陽性率に対する真陽性率を様々な閾値のもとでプロットしたROC曲線を作成し,その下側面積であるAUC(理想的なモデルで1.0に,ランダムな分類に対し0.5となる指標)を計算した.その結果,AUCは0.89であり,作成したモデルはテストデータに対しS波後続波の有無を判断できていることがわかった.一方,閾値0.5における偽陽性率は0.1以下であるのに対し,真陽性率は約0.8であった.後者の結果は,S波後続波有りのラベル付きデータを2割ほど取りこぼしていることを意味する.
S波後続波有りのデータの取りこぼしの要因として,S波後続波の有無の判断に迷うようなデータ(例えば,S波後続波の振幅が小さい場合)が含まれていることが考えられる.また,S波後続波有りと無しのデータ数に不均衡があるため,モデルの学習時にそれを解消するようなデータに重みづけや under sampling を行ったが,いずれの場合も分類精度が低下した.その主要因としては,学習データ数の不足が考えられる.
今後は,複数観測点での地震波形記録の追加や data augmentation によって学習データを増やしつつ,最適な学習方法を模索する.
謝辞
本研究では,防災科学技術研究所Hi-netによる地震波形記録,気象庁一元化震源カタログ,気象庁による手動検測値を使用しました.深層学習フレームワークはTensorFlowを使用しました.また,文部科学省の情報科学を活用した地震調査研究プロジェクト(STAR-Eプロジェクト) [JPJ010217]の支援をいただきました.感謝いたします.
近年,機械学習を活用した直達波の検知および検測技術の開発が精力的に行われている(e.g., Zhu & Beroza; 2019).これらは過去数十年にわたり蓄積された多量の地震波形データと,熟練した検測者によるラベル付き検測値に基づいた学習により,STA/LTA法などの従来法よりも高精度かつ網羅的なイベント検出を可能にした.一方,地下の顕著な速度コントラストに起因する反射波などの直達波以外の波(後続波)についても機械学習に基づく高精度な自動検出・検測が試みられている(Ding et al., 2022)が,研究例は少ない.
後続波からはその発生源である地下の不均質構造に関する情報を抽出できる(e.g., Matsumoto & Hasegawa, 1996).ゆえに,膨大な地震波形記録に蓄積された後続波の情報を活用することで,地下の不均質構造を詳細かつ網羅的に解析することができる.そのためには,後続波の検出・検測を自動化することが重要である.そこで本研究では,日本域における後続波解析自動化の端緒として,上部地殻内で発生した地震の地震波形記録に観測されるS波後続波(e.g., 堀・他, 2004)を対象に,その自動検出を試みた.
データ・手法
本研究では,東北地方北部の森吉山地域の群発地震について,その近傍のHi-net阿仁観測点(N.ANIH)で観測された地震波形記録を使用した.本地域では2011年から群発地震活動が継続しており,その地震波形記録のTransverse成分に顕著なS波後続波が報告されている(e.g., Kosuga 2014).また,本地域におけるS波後続波の波形形状は時間変化しており(Amezawa et al., 2019),同一の定常観測点において,後続波を含む波形と含まない波形を多数取得できるという利点がある.
まず,森吉山北方の群発地震クラスター内で発生した5,000個の地震について,N.ANIHで観測された地震波形記録の水平2成分からTransverse成分を合成して,6–24 Hzの帯域通過フィルタを適用し,S波最大振幅で規格化した上で,S波後続波を含むもの(3,935個)と含まないもの(1,065個)に目視分類した.これらを学習データ(80%)とテストデータ(20%)に分割し,さらに学習データの20%を検証データとして使用した.次に,1次元畳み込みニューラルネットワークに基づくS波後続波自動検知モデルを次のように作成した.畳み込み層とプーリング層の繰り返しに続き,全結合層を設定し,最後は softmax 関数を用いて和が1となる非負の2つの数値を出力する.2つの出力は,それぞれS波後続波を含む場合と含まない場合の確率に対応させ,閾値を0.5としてS波後続波の有無を判断させた.モデルへの入力データは,目視分類を行った地震波形記録について,気象庁S波検測時の0.2秒前から5.12秒間の時間窓で切り出したS-coda部分とした.
結果・議論
本研究で作成したモデルをテストデータに適用した結果,正解率は0.89であった.モデルの評価のために,偽陽性率に対する真陽性率を様々な閾値のもとでプロットしたROC曲線を作成し,その下側面積であるAUC(理想的なモデルで1.0に,ランダムな分類に対し0.5となる指標)を計算した.その結果,AUCは0.89であり,作成したモデルはテストデータに対しS波後続波の有無を判断できていることがわかった.一方,閾値0.5における偽陽性率は0.1以下であるのに対し,真陽性率は約0.8であった.後者の結果は,S波後続波有りのラベル付きデータを2割ほど取りこぼしていることを意味する.
S波後続波有りのデータの取りこぼしの要因として,S波後続波の有無の判断に迷うようなデータ(例えば,S波後続波の振幅が小さい場合)が含まれていることが考えられる.また,S波後続波有りと無しのデータ数に不均衡があるため,モデルの学習時にそれを解消するようなデータに重みづけや under sampling を行ったが,いずれの場合も分類精度が低下した.その主要因としては,学習データ数の不足が考えられる.
今後は,複数観測点での地震波形記録の追加や data augmentation によって学習データを増やしつつ,最適な学習方法を模索する.
謝辞
本研究では,防災科学技術研究所Hi-netによる地震波形記録,気象庁一元化震源カタログ,気象庁による手動検測値を使用しました.深層学習フレームワークはTensorFlowを使用しました.また,文部科学省の情報科学を活用した地震調査研究プロジェクト(STAR-Eプロジェクト) [JPJ010217]の支援をいただきました.感謝いたします.