17:15 〜 18:45
[SCG40-P10] 西南日本のGNSS時系列の機械学習によるスロースリップのシグナルの自動検出
キーワード:シグナル判定、機械学習、スロースリップ、GNSS時系列
スロースリップイベント (SSE) のようなゆっくりした非定常断層すべり現象の把握は,プレート境界のすべり収支・摩擦特性の正確な理解や地震発生予測に重要である.全地球航法衛星システム(GNSS)はSSEを把握するための最も重要な観測手段の一つであり,GNSS変位時系列からシグナルを検出する手法としてテンプレートマッチング (e.g., Okada+ 2022) やスパース推定 (e.g., Yano and Kano, 2022),成分分解 (e.g., Walwer+ 2016) といった多彩な数理的技術がこれまで試みられてきた.GNSS観測点が近年急速に増加するなか,このような検出手法の自動化と客観性向上の取り組みは重要性を増している.一方で,地震動の検出では機械学習による自動化が既に大きな成果を確立しているが,GNSS時系列のシグナル判定に対する機械学習の適用は依然として事例が少ない.これはSSEの発生数が通常地震よりもはるかに少ないため,学習用データを確保しにくいという事情が関係している.また人工データによる学習で高精度なSSE検出に成功した事例もあるが (Xue and Freymueller, 2023),実データのノイズの複雑な時空間特性を完全に再現するには限界がある.
本研究ではこうした背景に基づき,西南日本のGNSS時系列の実データを用いた機械学習によるSSEシグナルの自動検出を試みる.そして,検出結果とノイズ特性を直接結びつけた議論を行うことを最終目的とする.本発表では初めに単点での検出について紹介する.西南日本はSSEの検出カタログが最も充実している地域であり,Okada et al. (2022) によって1997年から2020年までの23年間に284個の短期SSEが検出されている.そこで本研究では西南日本の770ヶ所のGEONET観測点について,PPP-AR解析を用いて日座標時系列を取得した.そして同カタログで短期SSEのシグナルが推定されている観測点・時期の時系列を抽出して学習用シグナルデータを得た.併せてシグナルを含まない時期・観測点の時系列をランダムに抽出しノイズデータとした.いずれも時間窓の長さは121エポックとした.このようにして得た合計16000個程度のデータを学習・テストデータに分割し,機械学習による地震動検出手法の一つであるGPD (Generalized Phase Detection, Ross et al., 2018) を参考にしたモデル構造に適用した.入力は座標時系列で,出力は時間窓にシグナルを含む確率となる.学習では交差エントロピーを損失関数とし,安定性を評価するためにモデルの初期値をランダムに変えて10回の学習を独立に繰り返した.
その結果,いずれも数十エポック程度で収束し80–90%の正答率を得られた.Okada et al. (2022) では検出したイベントを信頼度が高いクラス1と不確実性が大きいクラス2に分類しているが,今回の結果でもクラス2イベントのシグナルの見逃し率が1.5–3.0倍程度高くなった.またシグナル・ノイズいずれについても,テストデータのうち9割前後は10回中8回以上で正しく判定された.一方で残る1割前後は判定結果が不安定で,ほぼ必ず誤判定されるデータも見られた.10回の学習のうち正答が7回以下だったシグナルデータの傾向を調べた結果,時期や地域に明かな偏りは見られなかったが,変位量が小さいものに集中した.個々の観測点におけるシグナル・ノイズデータについて検出成功率・誤検知率を算出した場合,前者は規模の大きいイベントが頻繁に発生する四国西部で高くなった.後者はほぼ不規則で,学習時のデータ数が多いにも関わらず誤検知率が高い点もあるなど複雑な結果になった.
以上のように西南日本の実データを用いた機械学習である程度の精度でのシグナル検出に成功し,また検出結果の傾向も概ね直感に合うものとなった.発表では上記結果の詳細を紹介するとともに西南日本のGNSS時系列のノイズ時空間特性との関係を議論し,安定した学習と判定のための改善策を提示する.
本研究ではこうした背景に基づき,西南日本のGNSS時系列の実データを用いた機械学習によるSSEシグナルの自動検出を試みる.そして,検出結果とノイズ特性を直接結びつけた議論を行うことを最終目的とする.本発表では初めに単点での検出について紹介する.西南日本はSSEの検出カタログが最も充実している地域であり,Okada et al. (2022) によって1997年から2020年までの23年間に284個の短期SSEが検出されている.そこで本研究では西南日本の770ヶ所のGEONET観測点について,PPP-AR解析を用いて日座標時系列を取得した.そして同カタログで短期SSEのシグナルが推定されている観測点・時期の時系列を抽出して学習用シグナルデータを得た.併せてシグナルを含まない時期・観測点の時系列をランダムに抽出しノイズデータとした.いずれも時間窓の長さは121エポックとした.このようにして得た合計16000個程度のデータを学習・テストデータに分割し,機械学習による地震動検出手法の一つであるGPD (Generalized Phase Detection, Ross et al., 2018) を参考にしたモデル構造に適用した.入力は座標時系列で,出力は時間窓にシグナルを含む確率となる.学習では交差エントロピーを損失関数とし,安定性を評価するためにモデルの初期値をランダムに変えて10回の学習を独立に繰り返した.
その結果,いずれも数十エポック程度で収束し80–90%の正答率を得られた.Okada et al. (2022) では検出したイベントを信頼度が高いクラス1と不確実性が大きいクラス2に分類しているが,今回の結果でもクラス2イベントのシグナルの見逃し率が1.5–3.0倍程度高くなった.またシグナル・ノイズいずれについても,テストデータのうち9割前後は10回中8回以上で正しく判定された.一方で残る1割前後は判定結果が不安定で,ほぼ必ず誤判定されるデータも見られた.10回の学習のうち正答が7回以下だったシグナルデータの傾向を調べた結果,時期や地域に明かな偏りは見られなかったが,変位量が小さいものに集中した.個々の観測点におけるシグナル・ノイズデータについて検出成功率・誤検知率を算出した場合,前者は規模の大きいイベントが頻繁に発生する四国西部で高くなった.後者はほぼ不規則で,学習時のデータ数が多いにも関わらず誤検知率が高い点もあるなど複雑な結果になった.
以上のように西南日本の実データを用いた機械学習である程度の精度でのシグナル検出に成功し,また検出結果の傾向も概ね直感に合うものとなった.発表では上記結果の詳細を紹介するとともに西南日本のGNSS時系列のノイズ時空間特性との関係を議論し,安定した学習と判定のための改善策を提示する.