日本地球惑星科学連合2022年大会

講演情報

[J] ポスター発表

セッション記号 S (固体地球科学) » S-CG 固体地球科学複合領域・一般

[S-CG55] 地震動・地殻変動・津波データの即時把握・即時解析・即時予測

2022年5月31日(火) 11:00 〜 13:00 オンラインポスターZoom会場 (27) (Ch.27)

コンビーナ:小木曽 仁(気象庁気象研究所)、コンビーナ:山田 真澄(京都大学防災研究所)、太田 雄策(東北大学大学院理学研究科附属地震・噴火予知研究観測センター)、コンビーナ:近貞 直孝(防災科学技術研究所)、座長:小木曽 仁(気象庁気象研究所)、近貞 直孝(防災科学技術研究所)

11:00 〜 13:00

[SCG55-P01] 深層学習を用いたリアルタイム震度の予測に向けて:比較的少ない学習データでの予測モデルの構築と性能の検証

*中村 桃子1、中村 勇士1、上松 大輝1、矢崎 友貴乃1金 亜伊1 (1.横浜市立大学)


地震発生時、正確な震度の空間分布を速やかに知ることは防災上非常に重要である。これらの実現には高密度での地震計の設置が理想的であるが、人的、経済的コストの面から難しい。実際は様々な手法を用いて空間補完をしていくしかないが、地質情報の精度等課題も多々ある。そのような背景から地質情報を用いない深層学習を用いた震度予測が提案されその有用性が示されている(Otake et al., 2020)。本研究では先行研究よりも格段に学習データの少ない横浜市の周辺において、深層学習の一種であるLong-short term memory(LSTM)を用いたリアルタイム震度(功刀, 2008, 以降Ir)の予測モデルの構築を試み、そのパフォーマンスの検証を行った。本研究ではOtake et al. (2020)と同様に既存のK-netの観測点を予測ターゲットとして、その周辺の4つのKnet観測点のデータと共に学習し、学習に用いていないターゲットのIrを予測するモデルを作成した。入力観測点4つにはKNG004、KNG012、TKY007、TKY021を選択し、ターゲットとしてKNG002を選択した。先行研究では東北地方の観測点を用いたため、2011年東北地方太平洋沖地震の余震が数多く確保でき、学習に用いる地震の数が約2500個にも登ったが、本研究では全観測点で共有する地震数は1996年から2020年までで236個と10分の1である。データの前処理として、記録開始から60秒の3成分の地震波形を、Irに変換後100hzにリサンプリングした。 学習における入力データはKNG004、KNG012、TKY007、TKY021の4点におけるIrである。正解データにはKNG002のIrを用いた。モデルはマスク層、3層のLSTM層、LSTM層の間に存在するドロップアウト層、全結合層で構成される。損失関数はMSE、全結合層の活性化関数はlinearを使用した。今回学習したモデルは、LSTMのユニット数を50、バッチサイズ1000、学習率0.001とし、エポック20で学習した。データ全体の1割をテストデータ、残りの9割のうち1割を検証データ、9割を教師データに利用した。
予測精度は加重平均と最大入力値で比較を行った。加重平均は予測地点から入力観測点までの距離を重みとして算出した。最大入力値はPLUM法を模倣した値であり、各時刻で入力観測点4つのうち最も大きい値を予測地点の震度としIrを算出した。時系列全体での予測値と観測値のMAE値とRMSE値はLSTMモデルがそれぞれ0.08、0.13であり、加重平均の0.53、0.66と最大入力値の0.51、0.74と比べると、LSTMモデルが精度良く予測できている事がわかった。また、実際のリアルタイム震度(観測Ir)が最大値をとった時刻付近で、同じ値を予測しているか比較した。観測Irが最大値をとった時刻の前後0.5秒間における、予測値の最大値と観測Irの差を加重平均、最大入力値と比較した。差の平均は最大入力値が最も小さい0.065を示し、標準誤差はLSTMモデルの予測値が最も小さい0.039を示した。さらに、60秒間の最大値と最大値を得た時刻の差を比較した。観測Irとの最大値の差の平均と、時刻の差の平均が最も小さいのは最大入力値でそれぞれ0.13、-0.30秒を示した。最大値の差における標準誤差の最小値はLSTMモデルで0.04、時刻の差における標準誤差は加重平均が1.2秒を示した。以上より時系列データそのもののMAE値とRMSE値ではLSTMを使用した予測モデルの精度が高いが、最終的な震度や最大値に到達する時刻は加重平均や最大入力値が優れていると言う結果になった。しかしながら、その時間推移を詳しく見てみるとLSTMで予測したIrは揺らぎが大きく、瞬間的に大きな値を示す事が多々あり、それらが誤差や標準偏差の見積もりに大きく影響していることがわかった。これらは本研究ではOtake et al. (2020)に比べて学習データが少ないことに起因している可能性がある。今後はこの予測モデルに移動平均を加えるなどの平滑化を行って再度評価を行う。またデータ数を増やす方法として、少なくとも1つの入力観測点と予測観測点1つが同じ地震を観測している場合でもデータに追加する事や、観測点自体の数も増やし性能を評価する予定である。