11:45 AM - 12:00 PM
[S21-08] Development of an Interpretable Volcanic Earthquake Classification Method Using Transformer Encoders
火山地帯では火山活動に関連して度々活発な群発地震が発生する。また、噴火が近くなるとその数は増大し、中でも低周波地震の発生数が増加する傾向にある事例が報告されている。 それらの地震のタイプ分類は火山防災において非常に重要であるが、現在、これらのプロセスは最終的には人間の判断に委ねられ、膨大な時間とコストを要し、リアルタイムでの詳細な検証は不可能である。 そこで本研究では機械学習を用いて、上記のプロセスをリアルタイムに行うためのシステムを開発する。また、分析結果を避難指示等に用いるため、結果には解釈性が必要となる。 そこで本研究では機械学習(Transformer)を用いて様々な地震のタイプ別にパターンや特徴を分析し、それらを解釈性のある形で出力することを目的とする。本研究で構築するモデルは自然言語処理のモデルとして知られるBERTのアーキテクチャをベースとしている。入力データを時間0.5ごとの特徴量として埋め込み、データ先頭にclsトークンを付与し、位置エンコーディングを行った後に3層のTransformerエンコーダーレイヤーでエンコーディングを行う。エンコーディングされた時系列からclsトークンを取得し、全結合層を通し最終的にラベルの確率として出力する。上記のモデルを検証するために、様々なタイプの低周波地震が多く観測されている浅間山で発生する地震を解析対象として選んだ。モデルの構築には東京大学地震研究所、気象庁、防災科学技術研究所、国土地理院などによって設置した約20箇所の観測点で記録した過去約20年間(2000年代前半から現在まで)の観測波形データを使用する。浅間山のカタログでは地震のタイプは12種類あるが、今回はそのうちA型、B型の分類を目的とし、その2種類の地震とノイズデータを使用する。データ数はA型地震が1001個(6634波形), B型地震が4204個(31415波形), ノイズが11205波形となっている。各データのチャンネル数は3(水平2成分及び上下動), サンプリングレートは100Hzである。9001ポイントのデータのうち、A型地震、B型地震はP波到達時間からランダムに選んだ150~1000ポイントの間を開始地点とし、そこから3000ポイントを切り取って使用する。ノイズは上記9001ポイントデータのイベント波形以外の6000ポイント以降を使用する。これらのデータの80%を訓練データ、残りを検証データとして性能を評価した結果、A型地震、B型地震、ノイズのPrecisionはそれぞれ0.77、0.95、0.99、Recallは0.84、0.95、0.93となった。また、アテンションの重みを可視化することによりA型地震は主にS波に、B型地震はP波からイベント波形の中盤にかけて注目して分類を行っていることがわかった。今後は畳み込み層の出力やカーネルサイズ、Transformerのマルチヘッド数やレイヤー数などのハイパーパラメータのチューニングを行いさらなる精度の向上が見込めるかを検証する。また、解釈性の向上のために、アテンションの重みが集中している周波数帯についても検証する予定である。