13:45 〜 14:00
[SCG60-01] 地震研究における大規模言語モデル活用の挑戦
キーワード:大規模言語モデル、地震研究、ハッカソン
大規模言語モデル(LLM)に関する近年の技術革新およびサービス展開は目覚ましく、私たちの生活の様々な場面で使われている。事務的作業や教育においても取り入れられつつあるが、研究活動への適用は限定的であり、それぞれの学術分野で試行錯誤が続いている。こうした背景の中、地震研究分野におけるLLMの活用を探るハッカソンを2024年夏に開催した。ハッカソンは、様々なバックグラウンドを持つ人々が集まり、特定のテーマに関するアイデアを短期間で形にするイベントである。本ハッカソンには18名が参加し、以下の4つの課題に取り組んだ。なお本ハッカソンで扱ったLLMはハッカソン時点(2024年8月)のものであることに留意されたい。
1. シミュレーション結果の特徴抽出・解説付与
防災科研J-SHISで公開されている地震動予測地図の震度分布について、地震発生時の強震動域や地盤特性に関する解説をLLMによって自動生成することを試みた。今回は解説付与対象を首都直下地震の一つとして想定される立川断層帯に限ったが、対象とすべき地震は膨大かつ多様であり、LLM の活用は網羅的な解説付与に有効と考えられる。また、関数最適化問題において自然言語を利用する試みとしてChatGPT による対話形式およびTextGrad (Hou et al. 2023)による非対話形式で問題を解くことも試みた。従来マニュアル操作で行われていた外れ値の自動認識や説明付与などでの活用につながると考える。
2. 地震関連ソーシャルデータの自動収集・解析
2024年8月8日の日向灘地震と南海トラフ地震臨時情報に関する Webニュース記事とコメントを収集し、社会の反応をLLMで解析した。具体的には、特定のカテゴリに分類できるコメント内容の要約、記事のスタンスとコメントの傾向の関係性、コメントの質的変化分析、科学者に対する感情の時間変化、コメントのクラスター分析を行った。そのうち、解析者が一定の方向性を示してコメントの要約を求めるようなタスクにおいては、主観的な印象とよく一致する結果が得られた。さらにコメントへのラベル付けおよび定量解析も試みたが、LLMによるラベル付けの信頼性が課題となった。それでも短時間で大量の情報を自動処理して社会の反応をモニタリングするツールとしては、十分に有用であるという印象を得た。
3. 地震・火山に関する想定問答の自動生成
気象庁や内閣府、地震調査研究推進本部、火山噴火予知連絡会より公開されているPDF資料を検索拡張生成(Retrieval-Augmented Generation、RAG)機能付きのLLMで読み込み、地震や火山に関する想定質問に対する回答の自動生成を試みた。クローズドLLM の一つであるNotebookLM(Google 2024)とLlama 3.1やGemma2などのローカルLLMを比較し、精度を評価した。Notebook LMは直感的な操作のみで妥当な回答を得られることが多かったが、場合によってはハルシネーションが発生することも確認した。ローカルLLMによる回答は不十分なものになることが多かったが、これは単純なRAG技術を今回採用したことによると考えられる。またLLMによる回答精度向上のためには、データや質問の整理が重要であることも実感した。
4. シミュレーションコードの自動生成
沈み込み帯における巨大地震の繰り返し発生を再現する地震サイクル・シミュレーションと、関連するデータ同化のためのPythonコードの作成を目的に、以下の3つの課題に取り組んだ:ばねブロックモデルを用いた地震サイクル計算、ローレンツ63モデルの粒子フィルタによるデータ同化、プレート境界での摩擦特性推定のための4次元変分法データ同化。いずれにおいても最終的な目的は達成されたが、その過程においては人の手で数式等の修正を指示するなどの試行錯誤が必要であった。それでもLLMを活用することでコーディング作業が大幅に効率化されることが示された。
このハッカソンを通じて、地震研究におけるLLM活用について一定の方向性を示せたと考える。今後のLLMの進展により、さらに多くの研究シーンでの活躍が期待される。
1. シミュレーション結果の特徴抽出・解説付与
防災科研J-SHISで公開されている地震動予測地図の震度分布について、地震発生時の強震動域や地盤特性に関する解説をLLMによって自動生成することを試みた。今回は解説付与対象を首都直下地震の一つとして想定される立川断層帯に限ったが、対象とすべき地震は膨大かつ多様であり、LLM の活用は網羅的な解説付与に有効と考えられる。また、関数最適化問題において自然言語を利用する試みとしてChatGPT による対話形式およびTextGrad (Hou et al. 2023)による非対話形式で問題を解くことも試みた。従来マニュアル操作で行われていた外れ値の自動認識や説明付与などでの活用につながると考える。
2. 地震関連ソーシャルデータの自動収集・解析
2024年8月8日の日向灘地震と南海トラフ地震臨時情報に関する Webニュース記事とコメントを収集し、社会の反応をLLMで解析した。具体的には、特定のカテゴリに分類できるコメント内容の要約、記事のスタンスとコメントの傾向の関係性、コメントの質的変化分析、科学者に対する感情の時間変化、コメントのクラスター分析を行った。そのうち、解析者が一定の方向性を示してコメントの要約を求めるようなタスクにおいては、主観的な印象とよく一致する結果が得られた。さらにコメントへのラベル付けおよび定量解析も試みたが、LLMによるラベル付けの信頼性が課題となった。それでも短時間で大量の情報を自動処理して社会の反応をモニタリングするツールとしては、十分に有用であるという印象を得た。
3. 地震・火山に関する想定問答の自動生成
気象庁や内閣府、地震調査研究推進本部、火山噴火予知連絡会より公開されているPDF資料を検索拡張生成(Retrieval-Augmented Generation、RAG)機能付きのLLMで読み込み、地震や火山に関する想定質問に対する回答の自動生成を試みた。クローズドLLM の一つであるNotebookLM(Google 2024)とLlama 3.1やGemma2などのローカルLLMを比較し、精度を評価した。Notebook LMは直感的な操作のみで妥当な回答を得られることが多かったが、場合によってはハルシネーションが発生することも確認した。ローカルLLMによる回答は不十分なものになることが多かったが、これは単純なRAG技術を今回採用したことによると考えられる。またLLMによる回答精度向上のためには、データや質問の整理が重要であることも実感した。
4. シミュレーションコードの自動生成
沈み込み帯における巨大地震の繰り返し発生を再現する地震サイクル・シミュレーションと、関連するデータ同化のためのPythonコードの作成を目的に、以下の3つの課題に取り組んだ:ばねブロックモデルを用いた地震サイクル計算、ローレンツ63モデルの粒子フィルタによるデータ同化、プレート境界での摩擦特性推定のための4次元変分法データ同化。いずれにおいても最終的な目的は達成されたが、その過程においては人の手で数式等の修正を指示するなどの試行錯誤が必要であった。それでもLLMを活用することでコーディング作業が大幅に効率化されることが示された。
このハッカソンを通じて、地震研究におけるLLM活用について一定の方向性を示せたと考える。今後のLLMの進展により、さらに多くの研究シーンでの活躍が期待される。