2025年度 人工知能学会全国大会(第39回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[3Win5] ポスターセッション3

2025年5月29日(木) 15:30 〜 17:30 W会場 (イベントホールD-E)

[3Win5-75] 無機材料の合成プロセス予測のための大規模言語モデルの応用

〇鈴木 雄太1、栗田 修平2 (1.トヨタ自動車株式会社、2.国立情報学研究所)

キーワード:マテリアルズインフォマティクス、材料科学、大規模言語モデル

材料研究において、所望の性質を持つ材料の合成には、適切な合成プロセスの設計が重要だが、その探索には膨大な時間と労力が必要となる。
本研究では、所望の材料の組成を入力として、その材料の原料および合成プロセスを提案するAIシステムの開発を目指す。このために合成プロセスのデータセット構築および、大規模言語モデル(LLM)の学習・評価を行った。
まずデータセット構築のため大規模論文コーパス(S2ORC)から100万件の論文を抽出し、TF-IDFベクトルを用いたクラスタリングにより材料科学論文をスクリーニングの後、LLM(Google Gemini 2.0 Flash)を用いて合成手順の抽出および構造化を行い、1.7万件の合成手順を抽出し学習用データセットとした。
続いてこのデータをもとにLLM(Llama 3.1 8B)に追加学習を行い、新材料についても概ね妥当な合成プロセスを提案できることを明らかにした。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード