2022年第83回応用物理学会秋季学術講演会

講演情報

一般セッション(口頭講演)

23 合同セッションN「インフォマティクス応用」 » 23.1 合同セッションN「インフォマティクス応用」

[22a-M206-1~11] 23.1 合同セッションN「インフォマティクス応用」

2022年9月22日(木) 09:00 〜 12:00 M206 (マルチメディアホール)

沓掛 健太朗(理研)、旭 良司(名大)

11:30 〜 11:45

[22a-M206-10] 材料辞書データベースを使った論文からの大量データ抽出:体系的自動タグ付け精度向上の検討

鈴木 晃1、石井 真史1 (1.物材機構)

キーワード:マテリアルズ・インフォマティクス、テキストデータマイニング、磁石物性

マテリアルズ・インフォマティクス(MI)用学習データを効率的に収集するための技術を構築している。これまで大量の学術論文から材料用語を抽出した材料辞書データベース(MDDB)を構築し、論文内用語に対し体系的に自動タグ付けを行なう手法を開発した。本稿では、自動タグ付けのアリゴリズム改良および精度評価を目的に、手動タグ付けによるアノテーションデータを作成し固有表現抽出によりタグ精度を検証した。