11:15 〜 11:30
[11a-N107-9] 材料辞書データベースを使った論文からの大量データ抽出:物性値取得精度向上の検討
キーワード:マテリアルズ・インフォマティクス、テキストデータマイニング
マテリアルズ・インフォマティクス(MI)用学習データを効率的に収集するための技術を構築している。これまで大量の学術論文から材料用語を抽出した材料辞書データベース(MDDB)を構築し、論文内用語に対し体系的に自動タグ付けとタグ間の関連付けを行なう手法を開発した。本稿では、材料物性値および付随情報の取得精度向上を目的に、MDDB への用語および用語間関係性の追加・修正、およびそれらを効率的に実施するための手法を検討した。