2020年第81回応用物理学会秋季学術講演会

講演情報

一般セッション(口頭講演)

23 合同セッションN「インフォマティクス応用」 » 23.1 合同セッションN「インフォマティクス応用」

[9p-Z09-1~18] 23.1 合同セッションN「インフォマティクス応用」

2020年9月9日(水) 13:00 〜 18:00 Z09

柴田 基洋(東大)、小嗣 真人(東理大)、冨谷 茂隆(ソニー)

17:30 〜 17:45

[9p-Z09-17] 材料辞書データベースを使った論文からの大量データ抽出:材料用語の階層化による体系的自動タグ付け

鈴木 晃1、石井 真史1 (1.物材機構)

キーワード:マテリアルズインフォマティクス, テキストデータマイニング, 材料データベース

マテリアルズ・インフォマティクス(MI)用学習データの効率的収集を目的に、大量学術論文から専門用語を抽出し分類することで材料辞書として構築している。抽出した用語をルールベースで自動階層構造化する手法を構築し、RDF(Resource Description Framework)によりデータベース化した。辞書内用語はそれぞれ階層概念や同義語等の情報を有するため、これを学術論文に自動アノテーションすることでMIの目的に応じた学習データの自動生成が可能になると考える。