16:30 〜 16:45
[19p-Z32-11] 材料辞書データベースを使った論文からの大量データ抽出:
用語間関係性抽出の自動化検討
キーワード:マテリアルズ・インフォマティクス、テキストデータマイニング
マテリアルズ・インフォマティクス(MI)用学習データを効率的に収集するための技術を構築している。これまで、大量の学術論文から抽出した材料用語を自動階層構造化することで材料辞書データベース(DB)を構築し、論文内用語に対し体系的に自動タグ付けする手法を開発してきた。本稿では、材料用語間の関係性抽出自動化を目的に、1対のタグ間の関係性抽出、略語と正式名称の紐づけを行うことで辞書DBの拡張を行った。