11:30 AM - 11:45 AM
[22a-M206-10] Automatic data extraction from scientific articles using the materials-dictionary database:Improvement of accuracy for automatic annotation
Keywords:materials informatics, text data mining, Magnetic properties
マテリアルズ・インフォマティクス(MI)用学習データを効率的に収集するための技術を構築している。これまで大量の学術論文から材料用語を抽出した材料辞書データベース(MDDB)を構築し、論文内用語に対し体系的に自動タグ付けを行なう手法を開発した。本稿では、自動タグ付けのアリゴリズム改良および精度評価を目的に、手動タグ付けによるアノテーションデータを作成し固有表現抽出によりタグ精度を検証した。