The 81st JSAP Autumn Meeting, 2020

Presentation information

Oral presentation

23 Joint Session N "Informatics" » 23.1 Joint Session N "Informatics"

[9p-Z09-1~18] 23.1 Joint Session N "Informatics"

Wed. Sep 9, 2020 1:00 PM - 6:00 PM Z09

Kiyou Shibata(the University of Tokyo), Masato Kotsugi(Tokyo Univ. of Sci.), Shigetaka Tomiya(SONY Corp.)

5:30 PM - 5:45 PM

[9p-Z09-17] Automatic data extraction from scientific articles using the materials-dictionary database: Systematic automatic tagging by graph-structuring of technical terms

Akira Suzuki1, Masashi Ishii1 (1.NIMS)

Keywords:Materials Informatics, Text Data Mining, Materials database

マテリアルズ・インフォマティクス(MI)用学習データの効率的収集を目的に、大量学術論文から専門用語を抽出し分類することで材料辞書として構築している。抽出した用語をルールベースで自動階層構造化する手法を構築し、RDF(Resource Description Framework)によりデータベース化した。辞書内用語はそれぞれ階層概念や同義語等の情報を有するため、これを学術論文に自動アノテーションすることでMIの目的に応じた学習データの自動生成が可能になると考える。