2021年第68回応用物理学会春季学術講演会

講演情報

一般セッション(口頭講演)

23 合同セッションN「インフォマティクス応用」 » 23.1 合同セッションN「インフォマティクス応用」

[19p-Z32-1~15] 23.1 合同セッションN「インフォマティクス応用」

2021年3月19日(金) 13:30 〜 17:45 Z32 (Z32)

宮寺 哲彦(産総研)、横井 達矢(名大)、小山 幸典(物材機構)

16:45 〜 17:00

[19p-Z32-12] Machine readable extraction of chemically modified materials name

Luca Foppiano1、Sae Dieb1、Pedro Baptista de Castro2、Yan Meng2、Kensei Terashima2、Yoshihiko Takano2、Ishii Masashi1 (1.MDG, MaDIS, NIMS、2.NFSMG, MANA, NIMS)

キーワード:machine learning, material parser, text mining

We present a machine-learning based material name parser for unstructured text. The parser implements a Conditional Random Field (CRF) model that segments the raw material string in seven component: name (Metal diboride, hydrogen, etc.), chemical formula (La Fe O7, SiH 4, etc.), doping ratio (Zn-doped, pure, etc.), stochiometric variable names and values (x = 1, 2; y = 3), and shape (thin film, powder, etc.). We constructed the training data of 3000 material names, using all the material entities from the SuperMat dataset.