2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-9 自然言語処理・情報検索

[1N4-J-9] 自然言語処理・情報検索: ドメイン知識分析

2019年6月4日(火) 17:20 〜 18:40 N会場 (1F 展示ホール右奥)

座長:大熊 智子(富士ゼロックス) 評者:貞光 九月(フューチャー株式会社)

18:00 〜 18:20

[1N4-J-9-03] 文書からの化合物名抽出のためのサブワード有効性調査

〇浦澤 合1,3、関根 裕人1,3、乾 孝司1,3、岩倉 友哉2,3 (1. 筑波大学大学院、2. 富士通研究所、3. 理研 AIP-富士通連携センター)

キーワード:化合物抽出、サブワード

本論文は化学化合物抽出におけるサブワード系列の有効性を調査する.5種類のサブワード分割方法(SYMBOL,SP,BPE,BPE-DICT,BPE-PMI)を用いて調査を行った.この内,BPE-DICTとBPE-PMIは今回新たに提案する手法であり,BPE-DICTとは辞書制約付きのBPE,BPE-PMIとは通常のBPEが語の出現頻度を用いる箇所をPointwise Mutual Information(PMI)に置き換えたBPEである.実験結果よりサブワード系列が抽出性能を向上させることを示した.本論文で行った全ての実験結果ではBPE-DICTのF値86.74が最も良い結果となった.