2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-9 自然言語処理・情報検索

[1N4-J-9] 自然言語処理・情報検索: ドメイン知識分析

2019年6月4日(火) 17:20 〜 18:40 N会場 (1F 展示ホール右奥)

座長:大熊 智子(富士ゼロックス) 評者:貞光 九月(フューチャー株式会社)

17:20 〜 17:40

[1N4-J-9-01] 自己学習による化学文書中の専門用語抽出

〇崔 一鳴1,3、西川 仁1,3、徳永 健伸1、吉川 和2,3、岩倉 友哉2,3 (1. 東京工業大学 情報理工学院、2. 株式会社富士通研究所、3. 理研 AIP-富士通連携センター)

キーワード:固有表現抽出、ニューラルネットワーク

本研究では,化学文書中の専門用語の自動抽出に自己学習を取り入れる手法を提案する.我々は CHEMDNER コーパスを使い,ニューラルネットワークをベースとする化学文書中の専門用語抽出のモデルを訓練した.訓練済みのモデルは自動的に訓練データを作成するために,正解タグがついていない MEDLINE コーパスにアノテーションをするのに使用した.そして,最終的なモデルを獲得するために,人手でタグ付けが行われた CHEMDNER コーパスと自動タグ付けを行った MEDLINE コーパスの両方を用いて訓練を行った.訓練データとしてタグがついていない MEDLINE コーパスを用いた評価は,化学文書中の専門用語抽出における自己学習の有効性を示した.