2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-9 自然言語処理・情報検索

[1N4-J-9] 自然言語処理・情報検索: ドメイン知識分析

2019年6月4日(火) 17:20 〜 18:40 N会場 (1F 展示ホール右奥)

座長:大熊 智子(富士ゼロックス) 評者:貞光 九月(フューチャー株式会社)

17:40 〜 18:00

[1N4-J-9-02] 複数サブワード系列を考慮したBiLSTM-CRFモデルを用いた文書からの化合物名抽出

〇関根 裕人1、浦澤 合1、乾 孝司1、岩倉 友哉2 (1. 筑波大学院/理研 AIP-富士通連携センター、2. 理研 AIP-富士通連携センター)

キーワード:固有表現抽出、ディープラーニング、サブワード

本稿では、化学分野の文書から化合物名を抽出するためのBiLSTM-CRFモデルを提案する。提案するモデルは、文脈情報を持った複数のサブワードLSTMを入力層に連結したものである。複数のサブワード系列を入力に加えることで、長い文脈情報や未知語に対して十分な特徴を得ることができる。 モデルの有効性を調べるためにCHEMDNERタスクに基づいて実験を行った。 結果として、抽出精度は通常のBiLSTM‐CRFモデルより優れており、未知語に対する実験結果は提案した方法がより良くはたらくことを示した。