17:20 〜 17:40
[1N4-J-9-01] 自己学習による化学文書中の専門用語抽出
キーワード:固有表現抽出、ニューラルネットワーク
本研究では,化学文書中の専門用語の自動抽出に自己学習を取り入れる手法を提案する.我々は CHEMDNER コーパスを使い,ニューラルネットワークをベースとする化学文書中の専門用語抽出のモデルを訓練した.訓練済みのモデルは自動的に訓練データを作成するために,正解タグがついていない MEDLINE コーパスにアノテーションをするのに使用した.そして,最終的なモデルを獲得するために,人手でタグ付けが行われた CHEMDNER コーパスと自動タグ付けを行った MEDLINE コーパスの両方を用いて訓練を行った.訓練データとしてタグがついていない MEDLINE コーパスを用いた評価は,化学文書中の専門用語抽出における自己学習の有効性を示した.