15:40 〜 16:00
[1N3-J-9-02] エンティティリンキングのための言及抽出手法
キーワード:エンティティリンキング、固有表現認識、言及抽出
本論文ではテキスト中から言及を抽出する言及抽出手法の提案を行う。
提案手法は計2回の系列ラベリングで構成される。最初の系列ラベリングは形態素を識別するために行う。2回目の系列ラベリングは各チャンク(またはチャンキングされていない単語)が本当にエンティティであるかどうかを確認する。また、言及のカテゴリラベルの細かさと言及抽出との性能の関係を調べた。実験の結果、2回目の系列ラベリングでは再現率が向上し、11カテゴリが最もよい結果となった。
提案手法は計2回の系列ラベリングで構成される。最初の系列ラベリングは形態素を識別するために行う。2回目の系列ラベリングは各チャンク(またはチャンキングされていない単語)が本当にエンティティであるかどうかを確認する。また、言及のカテゴリラベルの細かさと言及抽出との性能の関係を調べた。実験の結果、2回目の系列ラベリングでは再現率が向上し、11カテゴリが最もよい結果となった。