09:00 〜 10:40
[4Pin1-18] 多段Doc2Vecによるエンティティリンキングの応用
キーワード:自然言語処理、エンティティリンキング、Doc2Vec
データの構造化は自然言語処理における重要なテーマの1つである.我々はeコマースにおけるデータ構造化の一環として,楽天市場の商品のメーカー名と,知識ベース上の企業との自動マッピングのタスクに取り組んだ.テキスト中で何らかの実体を指示する用語を知識ベースに対応付けるエンティティリンキングにおいて,語の多義性やエンティティの曖昧性,リンクの存在の不確定性等,解決すべき課題は多い.我々は役割の異なるDoc2Vecモデルを多段に重ねて複数の観点からリンキングの正当性を検証する手法を提案する.評価実験において本手法はテキストマッチングによる手法を31.0ポイント上回る83.5%のマッピング精度を達成した.本手法は用語の多義性をはじめとする課題の解決に対して有効である他,辞書や教師データの作成等人手を要する工程を必要とせず,コスト面での優位性が高いことを示した.