2018年度人工知能学会全国大会(第32回)

講演情報

インタラクティブ発表

一般セッション » インタラクティブ

[4Pin1] インタラクティブ(2)

2018年6月8日(金) 09:00 〜 10:40 P会場 (4F エメラルドロビー)

09:00 〜 10:40

[4Pin1-18] 多段Doc2Vecによるエンティティリンキングの応用

〇津々見 誠1、村上 浩司2、梅田 卓志2 (1. 楽天株式会社、2. 楽天技術研究所)

キーワード:自然言語処理、エンティティリンキング、Doc2Vec

データの構造化は自然言語処理における重要なテーマの1つである.我々はeコマースにおけるデータ構造化の一環として,楽天市場の商品のメーカー名と,知識ベース上の企業との自動マッピングのタスクに取り組んだ.テキスト中で何らかの実体を指示する用語を知識ベースに対応付けるエンティティリンキングにおいて,語の多義性やエンティティの曖昧性,リンクの存在の不確定性等,解決すべき課題は多い.我々は役割の異なるDoc2Vecモデルを多段に重ねて複数の観点からリンキングの正当性を検証する手法を提案する.評価実験において本手法はテキストマッチングによる手法を31.0ポイント上回る83.5%のマッピング精度を達成した.本手法は用語の多義性をはじめとする課題の解決に対して有効である他,辞書や教師データの作成等人手を要する工程を必要とせず,コスト面での優位性が高いことを示した.