12:40 〜 13:00
[4G2-OS-24c-03] 大規模知識グラフを対象とした英語エンティティリンキングモデルの日本語対応における課題の分析
キーワード:知識グラフ、エンティティリンキング、ウィキデータ
自然言語文中のエンティティ名をWikidataなどの大規模知識グラフのリソースと対応づけるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.最先端のEL研究は英語を対象としており,日本語を対象としたEL研究は少ない.ELモデル構築には言語モデルや知識グラフ埋め込みを利用しており,日本語ELモデルを構築するにはこれらの日本語対応が必要となる.本研究では,英語ELモデルを日本語対応するための課題の分析を行う.まず,Wikidataを対象とした英語ELモデルであるPNEL(Pointer Network based Entity Linker) を再利用し,言語依存の埋め込みを変更することにより,日本語ELモデルを構築する.次に英語データセットであるwebQSP,SimpleQuestions,LC-QuAD2を日本語に翻訳し,日本語と英語ELモデルの比較評価を可能にする.最後に,埋め込み手法の観点からELモデルの言語間の精度差を分析し,日本語ELモデル構築の課題を考察するとともに,今後の展望について述べる.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。