17:40 〜 18:00
[1G5-OS-26b-03] Wikidataを対象としたGPTに基づくエンティティリンキング
[1G4-OS-26a] 日常生活知識とAI 16:00 〜 16:20 にて発表
キーワード:エンティティリンキング、大規模言語モデル、Wikidata、GPT、知識グラフ
テキスト内の固有表現(エンティティ名)を知識ベース内のエンティティと関連付けるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.既存のEL手法の多くは英語を対象としており,他言語に対応していない場合やリソース不足により性能が低下することがある.本研究では,高度な言語理解と汎化能力を持つGPTに基づく日本語と英語を対象としたEL手法を提案する.提案手法はGPT-3.5-TurboおよびGPT-4にプロンプトを与えて,EL対象文からエンティティ名の抽出とそれに対応するWikipedia URLを生成する.次に,WikidataのSPARQLエンドポイントに問い合わせをして,Wikipedia URLからWikidata IDを取得し,エンティティ名とそのWikidata IDのセットを出力する.LC-QuAD2.0,SimpleQuestions,WebQSPの日本語と英語のデータセットを対象に,提案手法と先行研究手法(PNEL)を比較評価した.その結果,日本語SimpleQuestions以外のデータセットにおいて提案手法はPNELの精度を上回った.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。