13:30 〜 13:50
[2G4-GS-6-01] 大規模言語モデルを用いた質問応答文の自動評価とプロンプトインジェクションへの対処
キーワード:質問応答、意味理解、自動評価、大規模言語モデル
自然言語処理における質問応答の多くは,質問のドメインにかかわらず,応答テキストと事前に用意された正解テキストとの完全一致または部分一致によって評価される.しかし,質問の対象を限定しないオープンドメインな質問応答を評価する場合,同義な表現や表記揺れなどがあるためにテキストマッチングでは正確な評価ができないことが問題となる.これに対し,既存の研究では大規模言語モデル(LLM)に評価を行わせる自動評価が提案されているが,自動評価の脆弱性については議論が及んでいない.本研究では,これらの問題を解決するため,LLMを用いた自動評価の新しい枠組みを提案し,その性能や頑健性について議論を行う.実験により,LLMの自動評価が人間の評価と90%以上一致し,さらに評価システムへの攻撃に対して頑健であることが示された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。