2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2G5-GS-6] 言語メディア処理:

2024年5月29日(水) 15:30 〜 17:10 G会場 (22+23会議室)

座長:牧田光晴(LINEヤフー株式会社/SB Intuitions株式会社)

16:30 〜 16:50

[2G5-GS-6-04] テキスト生成のためのより良いLLM評価器: プロンプト出力のシーケンスと最適化の影響

〇朱 冠肇1、陳 宜珮1、中山 英樹1 (1. 東京大学)

キーワード:大規模言語モデル、プロンプト、会話評価

大規模言語モデル(LLM)は、テキスト生成タスクにおいて、生成されたテキストにスコアを割り当てる評価者として普及しつつある。しかし、LLMの評価者は一貫したスコアを与えることができない。本研究では、プロンプトのデザインがLLMの採点に与える影響を、特に主観的な対話品質評価タスクに焦点を当てて調査する。我々は、プロンプト内の出力順序に関する指示が、特定のLLMの得点分布に大きく影響することを発見した。この発見は、主観的な評価を必要とするタスクにおいて、微妙なプロンプトのデザイン要素が与える影響を浮き彫りにしている。私たちの分析は、LLMを採点者として使用する際の効果的なプロンプト・デザインの理解を深めることに貢献する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード