15:00 〜 15:20
[1M3-OS-47a-05] Large Language Models における意図的な性能制限
キーワード:大規模言語モデル、ベンチマーク、ペルソナ、ロールプレイ
大規模言語モデル(LLM)は指示文に応じて未知のタスクに高い精度を発揮したり,その振る舞いを柔軟に変えるという性質を持つ.この性質を利用し,LLM に仮想的な人物や性格を付与し,そのように振る舞わせる取り組みがある.その際,LLM の性能を意図的に制限できるならば,構築した仮想的な人物が確からしくなるだろう(例えば,幼稚園児が積分の計算ができないようにするなど).本研究ではそのような LLM の意図的な性能低下に取り組む.日本語ベンチマークを用いた実験の結果,指示文のみでは LLM の下流タスクにおける性能の低下が困難であることを報告する.また,性能低下の計測に必要なベンチマークについても検討する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。