12:20 〜 12:40
[4G2-GS-6-02] 自己強化学習による関係構築型インタビューエージェント
キーワード:対話システム、大規模言語モデル、自己強化学習
デジタルツインなどの本人を再現したエージェントの実現には、個人の価値観や人生観といった深い自己開示を伴う情報の獲得が重要となる。このような情報を取得するには、機械的な質問応答システムでは不十分であり、適度な雑談を交えた関係構築的な対話が必要となる。本研究では、この関係構築と効率的な情報収集を両立する対話エージェントの実現を目的として、人間のインタビュアーの対話戦略を模倣する初期学習と、LLM同士のシミュレーションによる自己強化学習を組み合わせた手法を提案する。対話ログを用いた主観評価アンケートの結果、追加学習を行っていないLLMと比較して「応答の意味」「楽しさ」「自然さ」「温かみ」「再対話意欲」「対話の弾み」の6項目で評価結果が改善した。また、単純に人の対話戦略を直接模倣するBehavior Cloningと比較して提案手法は情報収集の網羅性が向上した。これらの結果は、提案手法が関係構築と情報収集を両立する対話の実現に有効であることを示している。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。