2025年度 人工知能学会全国大会(第39回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[3A1-GS-10] AI応用:大規模言語モデル

2025年5月29日(木) 09:00 〜 10:40 A会場 (大ホール)

座長:塚原 裕史(デンソーアイティーラボラトリ)

09:40 〜 10:00

[3A1-GS-10-03] LLMマルチエージェントシステムにおけるエージェント評価手法に関する研究

〇田中 孝明1、大坪 舜2、林 祐輝2、伊藤 孝太郎2、畠山 卓也1、吉田 隆史1、石川 信行1 (1. 株式会社博報堂テクノロジーズ、2. 株式会社NTTデータ数理システム)

キーワード:AIエージェント、大規模自然言語モデル、マルチエージェント、LLMエージェント、ヒューマンAIインタラクション

大規模言語モデル(LLM)マルチエージェントシステムは, 複数のAIエージェントが協力や競争を通じて複雑なタスクを達成するシステムである. これらのシステムは, 質疑応答の正答率向上, 現実世界の相互作用のシミュレーション, ソフトウェア開発の効率化など, 多岐にわたる応用が研究されている.しかし,マルチエージェントシステムにおける各エージェントの有効性を評価するための手法については,十分に研究が進んでいない. 本研究では, 我々が開発したNomatica(ノーマティカ)というLLMマルチエージェントシステムを用いて, フリーディスカッションやアイディエーション, レビューセッションなどのタスク実行時に各エージェントの有効性を評価する手法を検討し, 評価を行った. 評価においては, 特にRAG(Retrieval Augmented Generation)技術を利用したRAGエージェントの有用性に着目した. 評価の結果, RAGエージェント及び特定用途のエージェントの活用がシステム全体の性能向上に寄与することが示され, エージェント評価手法の開発における示唆を得た.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード