16:40 〜 17:00
[1B4-OS-41b-04] 世界モデルとシグナル共有に基づく協調的マルチエージェント強化学習
キーワード:モデルベース強化学習、マルチエージェント、生成モデル、世界モデル
人間は,言語や記号といったシグナルを共有し,活用することによって協調行動を実現する.本研究では,このプロセスをマルチエージェント強化学習の文脈で実現するため,集合的予測符号化の枠組みに基づいて世界モデルの理論を拡張した協調的マルチエージェント強化学習手法を提案する.また,部分観測的なMinecraft環境における敵の討伐タスクを対象に実験を行い,シグナル共有がエージェント間の協調を促進することを示す.本研究は集合的予測符号化の観点からすれば分散型学習によるシグナルの推論は実現できてはいないが,その拡張を含め,記号創発の構成論としてのマルチエージェント強化学習手法となることが期待される.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。