JSAI2025

Presentation information

Organized Session

Organized Session » OS-41

[1B4-OS-41b] OS-41

Tue. May 27, 2025 3:40 PM - 5:20 PM Room B (Small hall)

オーガナイザ:鈴木 雅大(東京大学),岩澤 有祐(東京大学),河野 慎(東京大学),熊谷 亘(オムロンサイニックエックス),松嶋 達也(東京大学),Paavo Parmas(東京大学),谷口 尚平(東京大学)

4:40 PM - 5:00 PM

[1B4-OS-41b-04] Cooperative Multi-Agent Reinforcement Learning Based on World Models and Signal Sharing

〇Taisuke Takayama1, Naoto Yoshida1, Tadahiro Taniguchi1,2 (1. Kyoto University, 2. Ritsumeikan University)

Keywords:model-based reinforcement learning, multi-agent, generative model, world model

人間は,言語や記号といったシグナルを共有し,活用することによって協調行動を実現する.本研究では,このプロセスをマルチエージェント強化学習の文脈で実現するため,集合的予測符号化の枠組みに基づいて世界モデルの理論を拡張した協調的マルチエージェント強化学習手法を提案する.また,部分観測的なMinecraft環境における敵の討伐タスクを対象に実験を行い,シグナル共有がエージェント間の協調を促進することを示す.本研究は集合的予測符号化の観点からすれば分散型学習によるシグナルの推論は実現できてはいないが,その拡張を含め,記号創発の構成論としてのマルチエージェント強化学習手法となることが期待される.

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password