13:50 〜 14:10
[2G4-OS-21d-02] 世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案
キーワード:世界モデル、公平性
近年, 強化学習手法を用いてマルチエージェント経路計画を行う研究が発展している. この問題に取り組む上で, 各エージェントが自身の報酬に動機づけられることで, エージェント同士が協調する行動を学習することが難しいという課題がある. 本研究では, 周囲の動きを予測する世界モデルを用いて自己の利益と他者の利益を併せて考慮することで, エージェントの動作に与える影響を調べた. エージェントの公平性を考慮することは, エージェント間の獲得報酬に生じる偏りを是正する有力な解決策となり, 最終的には混雑した環境での動作など実環境で利用する上で十分な性能を獲得することが期待される.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。