世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案

青木 瑞穂

13:50 〜 14:10

[2G4-OS-21d-02] 世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案

青木瑞穂¹、藤重天真²、〇塚本慧³、藤本昌也⁴、鈴木雅大⁵、松尾豊⁵ (1. 名古屋大学工学研究科、2. 東京工業大学生命理工学院、3. 東京大学、4. 大阪大学情報科学研究科、5. 東京大学大学院工学系研究科)

キーワード：世界モデル、公平性

近年, 強化学習手法を用いてマルチエージェント経路計画を行う研究が発展している. この問題に取り組む上で, 各エージェントが自身の報酬に動機づけられることで, エージェント同士が協調する行動を学習することが難しいという課題がある. 本研究では, 周囲の動きを予測する世界モデルを用いて自己の利益と他者の利益を併せて考慮することで, エージェントの動作に与える影響を調べた. エージェントの公平性を考慮することは, エージェント間の獲得報酬に生じる偏りを是正する有力な解決策となり, 最終的には混雑した環境での動作など実環境で利用する上で十分な性能を獲得することが期待される.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2G4-OS-21d] 世界モデルと知能

[2G4-OS-21d-02] 世界モデルベースマルチエージェント強化学習におけるエージェント間の公平性を考慮した経路計画手法の提案

パスワード