タスク補助報酬を付加した敵対的逆強化学習による集団行動下エージェントの役割分担

弓場 亮介

15:20 〜 15:40

[4G3-GS-7-05] タスク補助報酬を付加した敵対的逆強化学習による集団行動下エージェントの役割分担

〇弓場亮介¹、堀井隆斗²、長井隆行^2,1 (1. 電気通信大学、2. 大阪大学)

キーワード：模倣学習、役割分担、マルチエージェント、敵対的逆強化学習

人が集団で課題に取り組む際には，各個人が個別の役割を担い行動する．例えば，複数の子が鬼に捕まらないよう逃げる課題では，単に逃げ回るだけでなく囮役となり鬼をひきつけたり，物陰に隠れるといった行動によって鬼を狼狽させ逃げやすくする．一方でこのような役割分担の実現には，集団内で個々人が互いに異なる種類の行動を獲得する必要がある. 効率的な行動獲得には他者の行動を見まねする模倣学習が有用であるが，従来研究では学習者の個人差や身体性があまり考慮されてこなかった．本研究では，複数エージェントの敵対的逆強化学習に課題達成の支援となる報酬を導入し，逆強化学習によって推定された教示者報酬との重みづけ和を各学習者によって変化させることで，多様な行動を獲得する手法を提案する．そしてこの報酬重みや身体性など学習者が持つ特性の組み合わせと，提案手法によって役割分担の発現を目指す．実験では，学習者集団が鬼との接触を回避する課題において報酬重みと接触回数の関係を検証した．結果として，学習者集団は異なる個人特性を持つことで多様な行動を獲得した．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4G3-GS-7] エージェント: マルチエージェント (2)

[4G3-GS-7-05] タスク補助報酬を付加した敵対的逆強化学習による集団行動下エージェントの役割分担

パスワード