Acquiring Cooperative Behavior Through Rewards in Multi-Agent Path Finding

HARUTO SUGAWARA

6:40 PM - 7:00 PM

[1D5-OS-24c-04] Acquiring Cooperative Behavior Through Rewards in Multi-Agent Path Finding

〇HARUTO SUGAWARA¹, HIROYUKI TODA¹ (1. Yokohama City University)

Keywords:Multi-agent path finding, reinforcement learning, reward shaping

現在地から目的地まで，複数の行動主体が衝突することなく移動する経路を計画する問題は，マルチエージェント経路計画問題(Multi-Agent Path Finding)として定式化される．
近年，マルチエージェント経路計画に対して強化学習を用いたアプローチが注目されており，行動主体それぞれが独立して学習する枠組みで複雑な環境での実験に成功した手法が存在する．しかしこの手法では，自己利益の追求により他者の行動を妨害し，システム全体のパフォーマンスが低下するという課題がある．
本研究では，強化学習を活用するアプローチにおいて，行動主体それぞれが独立して学習する際の報酬の設定に着目し，他エージェントを考慮した協調行動の獲得を目指す．具体的には，各エージェントの報酬に他エージェントの行動が与える影響を組み込み，その影響範囲を適切に調整することで，より効率的な協調行動の学習を実現する．本手法と既存研究との比較を通じ，システム全体の性能向上を達成することを目的とする．

Please log in with your participant account.
» Participant Log In

Presentation information

[1D5-OS-24c] OS-24

[1D5-OS-24c-04] Acquiring Cooperative Behavior Through Rewards in Multi-Agent Path Finding