16:00 〜 16:20
[2O5-GS-5-03] 「一般化塗りつぶし問題」における強化学習
キーワード:マルチエージェント、強化学習、ゲームAI
本研究では「一般化塗りつぶし問題」にボトムアップ型のマルチエージェント・コミュニケーション・モデル(以下MACモデル)とトップダウン型指揮官AI-エージェントモデル(以下CAIAモデル)に適用した。本問題は複数のエージェントにグリッド状マップ全体を塗りつぶさせるゲームであり、清掃ロボット、地雷除去、ドローン制御など複数のロボットを協調させるアルゴリズムの探究に利用可能である本実験は障害物のないノーマル型と障害物による迷路型を対象とする。各エージェントはニューラルネットワークを持ち、入力には各エージェントの座標とマップ情報を渡し、出力として、MACモデルではエージェント自身が行動を決定し、CAIAモデルでは全エージェントの行動を決定することでマルチエージェント強化学習を行う。全体を塗り終わると各エージェントに報酬を与え学習を進める。本研究の目的は、両モデルを比較し、マップの形状に応じてMACモデルとCAIAモデルのどちらが効率的なアルゴリズムかを判断することにある本研究に応用として複数のドローンに効率的に空間を探索させる手法として役立つ。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。