異種エージェント環境における協調行動の汎化のための状態空間の一般化

薄 佑太

15:20 〜 15:40

[1F4-GS-5-02] 異種エージェント環境における協調行動の汎化のための状態空間の一般化

〇薄佑太¹、森山甲一¹、武藤敦子¹、松井藤五郎²、犬塚信博¹ (1. 名古屋工業大学、2. 中部大学)

キーワード：マルチエージェント、強化学習

人間は日常の集団生活において、目的達成のために、個人にとって利益のある行動選択を行うだけでなく、場合によって集団全体の利益を考慮した協調的な行動選択をすることがある。一方、エージェントが複数存在するようなマルチエージェント環境においても、人間の場合と同様の環境を想定する時、エージェントには協調行動が求められる。従来の協調行動の実現方法については設計者によって事前に設計されているものが多かった。しかし、そのような協調の規則を一つ一つ設計するのは困難だと考えられる。そこで、異なる種類のエージェントが協力すべきゲームにおいて、協調に必要なプロセスを事前知識として含むことなく、エージェントの座標情報を用いた強化学習によって、自律的に協調行動の獲得をする手法が提案された。しかし、この手法は、獲得した協調行動を未知の環境で発揮できないことが問題点となった。そこで本研究では、目標物の座標を基準とした”相対座標”を用いて状態を定義することでそのエージェントに汎化性能を持たせることを考える。先行手法と比較実験を行った結果、獲得した協調行動を未知の環境で同じように発揮し、汎化性能の導入に成功した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[1F4-GS-5] エージェント

[1F4-GS-5-02] 異種エージェント環境における協調行動の汎化のための状態空間の一般化

パスワード