ブレンド交叉を用いたGAによる主観的効用の進化

岡田 直也

14:20 〜 14:40

[4O3-J-7-02] ブレンド交叉を用いたGAによる主観的効用の進化

〇岡田直也¹、森山甲一¹、武藤敦子¹、松井藤五郎²、犬塚信博¹ (1. 名古屋工業大学、2. 中部大学)

キーワード：遺伝的アルゴリズム、マルチエージェントシステム、強化学習

客観的報酬に各エージェント効用導出関数を適用して得られる主観的効用を報酬として用いる効用利用Q学習において，囚人のジレンマゲームで協調行動を導く主観的効用を実数値GAにより獲得する研究が行われている．先行研究では交叉手法として一様交叉が用いられており，探索性能はあまり高くない．本研究では，交叉にブレンド交叉を適用することで多様な解を生成し，探索性能を向上した上での主観的効用の進化について観察する．

講演情報

[4O3-J-7] エージェント：学習するエージェント

[4O3-J-7-02] ブレンド交叉を用いたGAによる主観的効用の進化