14:20 〜 14:40
[4O3-J-7-02] ブレンド交叉を用いたGAによる主観的効用の進化
キーワード:遺伝的アルゴリズム、マルチエージェントシステム、強化学習
客観的報酬に各エージェント効用導出関数を適用して得られる主観的効用を報酬として用いる 効用利用Q学習において, 囚人のジレンマゲームで協調行動を導く主観的効用を実数値GAにより獲得する研究が行われている. 先行研究では交叉手法として一様交叉が用いられており,探索性能はあまり高くない. 本研究では,交叉にブレンド交叉を 適用することで多様な解を生成し,探索性能を向上した上での主観的効用の進化について観察する.