14:40 〜 15:00
[1N1-05] 満足化基準値共有を用いた社会的強化学習
キーワード:社会学習、限定合理性、模倣
動物は自身の試行錯誤を通じてだけでなく、他の個体からも学んでいる。 また脊椎動物は、不確実下での模倣や成功個体の模倣のような学習戦略を巧みに行なっていることが知られている。 これらの戦略は、社会的強化学習に適用することができる。 我々は、探索と活用のための満足化原理を組み込んだモデルであるRS価値関数を利用し、限られた情報共有による社会的強化学習アルゴリズムを提案する。