満足化基準値共有を用いた社会的強化学習

其田 憲明

14:40 〜 15:00

[1N1-05] 満足化基準値共有を用いた社会的強化学習

〇其田憲明¹、神谷匠²、甲野佑³、高橋達二¹ (1. 東京電機大学理工学部、2. 東京電機大学大学院、3. 株式会社ディー・エヌ・エー)

キーワード：社会学習、限定合理性、模倣

動物は自身の試行錯誤を通じてだけでなく、他の個体からも学んでいる。また脊椎動物は、不確実下での模倣や成功個体の模倣のような学習戦略を巧みに行なっていることが知られている。これらの戦略は、社会的強化学習に適用することができる。我々は、探索と活用のための満足化原理を組み込んだモデルであるRS価値関数を利用し、限られた情報共有による社会的強化学習アルゴリズムを提案する。

講演情報

[1N1] 機械学習-機械学習応用(1)

[1N1-05] 満足化基準値共有を用いた社会的強化学習