2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[3K3-J-2] 機械学習: 基礎モデルの分析と検証

2019年6月6日(木) 13:50 〜 15:30 K会場 (201A 中会議室)

座長:鈴木 雅大(東京大学) 評者:小山 聡(北海道大学)

14:50 〜 15:10

[3K3-J-2-04] 大局基準値共有による社会的強化学習

〇其田 憲明1、神谷 匠2、高橋 達二1 (1. 東京電機大学、2. 東京電機大学大学院)

キーワード:強化学習、社会学習、満足化

人間は個人での試行錯誤的な学習だけではなく,他者の成功情報を受け取ることで学習をより促進させている.ここには他者の行動の模倣や結果の再現といった社会的な戦略が存在する.強化学習における他エージェントとの情報共有法としてはしばしば行動価値の共有が行われているが,状態や状態行動対ごとの情報共有が必要であり,現実には難しいことが多々ある.少なくとも人間や動物の社会的学習のモデルとしては現実性に欠ける.我々は人間の満足化原理を強化学習に反映した,Risk-sensitive Satisficingと大局基準変換法を用いた大局的な基準値の共有によって,より少量の情報共有による効率的な社会的学習が可能であることを示す.