事前知識を活用したMemory Reinforcement Learningによる行動獲得

稲盛 有那

09:00 〜 10:40

[3Pin1-35] 事前知識を活用したMemory Reinforcement Learningによる行動獲得

〇稲盛有那¹、平川翼¹、山下隆義¹、藤吉弘亘¹、柏原良太²、稲葉正樹²、二反田直己² (1. 中部大学、2. 株式会社デンソー)

キーワード：強化学習、事前知識、replay buffer

深層強化学習による行動の獲得には大量の学習が必要であり，安定した行動を獲得することが難しい．そこで本研究では，深層強化学習において安定した行動を効率的に獲得するためのMemory Reinforcement Learningを提案する．提案手法では，事前に獲得した安定的な行動遷移をexperience replayのreplay bufferに保存した状態で学習を開始することで，学習の初期段階から安定した行動を選択し，効率的な学習を可能とする．自動運転車両の車線変更を行うシミュレータ環境を用いた実験にて，提案手法を用いることで安定した動作を効率的に学習可能であることを示す.

講演情報

[3Pin1] インタラクティブ(1)

[3Pin1-35] 事前知識を活用したMemory Reinforcement Learningによる行動獲得