09:00 〜 10:40
[3Pin1-35] 事前知識を活用したMemory Reinforcement Learningによる行動獲得
キーワード:強化学習、事前知識、replay buffer
深層強化学習による行動の獲得には大量の学習が必要であり,安定した行動を獲得することが難しい.そこで本研究では,深層強化学習において安定した行動を効率的に獲得するためのMemory Reinforcement Learningを提案する.提案手法では,事前に獲得した安定的な行動遷移をexperience replayのreplay bufferに保存した状態で学習を開始することで,学習の初期段階から安定した行動を選択し,効率的な学習を可能とする.自動運転車両の車線変更を行うシミュレータ環境を用いた実験にて,提案手法を用いることで安定した動作を効率的に学習可能であることを示す.