14:30 〜 14:50
[3E3-OS-12a-02] UNREAL における補助タスクの適応的選択
キーワード:強化学習
深層強化学習において,複雑な問題を解くことは状態空間が膨大であるため非常に困難である. 深層強化学習法の一つであるUNspervised REinfrocsment learning and Auxiliary Learning (UNREAL) は異なる複数の補助タスクを学習時に導 入することにより,ゲームタスクにおいて高い スコアを達成している.しかし,UNREALで用いられている全ての補助タスクは,あらゆる問 題設定において必ずしも有効であるとは限らない.そのため,補助タスクの設計に環境に合うタスクを設計する必要があるが,問題に合わせて 逐次設計することは多大な手間と時間を要する.本研究では,補助タスクを環境に合わせ適応的に選択するタスクAuxiliary Selectionを UNREALに導入することで,効率的に学習する手法を提案する.DeepMind Labを用いた実験により,効率的に学習できることを示す.