UNREAL における補助タスクの適応的選択

板谷 英典

14:30 〜 14:50

[3E3-OS-12a-02] UNREAL における補助タスクの適応的選択

〇板谷英典¹、平川翼¹、山下隆義¹、藤吉弘亘¹ (1. 中部大学)

キーワード：強化学習

深層強化学習において，複雑な問題を解くことは状態空間が膨大であるため非常に困難である．深層強化学習法の一つであるUNspervised REinfrocsment learning and Auxiliary Learning (UNREAL) は異なる複数の補助タスクを学習時に導入することにより，ゲームタスクにおいて高いスコアを達成している．しかし，UNREALで用いられている全ての補助タスクは，あらゆる問題設定において必ずしも有効であるとは限らない．そのため，補助タスクの設計に環境に合うタスクを設計する必要があるが，問題に合わせて逐次設計することは多大な手間と時間を要する．本研究では，補助タスクを環境に合わせ適応的に選択するタスクAuxiliary Selectionを UNREALに導入することで，効率的に学習する手法を提案する．DeepMind Labを用いた実験により，効率的に学習できることを示す．

講演情報

[3E3-OS-12a] 画像とAI（MIRU2019プレビュー）(1)

[3E3-OS-12a-02] UNREAL における補助タスクの適応的選択