15:40 〜 16:00
[1I3-J-2-02] 汎化ゴールにおける連続動作型ロボットアームの深層強化学習手法の開発
キーワード:ロボットアーム、深層強化学習、連続動作型、汎化ゴール
多目的強化学習では、状態だけでなく入力に対しても目標をとるユニバーサルバリュー関数近似(UVFA)が使用されます。我々は7DOFロボットアームのエンドエフェクタをUVFAベースの多目的強化学習を使用して目標に到達させることによってタスクを設計した。一方、我々は目標の数を変更することによって同等のタスクを実行した。 UVFAを用いて目標到達可能度をマッピングすることで優れた予測能力を確認した。