汎化ゴールにおける連続動作型ロボットアームの深層強化学習手法の開発

木村 友彰

15:40 〜 16:00

[1I3-J-2-02] 汎化ゴールにおける連続動作型ロボットアームの深層強化学習手法の開発

〇木村友彰²、渡部雅也²、坂本克好¹、山口浩一¹、Malla Dinesh ³、曽我部東馬^1,3,4 (1. 電気通信大学先進理工学科、2. 電気通信大学機械システムプログラム、3. 株式会社グリッド、4. 電気通信大学 i-パワードエネルギーシステム研究センター)

キーワード：ロボットアーム、深層強化学習、連続動作型、汎化ゴール

多目的強化学習では、状態だけでなく入力に対しても目標をとるユニバーサルバリュー関数近似（UVFA）が使用されます。我々は7DOFロボットアームのエンドエフェクタをUVFAベースの多目的強化学習を使用して目標に到達させることによってタスクを設計した。一方、我々は目標の数を変更することによって同等のタスクを実行した。 UVFAを用いて目標到達可能度をマッピングすることで優れた予測能力を確認した。

講演情報

[1I3-J-2] 機械学習: 強化学習の発展

[1I3-J-2-02] 汎化ゴールにおける連続動作型ロボットアームの深層強化学習手法の開発