2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[1I3-J-2] 機械学習: 強化学習の発展

2019年6月4日(火) 15:20 〜 16:20 I会場 (306+307 小会議室)

座長:幸島 匡宏(NTT) 評者:宮口 航平(日本IBM)

15:40 〜 16:00

[1I3-J-2-02] 汎化ゴールにおける連続動作型ロボットアームの深層強化学習手法の開発

〇木村 友彰2、渡部 雅也2、坂本 克好1、山口 浩一1、Malla Dinesh 3、曽我部 東馬1,3,4 (1. 電気通信大学先進理工学科、2. 電気通信大学 機械システムプログラム、3. 株式会社 グリッド、4. 電気通信大学 i-パワードエネルギーシステム研究センター)

キーワード:ロボットアーム、深層強化学習、連続動作型、汎化ゴール

多目的強化学習では、状態だけでなく入力に対しても目標をとるユニバーサルバリュー関数近似(UVFA)が使用されます。我々は7DOFロボットアームのエンドエフェクタをUVFAベースの多目的強化学習を使用して目標に到達させることによってタスクを設計した。一方、我々は目標の数を変更することによって同等のタスクを実行した。 UVFAを用いて目標到達可能度をマッピングすることで優れた予測能力を確認した。