[4Xin2-19] Decision Transformerを用いたロボット制御におけるロバスト性検証
キーワード:強化学習、トランスフォーマー、ロバスト性、MUJOCO
ロボット制御におけるDecision Transformerのロバスト性を検証する.Decision Transformerは,Transformerを用いたオフライン強化学習モデルで,従来の強化学習と同等以上の性能を出すことが報告されている.本研究では,オフライン強化学習用の収集データに含まれていない故障現象に対して,3つのロボット(Half Cheetah,Hopper,Walker2D)を用いてDecision Transformerのロバスト性を評価する.ロバスト性評価では,3つのデータセット(Medium-Expert,Medium,Medium-Replay)に対して,アクチュエータが動作しない状況を模擬する.実験結果は,3つのデータセットのいずれの場合でも,すべてのロボットの報酬が低下する傾向が確認された.この結果は,Decision Transformerのロバスト化が必要であることを示している.
要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン