歩行ロボットのためのカリキュラム強化学習における地形パラメータ化

佐々木 汐; 岡本 航昇; 大里 虹平; 川本 一彦

[2Yin5-09] 歩行ロボットのためのカリキュラム強化学習における地形パラメータ化

〇佐々木汐¹、岡本航昇¹、大里虹平¹、川本一彦² (1.千葉大学大学院融合理工学府、2.千葉大学大学院工学研究院)

キーワード：強化学習

強化学習によるロボット制御では，シミュレーション環境で方策を獲得し，それを現実環境に適用することが一般的になりつつある．シミュレーション環境と現実環境にはギャップがあるため，それを埋めるために，さまざまなシミュレーション環境で学習させておく方法が提案されている．本研究では，歩行ロボットのために，シミュレーション環境の地形形状を徐々に複雑にしていくカリキュラム強化学習を提案する．提案方法では，地形形状をイジングモデルで表現し，その相互作用パラメータを地形形状の複雑さの決定に用いる．イジングモデルの性質から，相互作用パラメータが大きいとき地形は平らになり，小さくしていくと凹凸が発生する．評価実験では，この地形パラメータ化によるカリキュラム強化学習の有効性を示している．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2Yin5] インタラクティブ2

[2Yin5-09] 歩行ロボットのためのカリキュラム強化学習における地形パラメータ化

パスワード