[2Yin5-09] 歩行ロボットのためのカリキュラム強化学習における地形パラメータ化
キーワード:強化学習
強化学習によるロボット制御では,シミュレーション環境で方策を獲得し,それを現実環境に適用することが一般的になりつつある.シミュレーション環境と現実環境にはギャップがあるため,それを埋めるために,さまざまなシミュレーション環境で学習させておく方法が提案されている.本研究では,歩行ロボットのために,シミュレーション環境の地形形状を徐々に複雑にしていくカリキュラム強化学習を提案する.提案方法では,地形形状をイジングモデルで表現し,その相互作用パラメータを地形形状の複雑さの決定に用いる.イジングモデルの性質から,相互作用パラメータが大きいとき地形は平らになり,小さくしていくと凹凸が発生する.評価実験では,この地形パラメータ化によるカリキュラム強化学習の有効性を示している.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。