15:20 〜 15:40
[1Q4-GS-11-01] 商品整列タスクにおける複数のResidual Reinforcement Learningモデルの選択
キーワード:人工知能、ロボティクス、強化学習
本研究では人が行う巧みな動作をロボットに学習させ,小売店舗における商品整列動作を行う.人は初期環境が異なれば同じタスクであっても異なる戦略を使うことでより最適な動作を行うことができる.そこで我々はロボットが初期状態に応じた戦略を自律的に選択できるシステムを提案し,シミュレーション上の強化学習によって獲得した複数の整列動作モデルとそれらを使い分けるための判別器を作成した.このシステムを使用して整列タスクを実施した結果,1つの動作モデルのみを使用した場合よりも精度の高い整列を実現した.また,シミュレーション上で学習した動作モデルを使用し,実環境においても整列動作が可能であることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。