17:50 〜 18:10
[2G6-OS-21f-02] 世界モデルを利用したプレイデータの学習に基づく実ロボット行動生成とデータ拡張
キーワード:プレイデータ、世界モデル、模倣学習、ロボット学習
ロボットが複雑な環境で人間のようにさまざまな作業を行うことが期待されているが,そのためには高い汎化性能が要求される.一般に,強化学習は汎化性能が高い一方で探索が必要なため効率が悪く,模倣学習は教示者のデモンストレーションを用いるため効率が良い一方で汎化性能が低い.そこで本研究は,プレイデータと呼ばれる,人間が好奇心に基づきロボットを操作して取得するデータに注目する.具体的には,世界モデルを利用したプレイデータの学習に基づく実ロボットの行動生成法と世界モデル内におけるプレイデータの拡張法を提案する.実環境におけるロボットの物体操作実験の結果,与えられた目標状態に到達するための行動生成が可能なことを確認した.さらに,世界モデル内でのシミュレーションによって,取得したプレイデータには存在しないバリエーションを含んだデータの拡張が可能なことを確認した.以上の結果から,拡張されたプレイデータをさらに学習することで,より汎化性能が高い行動生成の実現が期待される.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。