14:40 〜 15:00
[1B3-OS-41a-04] 世界モデルを利用したプレイデータ拡張による実ロボット制御
キーワード:世界モデル、プレイデータ、ロボット学習
多様な環境下でさまざまなタスクを行うことができる,汎用ロボットの実現が期待されている.模倣学習や強化学習は有効な手法だが,汎化性能とデータ効率にトレードオフがあり,高い汎化性能を得るためには大量のデータが必要となる.そこで本研究では,プレイデータと呼ばれる,人間が好奇心を満たすようにロボットを操作し収集するデータを導入する.プレイデータは環境の様々な状態を含むため汎化性能の高いエキスパートデータとなる一方で,プレイデータ外のタスクの実行には追加のデータ収集が必要になる.この問題に対し,世界モデルを用いてアプローチする.具体的には,世界モデル内におけるプレイデータの拡張とその学習に基づく行動生成フレームワークを提案する.プレイデータをもとに行動生成学習を行うことで,多様な目標状態への行動生成を可能にする.また,世界モデル内でロボットが自律的にデータを収集することで,実世界で動作させる時間的・人的コストを抑える.シミュレーション環境・実ロボット環境における実験の結果,提案手法によって世界モデル内で新規のデータ収集が可能なこと,汎化性能・データ効率が向上することが示された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。