18:30 〜 18:50
[2G6-OS-21f-04] 協働ロボットのためのプレイデータを用いたゴール条件付き自己教師あり学習
キーワード:深層学習、ロボット学習、協働ロボット、プレイデータ
人と同じ空間で助け合いながら作業を行う協働ロボットの実現が期待されている.その実現のためには,人とロボットの間で作業目標を共有することが重要であり,深層学習の利用は有効な手段の一つである.深層学習を用いたアプローチとして,強化学習は汎化性能が高いが,探索が必要なため効率が悪く,また探索段階での人とのインタラクションには物理的接触による危険が伴う.一方,模倣学習はデモンストレーションデータを用いるため効率が良いが汎化性能は低い.そこで本研究は,人間が好奇心に基づきロボットを操作して取得するプレイデータ注目し,その学習に適したフレームワークを提案する.具体的には,プレイデータの部分時系列全体から作業計画の潜在表現を推論するモデル,現在状態のみから到達可能な目標の潜在表現を推論するモデル,これらの潜在表現をもとに行動を生成するモデルを構築した.さらに,予測誤差最小化原理に基づき,人のふるまいから目標の潜在表現を修正可能な仕組みを導入した.実ロボットを直接教示することで得られたプレイデータを用いてこれらのモデルを学習させた結果,提案フレームワークの有用性が示された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。