2023年度 人工知能学会全国大会(第37回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-21 世界モデルと知能

[1G5-OS-21b] 世界モデルと知能

2023年6月6日(火) 17:00 〜 18:40 G会場 (大会議室 A4)

オーガナイザ:鈴木 雅大、岩澤 有祐、河野 慎、熊谷 亘、松嶋 達也、森 友亮、松尾 豊

17:20 〜 17:40

[1G5-OS-21b-02] 柔軟物体操作のためのプレイデータを用いたゴール条件付き自己教師あり学習

〇石井 慶吾1、平松 駿1、野村 優太1、村田 真悟1 (1. 慶應義塾大学)

キーワード:ロボット学習、深層学習、自己教師あり学習、柔軟物体操作、プレイデータ

生産現場や日常生活環境において、ケーブルや布等の柔軟物体を操作可能なロボットの実現が期待されている。柔軟物体は無数の形状を有することからその状態のモデリングが難しいため、データドリブンな深層学習の利用が有効なアプローチとして注目されている。その具体的な方法として強化学習や模倣学習があるが、それぞれ問題点がある。強化学習では、探索に用いるデータが多く必要であることから、データ収集の面で非効率である。一方、模倣学習では、一般にラベル付け(タスクの指定)が必要であるため、ロボットの可能な操作パターンを制限する。そこで本研究は、これらの柔軟物体操作におけるデータ収集コストとラベル付けに対処する新たなフレームワークを提案する。具体的には、人が好奇心のままにロボットを操作することで得られるプレイデータを収集し、そこから取り出された部分時系列を用いてゴール条件付き自己教師あり学習を行う。柔軟物体としてロープを用い、実ロボットを直接教示することで得られたプレイデータを用いて学習を行った結果、提案フレームワークの有用性が示された。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード