15:20 〜 15:40
[2J4-GS-8c-01] Instruction Followingにおける構成的タスク表現の獲得
キーワード:強化学習
Instruction Followingは,人々が生活する空間でロボットを操作するための重要な課題の一つであり,近年様々な研究が行われているが,家事のような複雑なタスクを達成することは未だ困難である.一般に,タスクは複数のスキルによって構成されていると考えられるため,この構成性を表現できるタスク表現を得ることができれば,複雑なタスクも達成できることが期待できる.このようなタスク表現を得るために,近年埋め込みベクトル上で演算できるようにタスクを表現するCompositional Plan Vector (CPV)が提案され,CPVを用いることで多くのスキルが必要となるタスクに対しても汎化できることが示された.本研究では,CPVをInstruction Followingに適用するためにさらに発展させる.具体的には,タスク全体の表現から,過去の行動から予測した既に達成されたタスクの表現を引くことができるように学習することを提案する.現実に近いシュミレータ上での実験によって,提案手法を用いることでタスクの構成性を学習することができ,タスク達成率が向上することを示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。