大規模言語モデルを補助に用いた言語指示ロボット学習に関する分析

髙城 頌太

10:20 〜 10:40

[2O1-GS-8-05] 大規模言語モデルを補助に用いた言語指示ロボット学習に関する分析

〇髙城頌太¹、谷口尚平¹、中野聡大¹、岩澤有祐¹、鈴木雅大¹、熊谷亘¹、谷中瞳¹、松尾豊¹ (1. 東京大学)

キーワード：大規模言語モデル、強化学習、模倣学習、ロボットマニピュレーション

GPT-3やChatGPTに代表される大規模言語モデルは，様々なタスクで汎用的に高い性能を示し，自然言語処理のみならず様々な領域での応用が広がっている．本稿では，大規模言語モデルをロボット制御の模倣学習に活用し，その学習効率やサンプル効率の向上への寄与について検証を行う．実験では，RLBenchというベンチマークデータセットを用いて，提案手法の有効性を検証する．複数のタスクを学習する際に，大規模言語モデルへのプロンプティングを活用して，タスクを解く手順を説明するテキストを生成し，それをサブゴールとして用いることで，学習効率や汎化性の向上を図る．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2O1-GS-8] ロボットと実世界

[2O1-GS-8-05] 大規模言語モデルを補助に用いた言語指示ロボット学習に関する分析

パスワード