10:20 〜 10:40
[2O1-GS-8-05] 大規模言語モデルを補助に用いた言語指示ロボット学習に関する分析
キーワード:大規模言語モデル、強化学習、模倣学習、ロボットマニピュレーション
GPT-3やChatGPTに代表される大規模言語モデルは,様々なタスクで汎用的に高い性能を示し,自然言語処理のみならず様々な領域での応用が広がっている.本稿では,大規模言語モデルをロボット制御の模倣学習に活用し,その学習効率やサンプル効率の向上への寄与について検証を行う.実験では,RLBenchというベンチマークデータセットを用いて,提案手法の有効性を検証する.複数のタスクを学習する際に,大規模言語モデルへのプロンプティングを活用して,タスクを解く手順を説明するテキストを生成し,それをサブゴールとして用いることで,学習効率や汎化性の向上を図る.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。