2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-16 世界モデルと知能

[4O3-OS-16e] 世界モデルと知能

2024年5月31日(金) 14:00 〜 15:20 O会場 (音楽工房ホール)

オーガナイザ:鈴木 雅大(東京大学)、岩澤 有祐(東京大学)、河野 慎(東京大学)、熊谷 亘(東京大学)、松嶋 達也(東京大学)、森 友亮(株式会社スクウェア・エニックス)、松尾 豊(東京大学)

14:00 〜 14:20

[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいた ロボットの制御方策の高速化とスケーリング

〇オドンチメド ソドタウィラン1、池田 悠也1、髙波 亮介1、松嶋 達也1、大島 佑太1、大久保 拓哉1、鍋田 櫂2、松尾 豊1、岩澤 有祐1 (1. 東京大学、2. 筑波大学)

キーワード:拡散生成モデル、模倣学習

近年、ロボット工学と人工知能(AI)システムの進展では模倣学習を活用することが増え、従来困難だった複雑で非構造的な 環境における自律システムの技術的課題に対する解決策を提供している。模倣学習では、マルチモーダルな入力、出力の多峰性、時系列性のデータを取り扱う必要があり、従来の教師あり学習より複雑な要素が含まれている。そこで、拡散生成モデルを活用したDiffusion Policyが注目されている。Diffusion Policyでは、従来の提案手法であるエネルギーベースモデルよりも高い精度に達することができた。しかし、Diffusion Policyは拡散生成モデルをベースにしているため、リアルタイムで動作すること課題点である。そして、精度向上のためにモデルサイズを大きくすると動作がもっと遅くなってしまう傾向がある。本研究では、このトレードオフを改善したConsistency Policyを提案する。シミュレーターと実機の物体操作のタスクで精度と速度を測定し、検証した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード