Consistency Modelsを用いた拡散モデルに基づいた ロボットの制御方策の高速化とスケーリング

オドンチメド ソドタウィラン

14:00 〜 14:20

[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいたロボットの制御方策の高速化とスケーリング

〇オドンチメドソドタウィラン¹、池田悠也¹、髙波亮介¹、松嶋達也¹、大島佑太¹、大久保拓哉¹、鍋田櫂²、松尾豊¹、岩澤有祐¹ (1. 東京大学、2. 筑波大学)

キーワード：拡散生成モデル、模倣学習

近年、ロボット工学と人工知能(AI)システムの進展では模倣学習を活用することが増え、従来困難だった複雑で非構造的な環境における自律システムの技術的課題に対する解決策を提供している。模倣学習では、マルチモーダルな入力、出力の多峰性、時系列性のデータを取り扱う必要があり、従来の教師あり学習より複雑な要素が含まれている。そこで、拡散生成モデルを活用したDiffusion Policyが注目されている。Diffusion Policyでは、従来の提案手法であるエネルギーベースモデルよりも高い精度に達することができた。しかし、Diffusion Policyは拡散生成モデルをベースにしているため、リアルタイムで動作すること課題点である。そして、精度向上のためにモデルサイズを大きくすると動作がもっと遅くなってしまう傾向がある。本研究では、このトレードオフを改善したConsistency Policyを提案する。シミュレーターと実機の物体操作のタスクで精度と速度を測定し、検証した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4O3-OS-16e] 世界モデルと知能

[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいたロボットの制御方策の高速化とスケーリング

パスワード

講演情報

[4O3-OS-16e] 世界モデルと知能

[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいた ロボットの制御方策の高速化とスケーリング

パスワード

[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいたロボットの制御方策の高速化とスケーリング