14:00 〜 14:20
[4O3-OS-16e-01] Consistency Modelsを用いた拡散モデルに基づいた ロボットの制御方策の高速化とスケーリング
キーワード:拡散生成モデル、模倣学習
近年、ロボット工学と人工知能(AI)システムの進展では模倣学習を活用することが増え、従来困難だった複雑で非構造的な 環境における自律システムの技術的課題に対する解決策を提供している。模倣学習では、マルチモーダルな入力、出力の多峰性、時系列性のデータを取り扱う必要があり、従来の教師あり学習より複雑な要素が含まれている。そこで、拡散生成モデルを活用したDiffusion Policyが注目されている。Diffusion Policyでは、従来の提案手法であるエネルギーベースモデルよりも高い精度に達することができた。しかし、Diffusion Policyは拡散生成モデルをベースにしているため、リアルタイムで動作すること課題点である。そして、精度向上のためにモデルサイズを大きくすると動作がもっと遅くなってしまう傾向がある。本研究では、このトレードオフを改善したConsistency Policyを提案する。シミュレーターと実機の物体操作のタスクで精度と速度を測定し、検証した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。