2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-41 世界モデルと知能

[1B3-OS-41a] 世界モデルと知能

2025年5月27日(火) 13:40 〜 15:20 B会場 (小ホール)

オーガナイザ:鈴木 雅大(東京大学),岩澤 有祐(東京大学),河野 慎(東京大学),熊谷 亘(オムロンサイニックエックス),松嶋 達也(東京大学),Paavo Parmas(東京大学),谷口 尚平(東京大学)

14:20 〜 14:40

[1B3-OS-41a-03] 6D Multi-View NewtonianVAEによる世界モデルベースの6D姿勢推定と制御

〇寺島 舞1、前山 功伊1、ウリグエン エルフリ ペドロ ミゲル2、ジア ユアンユアン2、谷口 忠大2,1 (1. 立命館大学、2. 京都大学)

キーワード:6D制御、世界モデル、視覚フィードバック制御、マルチビュー画像情報

本研究では,NewtonianVAEを用いて,6D姿勢を表現した潜在空間を学習し,6D制御を行うための手法を提案する.NewtonianVAEは世界モデルの一種であり,観測情報から環境のダイナミクスを潜在空間として学習し,その上で推定した位置をもとに比例制御を行う.NewtonianVAEにより,外部の座標系ではなく,内部で構築した環境のダイナミクスに基づく位置推定が可能である.従来研究では,NewtonianVAEを用いた並進制御が行われてきたが,回転を含む6D制御は行われてこなかった.そこで,本研究では,回転ベクトルを用いて潜在空間を拡張する6D Multi-View NewtonianVAE (6D-MNVAE) を提案した.実験では,6D-MNVAEを用いることで,潜在空間上での6D姿勢を推定し,目標姿勢に向けて6D制御できるか検証した.実験結果より,6D-MNVAEを用いることで,7mm及び0.02rad以下の制御精度で6D制御を実現できることを示した.本手法は,特徴量設計やアノテーションが不要であり,RGB画像情報のみから6D制御を行うことができる.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード