2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-41 世界モデルと知能

[1B4-OS-41b] 世界モデルと知能

2025年5月27日(火) 15:40 〜 17:20 B会場 (小ホール)

オーガナイザ:鈴木 雅大(東京大学),岩澤 有祐(東京大学),河野 慎(東京大学),熊谷 亘(オムロンサイニックエックス),松嶋 達也(東京大学),Paavo Parmas(東京大学),谷口 尚平(東京大学)

15:40 〜 16:00

[1B4-OS-41b-01] 物体中心表現を用いた Transformer ベースの世界モデルと因果関係を考慮する方策

〇西本 遥裕1、松原 崇2 (1. 大阪大学、2. 北海道大学)

キーワード:世界モデル、物体中心表現学習、強化学習

深層強化学習エージェントはサンプル効率が著しく低く,実世界への応用が難しい.この問題に対して,世界モデルで生成した"想像"の中で学習するモデルベース強化学習手法が数多く提案されており,一定の成功を収めている.しかし,複数の物体が存在し,それらが相互作用する環境において,強化学習エージェントが世界モデルを獲得することは,依然として困難である.本研究では,TISA+ を提案する.これは,世界モデル,方策関数,価値関数の全てが物体中心表現を扱う Transformer である強化学習エージェント Transformer-based Imagination with Slot Attention (TISA) に修正を加えた手法である.世界モデルは背景を除いた各物体の状態,行動,報酬を個別に処理し,高次元の予測を効果的に行い,組み合わせ爆発を防ぐ.
方策関数および価値関数は,物体の性質に基づきトークン間の因果関係を予測することで,物体の性質をより正確に捉えた意思決定を可能する.
Safety-GymベンチマークのタスクPointButton1において,TISA+ は既存手法の性能を上回った.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード