13:40 〜 14:00
[1B3-OS-41a-01] 時間的階層性を持つ世界モデルを用いた深層能動的推論による実ロボット制御
キーワード:能動的推論、ロボット学習、世界モデル、時間的階層性、ベクトル量子化
深層学習ベースのロボット制御手法によって,人のように実環境で様々な目標を達成できることが期待されている.そのためには,目標指向の行動に加え,環境の不確実性を下げる探索指向の行動も可能なロボットの実現が課題となる.人の脳の計算原理に基づき,目標・探索指向の行動を説明可能な深層能動的推論によってこの課題の解決が期待されるが,計算量が多い・性能が環境のダイナミクスを学習する世界モデルの表現力に依存するという問題がある.本研究ではこれらの問題を解決するため,実ロボット制御のための新た な深層能動的推論フレームワークを提案する.このフレームワーク は環境のダイナミクスを学習する世界モデル,行動を抽象化する行動モデル,そして抽象的な行動表現と世界モデルの隠れ状態の関係を学習する抽象世界モデルで構成される.また,世界モデルに時間的階層性を導入することで,モデルの表現力を向上させるとともに計算量を低減する.不確実性のある実環境で複数の物体を操作するロボット実験を通して,提案手法によって従来手法と比較して計算量を削減しながら,様々な目標を達成し,環境の不確実性を下げる探索も可能であることが示された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。