17:00 〜 17:20
[1B4-OS-41b-05] 物体中心表現を用いたモデルベース強化学習の頑健性評価
キーワード:世界モデル、物体中心学習、頑健性
モデルベース強化学習はサンプル効率の良いエージェント学習手法として期待されている一方,学習したタスク以外の分布外(OOD)タスクへの汎化性能が低いことが知られている.これまでの研究では大規模のデータで学習された事前学習モデルの表現(PVR)を用いることでOODへの汎化性能向上が試されてきたが,一から表現学習を行う場合と比較して汎化性能が上回らないことが確認されている.本研究では,OOD環境において高い汎化性能を示すことが知られている物体中心表現を活用することで,OODへの汎化性能向上につながるかどうかを検証する.PVRから物体中心表現を獲得し,モデルベース強化学習に用いることで,物体中心表現を使わない場合と比較して,汎化性能とサンプル効率性がどのくらい向上するかを検証する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。