16:40 〜 17:00
[2J4-GS-8c-05] スキルに基づく探索方策による世界モデルの学習
キーワード:世界モデル、スキル学習
エージェントが得る観測が時間やエージェントの行動に従ってどのように発展するかを記述する世界モデルは,プランニングやサンプル効率の向上,未知のタスクへの高速な適応などの上で重要である.特に近年は機械学習・深層学習を中心としたデータの関係を学習する技術により,真のモデルが未知のような複雑な環境でもモデルを利用するアプローチに関する研究が進んでいる.しかし,世界に関する知識が未完成な中で世界モデルを構築するためのデータをどのように獲得すればよいのかについての議論はあまり行われていない.本研究では,スキルの概念を世界モデルの学習に組み合わせることの有効性について調査する.具体的には,まず世界を探索するようなスキルを教師なし+真の環境とのインタラクションなしで獲得した上で,学習されたスキルに基づいた探索方策により収集されたデータを利用する方法を提案した.評価には代表的な物理シミュレータであるMuJoCoを利用し,ランダムに探索する従来手法と比べてエキスパート起動をより正確に予測する世界モデルが獲得できることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。