15:40 〜 16:00
[4G4-GS-2m-01] 複雑な環境における階層再帰型状態空間モデルの学習
キーワード:深層学習、時系列の抽象化、状態空間モデル
本研究では, モデルベース強化学習において効率的な方策の学習に寄与すると考えられる観測の抽象化を行う階層再帰型状態空間モデルに着目する.家庭内で動作するロボットや, 公道を走るロボットの行動方策の学習を効率的に行うことを目指すためには, 既存の実験環境のような単色無地の物体のみ存在する低解像度の観測が得られる環境ではなく, 実環境のような複数の色と無地でない模様で構成されている物体が存在し, 高解像度の観測が得られる複雑な環境で観測の抽象化を試みる必要がある. 複雑な環境下における観測の抽象化には有用な情報を抽出するためのエンコーダーの工夫が必要と考える. 残差ネットワークを組み込んだモデル構造の工夫, 変分自己符号化器を用いた事前学習の工夫に着目し, 複雑な環境データセットにおいて階層再帰型状態空間モデルの学習を行う. 事前学習の工夫によって, 工夫なしで学習を行う場合に比べて観測の状態の抽象化, 文脈データを与えられた後の未来の遷移の予測の性能が向上したことを評価実験によって示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。