強化学習の諸公式の最大エントロピー強化学習への一般化

中口 悠輝

14:40 〜 15:00

[2C4-GS-2-05] 強化学習の諸公式の最大エントロピー強化学習への一般化

〇中口悠輝¹ (1. NEC)

キーワード：強化学習、最大エントロピー

近年、強化学習の研究が著しく進展し、複雑な意思決定や制御の問題において幅広く高い性能を示すようになった。とくに、エントロピー正則化項を導入することで一般化された定式化である最大エントロピー強化学習の様々な利点や性質が明らかになってきた。しかし、このエントロピー正則化項の導入のせいで既存の強化学習の公式を一般には最大エントロピー強化学習にそのまま適用できないことがアルゴリズムの新規開発や理論解析において支障となっている。そこで本稿では、まず最大エントロピー強化学習について整理したレビューを与えたのち、既存の強化学習における幾つかの公式を最大エントロピー強化学習へ一般化する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2C4-GS-2] 機械学習：強化学習（１）

[2C4-GS-2-05] 強化学習の諸公式の最大エントロピー強化学習への一般化

パスワード