(OS招待講演) 逐次意思決定における諸問題設定と問題に関する事前知識が性能保証に及ぼす影響について

小津野 将

10:00 〜 10:40

[2Q1-OS-27a-04] (OS招待講演) 逐次意思決定における諸問題設定と問題に関する事前知識が性能保証に及ぼす影響について

〇小津野将¹、北村俊徳²、市原有生希^3,4、萩原誠⁵ (1. オムロンサイニックエックス株式会社、2. 東京大学、3. 奈良先端科学技術大学院大学、4. 株式会社国際電気通信基礎技術研究所、5. (株)pluszero)

キーワード：逐次意思決定

近年、さまざまな逐次意思決定の問題設定が考えられ、それらに対するさまざまな性能保証が示されている。非定常MDPや制約付きMDPなどがその例となる。本論文では、諸設定に対する性能保証の最近の発展をまとめ、どういった事前知識（問題のパラメータ）が性能向上に有益となるかを説明する。そして最後に、現在未解決の問題と将来の逐次意思決定理論の方向に関し議論する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2Q1-OS-27a] 強化学習の新展開

[2Q1-OS-27a-04] (OS招待講演) 逐次意思決定における諸問題設定と問題に関する事前知識が性能保証に及ぼす影響について

パスワード