2023年度 人工知能学会全国大会(第37回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-27 強化学習の新展開

[2Q1-OS-27a] 強化学習の新展開

2023年6月7日(水) 09:00 〜 10:40 Q会場 (601)

オーガナイザ:太田 宏之、甲野 佑、高橋 達二

10:00 〜 10:40

[2Q1-OS-27a-04] (OS招待講演) 逐次意思決定における諸問題設定と問題に関する事前知識が性能保証に及ぼす影響について

〇小津野 将1、北村 俊徳2、市原 有生希3,4、萩原 誠5 (1. オムロン サイニックエックス株式会社、2. 東京大学、3. 奈良先端科学技術大学院大学、4. 株式会社 国際電気通信基礎技術研究所、5. (株)pluszero)

キーワード:逐次意思決定

近年、さまざまな逐次意思決定の問題設定が考えられ、それらに対するさまざまな性能保証が示されている。非定常MDPや制約付きMDPなどがその例となる。本論文では、諸設定に対する性能保証の最近の発展をまとめ、どういった事前知識(問題のパラメータ)が性能向上に有益となるかを説明する。そして最後に、現在未解決の問題と将来の逐次意思決定理論の方向に関し議論する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード