2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-2 機械学習

[1B5-GS-2] 機械学習:要素技術と理論

2023年6月6日(火) 17:00 〜 18:40 B会場 (シビックホール B)

座長:松野 竜太(NEC) [現地]

18:20 〜 18:40

[1B5-GS-2-05] Hypervolume最大化Q学習

〇柴原 琢磨1,2、竹下 孔喜1 (1. (株)日立製作所、2. 慶應義塾大学)

キーワード:強化学習、多目的最適化、多目的強化学習

本研究ではPareto解集合が非凸集合である場合でも,各Pareto解に対応する複数の方策を学習することを可能とする多目的強化学習アルゴリズムを提案する.提案アルゴリズムでは,複数の目的関数の値をhypervolumeに変換し,WatkinsのQ-learningを適用してPareto解集合が形成するハイパーボリュームを増加させる方策を獲得することができる.また,再学習することなく,ユーザが望むPareto解に至る方策を実行することができる.本研究では古典的な表形式のアルゴリズムと,Deep Q-learningを用いて表現された2つのバリエーションを紹介する.多目的強化学習の代表的なベンチマーク環境であるDeep Sea Treasureを用いた実証評価により,Pareto解集合が非凸である設定において,提案アルゴリズムが全てのPareto解を導く方策を獲得できることを示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード