15:20 〜 15:40
[1I3-J-2-01] アルファゼロ型強化学習アルゴリズムを用いた最適制御手法の開発
キーワード:アルファゼロ、強化学習、最適制御
ディープラーニングと強化ラーニングは近年急速に発展しています。ゲームやロボット制御などの分野にディープラーニングを適用する多くの研究が大きな成功を収めています。本論文では、強化学習アルゴリズムであるAlphaZeroをゲームAIのためのこれまでにないレベルの多用途性を最適制御問題に適用する可能性を検証する。従来の制御メカニズムを使用することによって処理することが困難であると考えられているノイズの多い環境下で動作を制御するその能力についての洞察を得ることを目指している。