2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-2 機械学習

[1I3-J-2] 機械学習: 強化学習の発展

2019年6月4日(火) 15:20 〜 16:20 I会場 (306+307 小会議室)

座長:幸島 匡宏(NTT) 評者:宮口 航平(日本IBM)

15:20 〜 15:40

[1I3-J-2-01] アルファゼロ型強化学習アルゴリズムを用いた最適制御手法の開発

〇渡部 雅也1、楊 坤1、Dinesh Malla2、坂本 克好1、山口 浩一1、曽我部 東馬1,3 (1. 電気通信大学基盤理工学専攻、2. 株式会社 グリッド、3. 電気通信大学 i-パワードエネルギー・システム研究センター)

キーワード:アルファゼロ、強化学習、最適制御

ディープラーニングと強化ラーニングは近年急速に発展しています。ゲームやロボット制御などの分野にディープラーニングを適用する多くの研究が大きな成功を収めています。本論文では、強化学習アルゴリズムであるAlphaZeroをゲームAIのためのこれまでにないレベルの多用途性を最適制御問題に適用する可能性を検証する。従来の制御メカニズムを使用することによって処理することが困難であると考えられているノイズの多い環境下で動作を制御するその能力についての洞察を得ることを目指している。