2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-7 エージェント

[4O3-J-7] エージェント:学習するエージェント

2019年6月7日(金) 14:00 〜 15:20 O会場 (1F 展示ホール左奥)

座長:福田 直樹(静岡大学名) 評者:田和辻 可昌(早稲田大学)

14:00 〜 14:20

[4O3-J-7-01] 「待った」の概念を取り入れた効率的なオセロの学習

〇成田 穂1、木村 大毅2 (1. 東京大学、2. IBM Research AI)

キーワード:ゲームAI、モンテカルロ木探索、深層強化学習

AlphaZeroに代表されるようなモンテカルロ木探索と深層強化学習の組み合わせにより、素晴らしい高い性能が達成されているが、その計算コストは高く、また長い計算時間がかかるという問題点がある。本研究では、MCTSをベースとして、「失敗度」の概念を取り入れたアルゴリズムを提案する。失敗度は効率的な探索を可能にし、学習時間を削減する。これにより、エージェントは勝敗を分ける重要な局面を重点的に探索することが可能になる。我々の手法は最初の数イテレーションでAlphaZeroを超える性能を示した。