The 68th JSAP Spring Meeting 2021

Presentation information

Oral presentation

FS Focused Session "AI Electronics" » FS.1 Focused Session "AI Electronics"

[19p-Z34-1~17] FS.1 Focused Session "AI Electronics"

Fri. Mar 19, 2021 1:30 PM - 6:00 PM Z34 (Z34)

Kenichi Kawaguchi(Fujitsu Lab.), Megumi Akai(北大)

5:30 PM - 5:45 PM

[19p-Z34-16] Identification of optimal solution in multi-armed bandit problems by interspecific competition dynamics

Tomoaki Niiyama1, Genki Furuhata1, Atsushi Uchida2, Makoto Naruse3, Satoshi Sunada1,4 (1.Kanazawa Univ., 2.Saitama Univ., 3.Univ. of Tokyo, 4.JST PREST)

Keywords:reinforcement learning, multi-armed bandit problem, natural computing

異なる報酬期待値をもつ複数のスロットマシンから最大期待値をもつマシンを選び出す問題(MAB問題)に対して,体積保存則からヒントを得た新規手法を開発した。本手法はパラメーターが小さな時間連続極限において,生物種間競争ダイナミクスのモデル方程式 (Lotka-Volterra 方程式) に帰着する。本手法の最適解探索能力の背後にこのような自然現象のメカニズムがあることを述べ,その特徴などについて話す。