2021年第68回応用物理学会春季学術講演会

講演情報

一般セッション(口頭講演)

FS フォーカストセッション「AIエレクトロニクス」 » FS.1 フォーカストセッション「AIエレクトロニクス」

[19p-Z34-1~17] FS.1 フォーカストセッション「AIエレクトロニクス」

2021年3月19日(金) 13:30 〜 18:00 Z34 (Z34)

河口 研一(富士通研)、赤井 恵(北大)

17:30 〜 17:45

[19p-Z34-16] 生物種間競争原理を利用した MAB 型強化学習問題の最適解探索法

新山 友暁1、古畑 玄貴1、内田 淳史2、成瀬 誠3、砂田 哲1,4 (1.金沢大理工、2.埼玉大工、3.東京大情報理工、4.JSTさきがけ)

キーワード:強化学習、multi-armed bandit 問題、自然計算

異なる報酬期待値をもつ複数のスロットマシンから最大期待値をもつマシンを選び出す問題(MAB問題)に対して,体積保存則からヒントを得た新規手法を開発した。本手法はパラメーターが小さな時間連続極限において,生物種間競争ダイナミクスのモデル方程式 (Lotka-Volterra 方程式) に帰着する。本手法の最適解探索能力の背後にこのような自然現象のメカニズムがあることを述べ,その特徴などについて話す。