2020年第67回応用物理学会春季学術講演会

講演情報

一般セッション(口頭講演)

3 光・フォトニクス » 3.10 光量子物理・技術

[14a-B406-1~6] 3.10 光量子物理・技術

2020年3月14日(土) 09:30 〜 11:15 B406 (2-406)

辻野 賢治(東京女子医大)、砂田 哲(金沢大)

10:30 〜 10:45

[14a-B406-4] 非定常な報酬確率のバンディット問題における半導体レーザカオスを用いた意思決定

小田 章裕1、巳鼻 孝朋1、菅野 円隆1、成瀬 誠2、内田 淳史1 (1.埼玉大、2.東京大)

キーワード:レーザカオス、意思決定、バンディット問題

近年、強化学習の研究が盛んに行われている。その一例としてバンディット問題が挙げられており、それを半導体レーザカオスで解く手法が報告されている。しかし、それは報酬確率が一定であり、非定常な報酬確率の場合における報告は少ない。そこで本研究では非定常な報酬確率のバンディット問題を半導体レーザカオスを用いて解くことを目的とする。記憶係数βとしきい値分解能bの変化を導入することで高い平均正答率を達成した。