10:30 AM - 10:45 AM
△ [14a-B406-4] Decision making using chaotic semiconductor laser in bandit problem with variable hit probabilities
Keywords:laser chaos, decision making, bandit problem
近年、強化学習の研究が盛んに行われている。その一例としてバンディット問題が挙げられており、それを半導体レーザカオスで解く手法が報告されている。しかし、それは報酬確率が一定であり、非定常な報酬確率の場合における報告は少ない。そこで本研究では非定常な報酬確率のバンディット問題を半導体レーザカオスを用いて解くことを目的とする。記憶係数βとしきい値分解能bの変化を導入することで高い平均正答率を達成した。