18:30 〜 18:45
[9p-Z28-18] レーザーカオス時系列を用いたQ学習の提案と実証
キーワード:レーザーカオス, Q学習
Q学習とは各状態における各行動の適切な評価値を学習することである。本研究では、これを各状態にどの行動をとるべきかのバンディット問題と捉え、特徴的な時間構造を含んでいるレーザーカオス時系列を用いて解決する原理を提案した。この手法は、レーザーカオス時系列の代わりにレーザーカオス時系列の順序をランダムに入れ替えた時系列や、一様乱数列ないし正規乱数列を用いた場合より良い性能を示した。