13:40 〜 14:00
[A3L-D-03] Online Reinforcement Learning on Reservoir Based Actor-Critic Model with Gibbs’s Policy
キーワード:ESN, Actor-Critic algorithm, reinforcement learning, POMDP
要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン