15:20 〜 15:40
[1E2-01] 深層強化学習による推薦システム
キーワード:深層強化学習、推薦システム
近年,インターネット上でユーザに対して店舗の紹介を行うサービスが増えてきている.各サービスでは同時に,ユーザの嗜好に合った店舗を表示させる分析が幅広く行われてきている.推薦の分野ではユーザのクリック情報が十分に存在する時には協調フィルタリングが高い性能を誇る.一般的にユーザ×アイテムの行列を作成した際データスパースの問題が発生するので新規ユーザに対応することが難しい.また十分にデー タが得られなかった場合,バンディットアルゴリズムなどを応用しているケースが見られる.バンディットアルゴリズムは各アームを十分に試行してそれぞれから報酬を得ることで学習を進めていくためアイテム数が多くなった場合に全てを学習するのは実質的に不可能である.新たなユーザが出てきた時に十分にデータを集める必要性は協調フィルタリングと同様の問題がある.上記の問題を解決すべく本稿では強化学習の価値関数の更新に多層ニューラルネットを用いた深層強化学習による推薦システムの提案を行う.