JSAI2018

Presentation information

Oral presentation

General Session » [General Session] 6. Web Mining

[1E2] [General Session] 6. Web Mining

Tue. Jun 5, 2018 3:20 PM - 5:00 PM Room E (4F Queen)

座長:池田 和史(KDDI綜合研究所)

3:20 PM - 3:40 PM

[1E2-01] Deep Reinforcement Learning for Recommendation System

〇Takashi Kawashima1, Syunyo Kawamoto1, Daisuke Tsumita1, Syo Simoyama1, Isshu Munemasa1, Yuta Tomomatsu1, Kunioki Hayashi2, Tomohiro Takagi1 (1. Meiji University, 2. DesignOne Japan, Inc)

Keywords:Deep Reinforcement Learning, Recommendation System

近年,インターネット上でユーザに対して店舗の紹介を行うサービスが増えてきている.各サービスでは同時に,ユーザの嗜好に合った店舗を表示させる分析が幅広く行われてきている.推薦の分野ではユーザのクリック情報が十分に存在する時には協調フィルタリングが高い性能を誇る.一般的にユーザ×アイテムの行列を作成した際データスパースの問題が発生するので新規ユーザに対応することが難しい.また十分にデー タが得られなかった場合,バンディットアルゴリズムなどを応用しているケースが見られる.バンディットアルゴリズムは各アームを十分に試行してそれぞれから報酬を得ることで学習を進めていくためアイテム数が多くなった場合に全てを学習するのは実質的に不可能である.新たなユーザが出てきた時に十分にデータを集める必要性は協調フィルタリングと同様の問題がある.上記の問題を解決すべく本稿では強化学習の価値関数の更新に多層ニューラルネットを用いた深層強化学習による推薦システムの提案を行う.