2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 6.Webマイニング

[1E2] Webマイニング-情報推薦

2018年6月5日(火) 15:20 〜 17:00 E会場 (4F クィーン)

座長:池田 和史(KDDI綜合研究所)

15:20 〜 15:40

[1E2-01] 深層強化学習による推薦システム

〇川島 崇1、川本 峻頌1、積田 大介1、下山 翔1、宗政 一舟1、友松 祐太1、林 邦興2、高木 友博1 (1. 明治大学、2. DesignOne Japan)

キーワード:深層強化学習、推薦システム

近年,インターネット上でユーザに対して店舗の紹介を行うサービスが増えてきている.各サービスでは同時に,ユーザの嗜好に合った店舗を表示させる分析が幅広く行われてきている.推薦の分野ではユーザのクリック情報が十分に存在する時には協調フィルタリングが高い性能を誇る.一般的にユーザ×アイテムの行列を作成した際データスパースの問題が発生するので新規ユーザに対応することが難しい.また十分にデー タが得られなかった場合,バンディットアルゴリズムなどを応用しているケースが見られる.バンディットアルゴリズムは各アームを十分に試行してそれぞれから報酬を得ることで学習を進めていくためアイテム数が多くなった場合に全てを学習するのは実質的に不可能である.新たなユーザが出てきた時に十分にデータを集める必要性は協調フィルタリングと同様の問題がある.上記の問題を解決すべく本稿では強化学習の価値関数の更新に多層ニューラルネットを用いた深層強化学習による推薦システムの提案を行う.