[4Yin2-35] DQN推薦システムのための状態行動価値による埋め込み学習法
キーワード:推薦システム、強化学習、Deep Q-Network、埋め込み学習、教師あり学習
アイテムやユーザの埋め込み表現は,強化学習に基づいた推薦システム における重要な課題のひとつである.多くの先行研究では,埋め込み表 現を行列分解などにより事前学習し,方策の学習時には固定している. しかし,埋め込み表現の固定はユーザの嗜好の時間的変化を捉えられ ず,さらに事前学習はデータが集まり切ってない状態で行うことが難しい.本研究では,強化学習推薦システムの埋め込み表現を,状態行動価 値を教師あり信号の重みとし更新する手法を提案する.現実世界で収集されたデータセット用い,推薦精度と埋 め込み表現を評価する実験を行っている.実験結果より,事前学習なし でも他のベースラインと同程度の精度が出せること,ユーザやアイテム を空間内に広く分布させられる埋め込み表現の獲得を確認している.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。