2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 2.機械学習

[1Z2] 機械学習-機械学習基礎(2)

2018年6月5日(火) 15:20 〜 17:00 Z会場 (3F 松・竹)

座長:竹内 孝(NTT)

16:00 〜 16:20

[1Z2-03] 分散表現を用いたトピック抽出における確率的変分推論法適用への取り組み

〇尾崎 花奈1、小林 一郎1 (1. お茶の水女子大学)

キーワード:トピックモデル、変分近似法、分散表現

LDAに基づいた確率的トピックモデルは、文書の中に潜在的に存在するトピックを抽出するのに広く用いられている.近年、多くのLDAの拡張モデルが提案されていて、中でもGaussiain LDA(G-LDA) が注目されている.G-LDAはトピックモデルと単語の分散表現を組み合わせたものであり、LDAにおける離散の単語分布を、単語の分散表現の空間上における多変量正規分布に置き換えたものである.これにより、トピックに単語の意味知識を反映させることが可能になる.本研究では、G-LDAにおける事後分布推定の方法に効率的な手法である Stochastic Variational Inference (SVI) を適用している.この手法は、大規模テキストに対して効率的なトピック推定を可能にし、逐次的な学習にも有効である。