10:20 〜 10:40
[2C1-05] Word2Vecにおける出力側の重みに注目した文書分類手法の検討
キーワード:文書分類、Word2Vec、分散表現、アンサンブル学習、syn1neg
文書分類は,現代の情報化社会において重要な技術である. また,Word2vecを用いて単語の意味関係をベクトルへ埋め込む分散表現が近年注目を集めており,文書分類へ適用する手法も報告されている. 分散表現は一般的にWord2Vecと呼ばれるツールを用いて生成される.そして,Word2Vecはニューラルネットワークを用いた学習構造をしており,ネットワーク内の入力側の重みを分散表現として利用している.しかし,Word2Vecでは,分散表現とは別にネットワーク上で学習される出力側の重みが存在し,異なる性質を持っていると考えられるが一般的に利用されていない. そこで本稿では,分散表現と出力側の重みを利用したアンサンブル学習による文書分類手法を提案し,提案手法の有用性を示す.