2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 9.自然言語処理・情報検索

[2C1] 自然言語処理-文書分析・文書要約

2018年6月6日(水) 09:00 〜 10:40 C会場 (4F オーキッド)

座長:宮西 大樹(国際電気通信基礎技術研究所)

10:20 〜 10:40

[2C1-05] Word2Vecにおける出力側の重みに注目した文書分類手法の検討

〇内田 脩斗1、吉川 大弘1、ジメネス フェリックス1、古橋 武1 (1. 名古屋大学)

キーワード:文書分類、Word2Vec、分散表現、アンサンブル学習、syn1neg

文書分類は,現代の情報化社会において重要な技術である. また,Word2vecを用いて単語の意味関係をベクトルへ埋め込む分散表現が近年注目を集めており,文書分類へ適用する手法も報告されている. 分散表現は一般的にWord2Vecと呼ばれるツールを用いて生成される.そして,Word2Vecはニューラルネットワークを用いた学習構造をしており,ネットワーク内の入力側の重みを分散表現として利用している.しかし,Word2Vecでは,分散表現とは別にネットワーク上で学習される出力側の重みが存在し,異なる性質を持っていると考えられるが一般的に利用されていない. そこで本稿では,分散表現と出力側の重みを利用したアンサンブル学習による文書分類手法を提案し,提案手法の有用性を示す.