2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

オーガナイズドセッション » [オーガナイズドセッション] OS-12 マイニングと知識創発

[3F1-OS-12a] マイニングと知識創発(1)

2018年6月7日(木) 13:50 〜 14:50 F会場 (4F ガレリア)

14:10 〜 14:30

[3F1-OS-12a-02] Word2Vecで表現された単語の意味の可視化に関する検討

〇森 祥恭1、高間 康史1 (1. 首都大学東京)

キーワード:自然言語処理、Word2Vec、情報可視化

本稿ではWord2Vecにより得られた単語の分散表現が持つ,単語の意味や単語間の関係を情報可視化手法を用いて分析することを目的とする.近年,単語の分散表現を学習する手法が注目を集めている.その中の一つであるWord2Vecは,国と首都の関係など,単語間の意味的な関係をベクトル演算により行える.しかし,生成された空間の解釈は高次元ベクトルであることや各次元の意味が自明でないため困難である.

本稿ではWordNetの単語カテゴリを利用し,同一カテゴリに属する単語ベクトルの分散を求め,またPCAによる可視化により,その意味的なまとまりを分析した結果を示す.さらに,各カテゴリの意味を表現する特有の次元についても分析した結果を示す.