2019年度 人工知能学会全国大会(第33回)

講演情報

インタラクティブセッション

[3Rin2] インタラクティブセッション1

2019年6月6日(木) 10:30 〜 12:10 R会場 (1F 展示ホール 中央)

10:30 〜 12:10

[3Rin2-16] インタラクティヴなデータ・ヴィジュアライゼーション・ツールを用いたTwitterデータのクラスタ分析

〇和田 伸一郎1 (1. 立教大学大学院社会学研究科)

キーワード:word2vec、Twitterデータ分析、Embedding Projector、t-SNEアルゴリズム、Mecab-ipadic-NEologd

本研究では、2016年に行われた東京都知事選挙の選挙期間中に投稿されたTwitterデータを、Pythonを用いてクラスター分析した(2016年7月13日 - 8月1日、480万ツイート、1億7000万語)。クラスタ分析として、Pythonのライブラリであるgensimに実装されているword2vecアルゴリズムを用いて単語をベクトル化し、次に、次元圧縮アルゴリズムであるt-SNE(t-distributed Stochastic Neighbor Embedding)を用いてクラスタを三次元で可視化することを試みた。特に本研究では、クラスタリングにデータ・ヴィジュアライゼーション・ツールであるEmbedding Projectorを使用した。このツールを用いて、動的な学習プロセスを三次元空間で可視化し、インタラクティヴに三次元空間を動かしながら、クラスタを目視によって特定することを試みた。結果として、高い精度で複数のクラスタを特定することができた。 またこれによって、この都知事選挙でTwitterユーザーが何に興味を持ったのかを一定程度、明確にすることができた。