JSAI2018

Presentation information

Oral presentation

General Session » [General Session] 3. Data Mining

[2O4] [General Session] 3. Data Mining

Wed. Jun 6, 2018 5:20 PM - 7:00 PM Room O (2F Kaimon)

座長:大知 正直(東京大学)

5:40 PM - 6:00 PM

[2O4-02] User constrained independent topic analysis

Simplification of constraint on separation link constraint

〇KENTA YAMAMOTO1, TAKAHIRO NISHIGAKI1, TAKASHI ONODA1 (1. AOYAMA GAKUIN UNIVERSITY)

Keywords:Text mining, Independent component analysis, Topic extraction

本稿では、テキストマイニングの話題抽出を取り上げ、話題間の関係性に着目した話題抽出方法で独立性が高い話題が抽出可能な独立話題分析を扱う。独立話題分析は、独立成分分析を用いて文書データから互いに独立した話題を抽出する方法である.また、ユーザ制約付き独立話題分析は独立話題分析で抽出した話題に制約を加え、ユーザの求める話題を抽出する方法である。ユーザ制約付き独立話題分析は2個の話題を統合するMerge Link制約、1個の話題を2個に分離するSeparate Link制約の2つの制約が提案されており、話題を分離するSeparate Link制約に着目した。Separate Link制約付き独立話題分析は分離したい話題とその話題の重要単語の中から2個の分離単語を選択する必要があり、分離単語の選択においてユーザの負担が大きいという課題点がある。本稿ではSeparate Link制約を満たし、ユーザが分離したい話題を選択するだけで分離単語を選択せずに独立性高く話題を分離する手法を提案する。3つのベンチマークデータを用いて、提案手法で得られた話題の独立性の評価実験を行い,その有効性を示す結果を得た。