5:40 PM - 6:00 PM
[2O4-02] User constrained independent topic analysis
Simplification of constraint on separation link constraint
Keywords:Text mining, Independent component analysis, Topic extraction
本稿では、テキストマイニングの話題抽出を取り上げ、話題間の関係性に着目した話題抽出方法で独立性が高い話題が抽出可能な独立話題分析を扱う。独立話題分析は、独立成分分析を用いて文書データから互いに独立した話題を抽出する方法である.また、ユーザ制約付き独立話題分析は独立話題分析で抽出した話題に制約を加え、ユーザの求める話題を抽出する方法である。ユーザ制約付き独立話題分析は2個の話題を統合するMerge Link制約、1個の話題を2個に分離するSeparate Link制約の2つの制約が提案されており、話題を分離するSeparate Link制約に着目した。Separate Link制約付き独立話題分析は分離したい話題とその話題の重要単語の中から2個の分離単語を選択する必要があり、分離単語の選択においてユーザの負担が大きいという課題点がある。本稿ではSeparate Link制約を満たし、ユーザが分離したい話題を選択するだけで分離単語を選択せずに独立性高く話題を分離する手法を提案する。3つのベンチマークデータを用いて、提案手法で得られた話題の独立性の評価実験を行い,その有効性を示す結果を得た。